PHP htmlSQL サンプル(11) – user_agentとrefererの設定 – $wsql->set_user_agent('MyAgentName/0.9');$wsql->set_referer('user_agentや、refererを任意に設定できる1.$wsql=newhtmlsql();で、htmlsqlク... 2012.04.07 PHPスクレイピング入門
PHP htmlSQL サンプル(10) – 特定の範囲を対象とする – 特定の範囲を対象とする$wsql->isolate_content('<h1>Newsnippets</h1>','<pid="rss">');"<h1>Newsnippets</h1>"と"<pid="rss">"の間を対象とする。");... 2012.04.02 PHPスクレイピング入門
PHP htmlSQL サンプル(9) – XMLファイルも対象にできる – $wsql->connect('file','demo_xml.xml')XMLファイルも対象にできる。1.$wsql=newhtmlsql();で、htmlsqlクラスのオブジェクトを作成し、$wsqlに代入。2.$wsql->conne... 2012.03.31 PHPスクレイピング入門
PHP htmlSQL サンプル(8) – 対象範囲の限定 – 対象範囲を選択しちゃう$wsql->select('body');");}?>1.$wsql=newhtmlsql();で、htmlsqlクラスのオブジェクトを作成し、$wsqlに代入。2.$wsql->connect('url','{で、... 2012.03.29 PHPスクレイピング入門
PHP htmlSQL サンプル(7) – 配列構造の変換 – RSSとXMLファイルを扱う場合。さらに、配列の構造を変更しアクセスしやすくする-----サンプルスクリプト----1.$wsql=newhtmlsql();で、htmlsqlクラスのオブジェクトを作成し、$wsqlに代入。2.$wsql-... 2012.03.27 PHPスクレイピング入門
PHP htmlSQL サンプル(6) – preg_match()の使用 複雑なクエリーの例$wsql->query('SELECT*FROMaWHEREpreg_match("/^/snippets/i",$href)andpreg_match("/^array_/i",$text)')検索条件にpreg_ma... 2012.03.25 PHPスクレイピング入門
PHP htmlSQL サンプル(5) – 文字列の解析 – 文字列への接続web上のページ(URL)やローカルのファイル以外に、文字列にもアクセスできます。$wsql->connect('string',$html_string)$wsql->query('SELECT*FROMa')");}?>0... 2012.03.22 PHPスクレイピング入門
PHP htmlSQL サンプル(4) – substr()の使用 – 条件にsubstr()関数を使用する場合。$wsql->query('SELECT*FROMaWHEREsubstr($href,0,1)!="/"')1.$wsql=newhtmlsql();で、htmlsqlクラスのオブジェクトを作成し... 2012.03.19 PHPスクレイピング入門
PHP htmlSQL サンプル(3) – preg_matchで絞込み – SQLクエリにpreg_match()関数を使用し正規表現で検索を行う。$wsql->query('SELECT*FROMaWHEREpreg_match("/^",$href)')1.$wsql=newhtmlsql();で、htmlsq... 2012.03.16 PHPスクレイピング入門
PHP htmlSQL サンプル(2) – href as url $wsql->query('SELECThrefasurl,textFROMa'))"href"に設定された値を"url"という名前として取り出す1.$wsql=newhtmlsql();で、htmlsqlクラスのオブジェクトを作成し、$w... 2012.03.13 PHPスクレイピング入門
PHP htmlSQL サンプル(1) – 基本的な使い方 – $wsql->query('SELECT*FROMaWHERE$class=="nav_item"');1.$wsql=newhtmlsql();で、htmlsqlクラスのオブジェクトを作成し、$wsqlに代入。2.$wsql->conne... 2012.03.10 PHPスクレイピング入門
PHP htmlSQLの基本 htmlSQLとはSQL文でwebページのスクレイピンをじっするるためのPHPライブラリです。これによりSQLの知識を持っている人はスクレイピン具がわかりやすく簡単になります。htmlSQLは、snoopyライブラリを使用してWEB上のデー... 2012.03.04 PHPスクレイピング入門
PHP htmlSQL入門 - インストールと使用方法 – htmlSQLです。htmlSQLはウェブページの解析をSQL風に行うことができるライブラリです。ライブラリは以下から入手できます。2012年1月時点では「htmlsql-0.5v.zip」というファイルでした。このファイルを解凍するといく... 2012.03.04 PHPスクレイピング入門