htmlSQL サンプル(1) – 基本的な使い方 -

$wsql->query(‘SELECT * FROM a WHERE $class == “nav_item”‘);

connect('url', 'http://example.com/sample.html')){
        print 'Error while connecting: ' . $wsql->error;
        exit;
    }

    if (!$wsql->query('SELECT * FROM div WHERE $class == "hsql"')){
        print "Query error: " . $wsql->error;
        exit;
    }

    foreach($wsql->fetch_array() as $row){
        print_r($row);
    }

?>

1. $wsql = new htmlsql();
で、htmlsqlクラスのオブジェクトを作成し、$wsqlに代入。

2. $wsql->connect(‘url’, ‘http://example.com/sample.html’);
で、第二引数をURLとしてアクセスします。

3. $wsql->query(‘SELECT * FROM div WHERE $class == “hsql”‘);
で、2.で得たURLのページに対しqueryの第一引数で指定したSQL文を実行します。

4. for($wsql->fetch_array() as $row)
で、3.で得たSQLクエリの結果を取り出していきます。

以上です。
簡単ですね。

htmlSQLの基本

htmlSQLとはSQL文でwebページのスクレイピンをじっするるためのPHPライブラリです。
これによりSQLの知識を持っている人はスクレイピン具がわかりやすく簡単になります。

htmlSQLは、snoopyライブラリを使用してWEB上のデータを持ってきてhtmlSQLライブラリ
変換して通信していると思われます。
なので、WEB上のデータにアクセスするところはたぶんsnoopyライブラリの役割です。

下記ページからhtmlSQLに必要なライブラリをダウンロードします。

http://www.jonasjohn.de/lab/htmlsql.htm

snoopyとは

http://snoopy.sourceforge.net/

展開すると以下のようになります。
examples/ ・・・・ 例が盛りだくさん
snoopy_data/ ・・・・ snoopy用のデータ
htmlsql.class.php ・・・・ htmlsqlライブラリ
readme.txt ・・・・ READMEファイル
readme_german.txt ・・・・ READMEファイル(ドイツ語)
snoopy.class.php ・・・・ snoopyライブラリ

基本的には、snoopy.class.php と htmlsql.class.php をインクルードして、
「new htmlsql();」でhtmlsqlクラスのオブジェクトを作成し、このオブジェクトを
使って処理していくという流れになります。

htmlSQL入門 - インストールと使用方法 -

htmlSQLです。

htmlSQLはウェブページの解析をSQL風に行うことができるライブラリです。

ライブラリは以下から入手できます。
http://www.jonasjohn.de/lab/htmlsql.htm

2012年1月時点では「htmlsql-0.5v.zip」というファイルでした。

このファイルを解凍するといくつかファイルが出てきますが、必要となるのは以下の二つになります。
・snoopy.class.php
・htmlsql-v0.5.zip

htmlSQLを行う場合はこの二つをインクルードして使用します。