PHP Simple HTML DOM Parser入門

PHP Simple HTML DOME Parserとは

PHP Simple HTML DOM Parserは、jQueryチック(つまりcssセレクタチック)にインターネット上のHTMLファイルを解析するライブラリです。

これを使うことにより手軽にスクレイピングを行うことができます。

PHP Simple HTML DOME Parserのダウンロードとインストール

まずは、以下のURLからライブラリをダウンロードします。

2011年12月24日時点では(クリスマスイヴ!?)simplehtmldom_1_5.zip でした。

http://sourceforge.net/projects/simplehtmldom/

展開すると以下のようなファイルが現れます。
・app
・change_log.txt
・example
・manual
・simple_html_dom.php
・simplehtmldom_1_5.zip
・testcase

この中で必要なのは実は「simple_html_dom.php」だけなんです。

その他のファイルはサンプルなどですので、見ておくと参考になると思います。

この「simple_html_dom.php」をrequireして、simple html domの機能を使います。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>