PHP Simple HTML DOME Parserとは
PHP Simple HTML DOM Parserは、jQueryチック(つまりcssセレクタチック)にインターネット上のHTMLファイルを解析するライブラリです。
これを使うことにより手軽にスクレイピングを行うことができます。
PHP Simple HTML DOME Parserのダウンロードとインストール
まずは、以下のURLからライブラリをダウンロードします。
2011年12月24日時点では(クリスマスイヴ!?)simplehtmldom_1_5.zip でした。
PHP Simple HTML DOM Parser
DownloadPHPSimpleHTMLDOMParserforfree.AphpbasedDOMparser.AsimplePHPHTMLDOMparserwritteninPHP5+,supportsinvalidHTML,andprovidesaveryeasywaytofind,extractandmodif...
展開すると以下のようなファイルが現れます。
・app
・change_log.txt
・example
・manual
・simple_html_dom.php
・simplehtmldom_1_5.zip
・testcase
この中で必要なのは実は「simple_html_dom.php」だけなんです。
その他のファイルはサンプルなどですので、見ておくと参考になると思います。
この「simple_html_dom.php」をrequireして、simple html domの機能を使います。/