スクレイピング入門

PHP

htmlSQL サンプル(2) – href as url

$wsql->query('SELECThrefasurl,textFROMa'))"href"に設定された値を"url"という名前として取り出す1.$wsql=newhtmlsql();で、htmlsqlクラスのオブジェクトを作成し、$w...
PHP

htmlSQL サンプル(1) – 基本的な使い方 –

$wsql->query('SELECT*FROMaWHERE$class=="nav_item"');1.$wsql=newhtmlsql();で、htmlsqlクラスのオブジェクトを作成し、$wsqlに代入。2.$wsql->conne...
PHP

htmlSQLの基本

htmlSQLとはSQL文でwebページのスクレイピンをじっするるためのPHPライブラリです。これによりSQLの知識を持っている人はスクレイピン具がわかりやすく簡単になります。htmlSQLは、snoopyライブラリを使用してWEB上のデー...
PHP

htmlSQL入門 - インストールと使用方法 –

htmlSQLです。htmlSQLはウェブページの解析をSQL風に行うことができるライブラリです。ライブラリは以下から入手できます。2012年1月時点では「htmlsql-0.5v.zip」というファイルでした。このファイルを解凍するといく...
PHP

PHPによるスクレイピング入門

スクレイピングとは、インターネットに公開されているHTML情報を解析して、自分のサイトの情報にしようするっていものです。スクレイピングで有名なのはたぶん以下の二つです。1.htmlSQL2.PHPSimpleHTMLDOMParser以降h...