PHPでHTMLをパースするで紹介したPHP Simple HTML DOM Parseで、UserAgentを偽装したくなったので、ちょこっとスクリプトを修正してみました。
simple_html_dom.php
function file_get_html() { $dom = new simple_html_dom; $args = func_get_args(); $context = stream_context_create(array('http' => array( 'method' => 'GET', 'header' => 'User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; .NET4.0E)',//ユーザエージェント ))); $dom->load(call_user_func_array('file_get_contents', array($args['0'], false, $context)), true); return $dom; }
file_get_html() をまるっと置き換えればOK。
[...] 2011/02/21 追記 ユーザエージェントを偽装する方法を書きました。 [...]