PHPでHTMLをパースするで紹介したPHP Simple HTML DOM Parseで、UserAgentを偽装したくなったので、ちょこっとスクリプトを修正してみました。
simple_html_dom.php
function file_get_html() {
$dom = new simple_html_dom;
$args = func_get_args();
$context = stream_context_create(array('http' => array(
'method' => 'GET',
'header' => 'User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; .NET4.0E)',//ユーザエージェント
)));
$dom->load(call_user_func_array('file_get_contents', array($args['0'], false, $context)), true);
return $dom;
}
file_get_html() をまるっと置き換えればOK。
[...] 2011/02/21 追記 ユーザエージェントを偽装する方法を書きました。 [...]