如何用 php 抓取微信文章正文

2025-01-04 03:48:37
推荐回答(2个)
回答1:

这种问题,放弃用正则吧,要真正完备的你可能得写一篇文章那样长。但 html 已经是结构化的了,找个 html 解析库就行了,我刚用 firebug 粗略的看了

回答2:

很多人也有和你同样的想法,可以使用curl或file_get_contents。

在这里以curl为例

1、首先获得整个url对应的内容

$ch=curl_init();
    curl_setopt($ch,CURLOPT_URL,$url);
    curl_setopt($ch,CURLOPT_HEADER,0);
    curl_setopt($ch,CURLOPT_TIMEOUT,5);
    curl_setopt($ch,CURLOPT_NOBODY,0);
    curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
    curl_setopt($ch,CURLOPT_USERAGENT, 'Sogouspider');
    curl_setopt($ch,CURLOPT_USERAGENT,'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.47 Safari/536.11');
    $html=curl_exec($ch);
    curl_close($ch);

2、从获$html里面提取正文内容

$mark='';
$content=substr($html,strpos($html,$mark)+strlen($mark));
$content=trim(substr($content,0,strpos($content,'')-50));

很简单吧,且听风吟福利吧(3tii.com)就是这样抓取微信文章内容的。但是现在微信的图片外部是不能引用的了,所以你还要解决图片显示的问题。