天天躁日日躁狠狠躁AV麻豆-天天躁人人躁人人躁狂躁-天天澡夜夜澡人人澡-天天影视香色欲综合网-国产成人女人在线视频观看-国产成人女人视频在线观看

深入php數(shù)據(jù)采集的詳解

這里介紹兩個php采集能用到的好工具。一個是Snoopy,一個是simple_html_dom。采集還有很多方式(其實本質(zhì)就2-3種,其他的都是衍生的),php自帶了幾個方法也能直接進(jìn)行采集。但是,出于把懶惰進(jìn)行到底的精神。我們還是可以通過這兩個工具,讓采集變得更簡單。

網(wǎng)上有不少介紹Snoopy的,下面是別人翻譯的Snoopy的SDK
//////////////////////////////////////////////////////////////
Snoopy是一個php類,用來模擬瀏覽器的功能,可以獲取網(wǎng)頁內(nèi)容,發(fā)送表單。
Snoopy的一些特點:
1抓取網(wǎng)頁的內(nèi)容 fetch
2抓取網(wǎng)頁的文本內(nèi)容 (去除HTML標(biāo)簽) fetchtext
3抓取網(wǎng)頁的鏈接,表單 fetchlinks fetchform
4支持代理主機
5支持基本的用戶名/密碼驗證
6支持設(shè)置 user_agent, referer(來路), cookies 和 header content(頭文件)
7支持瀏覽器重定向,并能控制重定向深度
8能把網(wǎng)頁中的鏈接擴展成高質(zhì)量的url(默認(rèn))
9提交數(shù)據(jù)并且獲取返回值
10支持跟蹤HTML框架
11支持重定向的時候傳遞cookies
要求php4以上就可以了 由于本身是php一個類 無需擴支持 服務(wù)器不支持curl時候的最好選擇,
類方法:
fetch($URI)
――― 主站蜘蛛池模板: 亚洲宅男天堂a在线 | 欧美性爱 先锋影音 | 久久777国产线看观看精品卜 | 97蜜桃网123.com| 国产精品…在线观看 | 久久久午夜精品福利内容 | 国产极品白嫩超清在线观看 | 美女靠逼漫画 | 4399亚洲AV无码V无码网站 | 午夜福利影院私人爽爽 | 欧美精品九九99久久在免费线 | 黑色丝袜美腿美女被躁翻了 | 真实的强视频免费网站 | 亚洲男同tv | 国产成人精视频在线观看免费 | 日本无码毛片久久久九色综合 | 国产手机在线视频 | 在线免费观看国产视频 | 伦理片天堂eeuss影院2o12 | 无码人妻丰满熟妇区五十路久久 | 少妇伦子伦精品无码 | 99久久久国产精品免费蜜臀 | 上原结衣快播 | 搞基福利社 | 91传媒蜜桃香蕉在线观看 | 2021国产精品国产精华 | 果冻传媒9CM在线观看 | 亚洲欲色欲色XXXXX在线AV | 国产精品自在在线午夜精品 | 草莓湿漉漉是好事还是恶性 | 偷拍亚洲制服另类无码专区 | 久久久无码AV精品亚洲A片软件 | 狠狠狠色丁香婷婷综合久久 | 中文亚洲大香伊蕉不卡一区 | 亚洲一品AV片观看五月色婷婷 | 欧美末成年videos在线 | 幸福草电视剧演员表介绍 | 性色AV乱码一区二区三区视频 | 青青草原国产在线 | 国产免费午夜高清 | 国产精品无码视频一区二区 |