天天躁日日躁狠狠躁AV麻豆-天天躁人人躁人人躁狂躁-天天澡夜夜澡人人澡-天天影视香色欲综合网-国产成人女人在线视频观看-国产成人女人视频在线观看

基于PHP的簡單采集數(shù)據(jù)入庫程序【續(xù)篇】

在上篇文章中,我們已經(jīng)采集新聞信息頁的列表數(shù)據(jù),接下來要做的操作就是從數(shù)據(jù)庫中讀取所需要采集的URL,進行頁面抓取就行

新建一個content表

不過需要注意的一點是,不能再采用采集URL這種id遞增的方法去采集,因為數(shù)據(jù)表中可能出現(xiàn)id斷續(xù),比如id=9,id=11,當采集到id=10的時候,URL是空白的,這樣可能會導致采集到了空字段。

這里用到的一個技巧是數(shù)據(jù)庫的查詢語句,在我們采集完第一條數(shù)據(jù)的時候,判斷數(shù)據(jù)庫里是否還有大于此id的id編號,若有,讀取一條,查詢信息重復上面的工作。

具體代碼如下:

<?php    include_once("conn.php");  $id=(int)$_GET['id'];  $sql="select * from list where id=$id";  $result=mysql_query($sql);  $row=mysql_fetch_array($result);//取得對應的url地址  $content=file_get_contents($row['url']);  $pattern="/<dd class=/"dataWrap/">(.*)<//dd>/iUs";  preg_match($pattern, $content,$info);//獲取內(nèi)容存放info  echo $title=$row[1]."<br/>";  echo $content=$info[0]."<hr/>";  //插入數(shù)據(jù)庫  $add="insert into content(title,content) value('$title','$content')";  mysql_query($add);  $sql2="select * from list where id>$id order by id asc limit 1";  $result2=mysql_query($sql2);  $row2=mysql_fetch_array($result2);//取得對應的url地址  if($row2['id']){    echo "<script>window.location='content.php?id=$row2[0]'</script>";  }?>

這樣子我們所要的新聞內(nèi)容就采集入庫了,接下來只需要對數(shù)據(jù)的一些樣式進行整理就行了。

php技術(shù)基于PHP的簡單采集數(shù)據(jù)入庫程序【續(xù)篇】,轉(zhuǎn)載需保留來源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 无敌在线视频观看免费 | YY600800新视觉理论私人 | 欧美午夜精品久久久久久浪潮 | 好男人免费观看在线高清WWW | 成人短片迅雷下载 | 秋霞电影网午夜免费鲁丝片 | 亚洲AV 中文字幕 国产 欧美 | 亲伦在线观看 | 亚洲三级精品 | 日韩中文网 | 一级片mp4 | 激情床戏揉胸吃胸视频 | 艳照门在线观看 | 亚洲欧洲日本天天堂在线观看 | 尿了么app | 亚洲 欧美 国产 综合 在线 | 大香网伊人久久综合网2020 | 成年色黄APP下载 | 好紧好湿太硬了我太爽了文字 | 久久伊人网站 | 影888午夜理论不卡 樱桃熟了A级毛片 | 亚洲国产精品无码中文在线 | 九九热这里有精品 | 冈本视频黄页正版 | 久久99精国产一区二区三区四区 | 很黄很色60分钟在线观看 | 国产色情短视频在线网站 | 国产成人一区二区三中文 | 久久久擼擼擼麻豆 | 久久91精品国产91久 | 老师的蕾丝小内内湿透了 | 男人的天堂色偷偷 | 18禁国产精品久久久久久麻豆 | 免费视频国产在线观看网站 | 国产午夜亚洲精品一区 | 日日夜夜撸 在线影院 | 亚洲国产在线99视频 | 少妇久久久久久被弄高潮 | 久久人妻少妇嫩草AV蜜桃35I | 亚洲欧美一区二区三区蜜芽 | 草莓视频在线播放视频 |