天天躁日日躁狠狠躁AV麻豆-天天躁人人躁人人躁狂躁-天天澡夜夜澡人人澡-天天影视香色欲综合网-国产成人女人在线视频观看-国产成人女人视频在线观看

PHP HTML代碼串 截取實(shí)現(xiàn)代碼

而且給的數(shù)據(jù)是HTML代碼串,比如這樣:

<div class=”aaa”><a href=”/aaa.php?id=1″>張三</a>  評論了 <a href=”/aaa.php?id=444″>李四</a> 分享的 <a href=”bbb.html”>一篇文章文章一長串的東西</a></div>

截取的時(shí)候是要截取 div 標(biāo)簽內(nèi)部的東西,而且要保留HTML標(biāo)簽,只是對其中的文字做處理。比如我可能只是截取到“李四”的“李”字,但是如果就這樣放到前端的話,“李四”前面的 a 標(biāo)簽是沒有閉合的,所以截取之后要保證HTML的語法正確。

這個(gè)問題確實(shí)不太好搞,讓我郁悶了兩天。請注意,這只是一個(gè)字符串,只不過內(nèi)容是HTML代碼,是沒有什么DOM的。如果是在前端處理就好辦了,直接DOM獲取,然后對里面的節(jié)點(diǎn)進(jìn)行處理,最后把innerHTML 之類的東西輸出就搞定了。現(xiàn)在可不行了,得換個(gè)思路。同事的思路是這樣的:

遍歷字符串的每一個(gè)字符。設(shè)置一個(gè)標(biāo)記,碰到標(biāo)簽開始的標(biāo)記< 就置為1,接下來的字符都不記數(shù),然后碰到>之后再開始計(jì)數(shù)。對標(biāo)簽內(nèi)部的字符串處理的時(shí)候,還要先判斷當(dāng)前字符的編碼是不是可能是中文,一般來說php中 UTF-8 編碼的中文字符的長度都是3,所以如果碰到是中文字符編碼,就要跳過兩個(gè)不記數(shù)……說到這里我自己頭已經(jīng)開始大了。個(gè)人認(rèn)為這種方法很不爽,首先這種精致的邏輯不太容易控制,而且 UFT-8 編碼下中文產(chǎn)生的長度有可能是3個(gè)或4個(gè) 所以代碼的嚴(yán)密性值得懷疑。

我個(gè)人的思路是,用 Tidy 來搞(具體用法請看php手冊吧)。昨天研究了一下那個(gè) Tidy ,發(fā)現(xiàn)這個(gè)東西還是挺好用的。首先,把這個(gè)字符串轉(zhuǎn)換成 Tidy 對象,這樣:

$tidy = tidy_parse_string($str, array(), ‘utf8′);  // 最后一個(gè)是設(shè)置編碼的,注意,這里是utf8 ,不是utf-8,沒有中間那個(gè)連線。

然后獲取$tidy中的 body(因?yàn)檗D(zhuǎn)換之后$tidy會(huì)自動(dòng)加上<head><body>等標(biāo)簽):

$body =  tidy_get_body($tidy);

這個(gè)時(shí)候你可以用 var_dump 看一些 $body 的結(jié)構(gòu),會(huì)發(fā)現(xiàn)它把每個(gè)標(biāo)簽都變成了一個(gè)對應(yīng)的對象,里面有相應(yīng)的屬性。舉例來說,比如 <a href=”#”>sdf</a> ,這么一條語句對應(yīng)的一些屬性有:

name=>”a”
value => “<a href=”#”>sdf</a>”
child=> array{[0]=>一個(gè)文本節(jié)點(diǎn)對象,value是 sdf}
attribute=array{”href”=>”#”}
…..其他屬性

可以看到,我們其實(shí)是可以單獨(dú)去處理 a 標(biāo)簽對應(yīng)節(jié)點(diǎn)下面的文字節(jié)點(diǎn)的值的,那樣就不會(huì)破壞任何HTML完整性。原來我以為改變 a 標(biāo)簽中文字節(jié)點(diǎn)的值之后, a 標(biāo)簽的value也會(huì)跟著改變,那樣我直接返回a標(biāo)簽對應(yīng)節(jié)點(diǎn)的value就OK了,沒想到不是那個(gè)樣子,哎,所以處理過其中的文字之后還是要自己拼出新的HTML。

知道了Tidy對象的結(jié)構(gòu)之后,一切就好辦了,只要遍歷所有的節(jié)點(diǎn),對于本需求來說,就是找到那個(gè) div 標(biāo)簽,然后開始處理里面的節(jié)點(diǎn)。代碼如下:

if(mb_strwidth($subchild->value, ‘utf-8′) >= $len)
{
$subchild->value = mb_strimwidth($subchild->value, 0, $len, ‘…', ‘utf-8′);
$trimed_str .= $subchild->value;
break;
}
else
{
$trimed_str .= $subchild->value;
$len = $len - mb_strwidth($subchild->value, ‘utf-8′);
}

里面的$subchild 就是一個(gè)子節(jié)點(diǎn)。注意,這里使用了 mb_strwidth 來獲取字符串長度。嚴(yán)重推薦一下這個(gè) mb_strwidth,很好用,它會(huì)把中文當(dāng)作兩個(gè)字符長度處理,正好符合這里的需求!而且截取字符串的時(shí)候用到了 mb_strimwidth,這個(gè)函數(shù)也會(huì)把中文當(dāng)作兩個(gè)字符長度處理,mb_ 開頭的函數(shù)真是好用啊。

具體代碼我就不寫出來了,因?yàn)槭轻槍σ粋€(gè)需求寫的,沒做成通用的形式。哪天我有時(shí)間做成通用的再發(fā)布一下。

另外,可惜FireFox不支持 text-overflow 屬性,不然也不用后臺(tái)那么辛苦地去截?cái)嗔恕H绻蠹矣懈玫姆椒ǎ瑲g迎提出!不勝感激。

php技術(shù)PHP HTML代碼串 截取實(shí)現(xiàn)代碼,轉(zhuǎn)載需保留來源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 麻豆成人久久精品二区三区网站 | 俄罗斯人与动ZOZ0 | 大陆老太交xxxxxhd在线 | 嫩交18xxxx | 久久99热这里只频精品6 | 麻豆高潮AV久久久久久久 | 欧洲馒头大肥p | 国内精品欧美久久精品 | 欧式午夜理伦三级在线观看 | 快播电影频道 | 狼群影院视频在线观看WWW | 亚洲人精品午夜射精日韩 | 精品免费久久久久久影院 | qvod 艺术片 qvod 韩国 | 亚洲黄色在线视频 | 最新亚洲中文字幕在线观看 | 把她带到密室调教性奴 | 久久久伊人影院 | 国产午夜亚洲精品不卡电影 | japanese幼儿videos | 久久国产av偷拍在线 | Y8848高清私人影院软件优势 | 翁用力的抽插 | 这里只有精品网 | 偷窥国产亚洲免费视频 | 国产成人自产拍免费视频 | 国产 在线 亚洲 欧美 动漫 | 亚洲 欧美 国产 综合 播放 | 国产美女一区二区 | 亚洲国产日韩a精品乱码 | 99久久99久久免费精品蜜桃 | 国产AV亚洲精品久久久久软件 | 在线欧美免费人成视频 | 日韩欧美一区二区三区免费看 | 国产精品久久久久永久免费看 | 帝王被大臣们调教高肉 | TUBE69CHINESE学生| 国产亚洲精品久久久久5区 国产亚洲精品久久久久 | 亲胸揉胸膜下刺激视频在线观看 | 美女扒开尿口让男生添动态图 | 日本VA在线视频播放 |