前幾天寫了一篇在任意字符集下正常顯示網(wǎng)頁的方法,里面介紹的很簡單,就是把前128個(gè)字符以外的字符集都用 NCR 來表示,但是具體怎么轉(zhuǎn)化我沒有介紹,因?yàn)楫?dāng)時(shí)我覺得太簡單了。但是后來發(fā)現(xiàn)有人問這個(gè)問題,這 " /> 91福利国产在线观看网站,最新精品学生国产自在现拍,小黄文纯肉污到你湿

天天躁日日躁狠狠躁AV麻豆-天天躁人人躁人人躁狂躁-天天澡夜夜澡人人澡-天天影视香色欲综合网-国产成人女人在线视频观看-国产成人女人视频在线观看

在任意字符集下正常顯示網(wǎng)頁的方法二(續(xù))

轉(zhuǎn):coolcode.cn
前幾天寫了一篇在任意字符集下正常顯示網(wǎng)頁的方法,里面介紹的很簡單,就是把前128個(gè)字符以外的字符集都用 NCR 來表示,但是具體怎么轉(zhuǎn)化我沒有介紹,因?yàn)楫?dāng)時(shí)我覺得太簡單了。但是后來發(fā)現(xiàn)有人問這個(gè)問題,這里就詳細(xì)說明一下。
首先第一步是要把源字符集的字符串轉(zhuǎn)化為 UTF-16 字符集,做這一步是因?yàn)?nbsp;UTF-16 字符集中的每個(gè)字符都是兩個(gè)字節(jié),后面處理起來很容易,而如果在源字符集上直接做處理則很復(fù)雜。源字符集可以從原網(wǎng)頁中的 meta 標(biāo)簽中獲得,也可以單獨(dú)指定,我的程序是讓用戶在表單中指定源字符集,因?yàn)槲也荒鼙WC用戶提交的文件就一定是 HTML 文件(其他文件也是可以的,比如這個(gè) WordPress 的漢化包源文件是個(gè) po 文件,它里面的內(nèi)容也可以這樣處理),而且即使是 HTML 文件,里面也不一定就有用于指定字符集的 meta 標(biāo)簽,所以通過表單單獨(dú)指定字符集比較保險(xiǎn)。你可能會覺得將一種字符集轉(zhuǎn)化為另一種字符集很復(fù)雜,確實(shí)如此,如果自己來實(shí)現(xiàn)的話,確實(shí)非常麻煩,但是用 php 來做卻很容易,因?yàn)樗锩嬉呀?jīng)包含這樣的函數(shù)了,你可以通過 iconv 函數(shù)很容易的來實(shí)現(xiàn)各種字符集之間的轉(zhuǎn)化,如果你的機(jī)器上沒有安裝 iconv 擴(kuò)展,你也可以使用 mb_convert_encoding 函數(shù),如果 Multibyte String 擴(kuò)展也沒有安裝,那就沒辦法了,因?yàn)槟阋约簩?shí)現(xiàn)那么多種編碼的轉(zhuǎn)化基本上是不可能的,除非你是頂級大牛!推薦使用 iconv,因?yàn)檫@個(gè)效率高,支持的字符集也更多。
做完上面那一步之后,接下來是以每兩個(gè)字節(jié)為單位對字符串進(jìn)行處理。這兩個(gè)字節(jié)直接轉(zhuǎn)化為數(shù)字就是 &#xxxxx; 中的 xxxxx,如果這個(gè)數(shù)字小于 128 就直接使用這個(gè)字符(注意這里就變成單字節(jié)了),否則就使用 &#xxxxx; 的形式。這里有一點(diǎn)要注意,就是當(dāng)這個(gè)數(shù)字是 65279(16 進(jìn)制的 0xFEFF)時(shí),請把它忽略掉,因?yàn)檫@個(gè)是 Unicode 編碼中的傳輸控制字符,而我們現(xiàn)在的字符串已經(jīng)只有 iso-8859-1 編碼中的前 128 個(gè)字符了,所以我們不需要它了。
好了,基本思路就是這樣,下面是實(shí)現(xiàn)的程序:
下載: nochaoscode.php
復(fù)制代碼 代碼如下:
<?php 
function nochaoscode($encode, $str) { 
    $str = iconv($encode, "UTF-16BE", $str); 
    for ($i = 0; $i < strlen($str); $i++,$i++) { 
        $code = ord($str{$i}) * 256 + ord($str{$i + 1}); 
        if ($code < 128) { 
            $output .= chr($code); 
        } else if ($code != 65279) { 
            $output .= "&#".$code.";"; 
        } 
    } 
    return $output; 

?>

函數(shù)的參數(shù)中,$encode 是源字符集,$str 是需要進(jìn)行轉(zhuǎn)化的字符串。返回結(jié)果是轉(zhuǎn)化以后字符串。
補(bǔ)充:今天 Legend 告訴我一種更簡單的方法,就是直接利用 mb_convert_encoding 函數(shù)。因?yàn)?nbsp;mb_convert_encoding 支持一種叫做 HTML-ENTITIES 的編碼格式,也就是 NCR 編碼。用它就更簡單了。

php技術(shù)在任意字符集下正常顯示網(wǎng)頁的方法二(續(xù)),轉(zhuǎn)載需保留來源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 久久久久嫩草影院精品 | 野花香在线观看免费高清播放视频 | 纯肉腐文高H总受男男 | 91进入蜜桃臀在线播放 | 欧美伊人久久大香线蕉综合69 | 桥本有菜黑丝 | 女女破视频在线观看 | 熟妇的味道HD中文字幕 | 肉动漫无修3D在线观看 | 丰满五十六十老熟女HD60 | 亚洲精品视频在线免费 | 国产精品99久久久精品无码 | 亚洲视频精品 | 手机观看毛片 | 囯产愉拍亚洲精品一区 | yy4408午夜场理论片 | 亚洲AV色香蕉一区二区三区 | 中文字幕无码他人妻味 | 成年女人免费影院播放 | 有人有片的观看免费视频 | 40岁东北老阿姨无码 | 久久99热成人精品国产 | 欧美三级在线完整版免费 | 国产精品99久久久久久AV蜜臀 | 亚洲精品AV无码重口另类 | 激情内射亚洲一区二区三区爱妻 | 亚洲免费高清视频 | 久久天天躁狠狠躁夜夜躁 | 亚洲宅男天堂a在线 | 国产一区亚洲 | 在线观看日韩一区 | 久久国产视频网站 | 伊人成综合网伊人222 | 亚洲精品乱码8久久久久久日本 | 亚洲精品在看在线观看 | 中文日韩亚洲欧美字幕 | 国产婷婷色一区二区三区在线 | 亚洲精品成人在线 | 美女扒开尿口直播 | 换脸国产AV一区二区三区 | 欧美大香线蕉线伊人久久 |