天天躁日日躁狠狠躁AV麻豆-天天躁人人躁人人躁狂躁-天天澡夜夜澡人人澡-天天影视香色欲综合网-国产成人女人在线视频观看-国产成人女人视频在线观看

php字符編碼轉換之gb2312轉為utf8

 在php中字符編碼轉換我們一般會用到iconv與mb_convert_encoding進行操作,但是mb_convert_encoding在轉換性能上比iconv要差很多哦。
string iconv ( string in_charset, string out_charset, string str ) 注意:第二個參數,除了可以指定要轉化到的編碼以外,還可以增加兩個后綴://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 會自動將不能直接轉化的字符變成一個或多個近似的字符,//IGNORE 會忽略掉不能轉化的字符,而默認效果是從第一個非法字符截斷。
Returns the converted string or FALSE on failure.
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 擴展庫,在 php.ini里將; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多種輸入編碼,它會根據內容自動識別,但是執行效率比iconv差太多;

使用:
發現iconv在轉換字符”―”到gb2312時會出錯,如果沒有ignore參數,所有該字符后面的字符串都無法被保存。不管怎么樣,這個”―”都無法轉換成功,無法輸出。 另外mb_convert_encoding沒有這個bug.
一般情況下用 iconv,只有當遇到無法確定原編碼是何種編碼,或者iconv轉化后無法正常顯示時才用mb_convert_encoding 函數.
復制代碼 代碼如下:
/**
*自動判斷把gbk或gb2312編碼的字符串轉為utf8
*能自動判斷輸入字符串的編碼類,如果本身是utf-8就不用轉換,否則就轉換為utf-8的字符串
*支持的字符編碼類型是:utf-8,gbk,gb2312
*@$str:string 字符串
*/
function yang_gbk2utf8($str){
    $charset = mb_detect_encoding()($str,array('UTF-8','GBK','GB2312'));
    $charset = strtolower($charset);
    if('cp936' == $charset){
        $charset='GBK';
    }
    if("utf-8" != $charset){
        $str = iconv($charset,"UTF-8//IGNORE",$str);
    }
    return $str;
}

下面我接著看在轉換字符編碼的一些問題
用mb_detect_encoding($str);函數,使用該函數必須打開php的extension=php_mbstring.dll擴展
復制代碼 代碼如下:
<?php
$str="測試ing";
$cha=mb_detect_encoding($str);
$s = iconv($cha,"UTF-8",$str);
var_dump($s);
?>

結果返回:
string(0) “”
真是奇怪,為什么會這樣。
復制代碼 代碼如下:
<?php
$str="測試ing";
$cha=mb_detect_encoding($str);
$s = iconv("GB2312","UTF-8",$str);
var_dump($s);
?>

返回結果正確。發現該函數mb_detect_encoding($str);判斷還是不準確。不知是什么原因。
函數string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )
可以轉換為指定編碼的字符串,我寫了例子
復制代碼 代碼如下:
<pre lang="php" line="1">
<?php
$a="我很好";
echo mb_convert_encoding ($a,'UTF-8');
?>

可結果是:
??潞?潞?
現在的問題就是我如果把不同的字符串編碼形式統一轉換為utf-8,如果事先知道改變嗎可以用iconv,但如果不知道該編碼該怎么辦呢?
問題3:iconv問題,如果轉換的字符串,第一個字節的編碼大于一定的數會返回空.
如:
復制代碼 代碼如下:
<?php
$str=chr(254)."測試ing".chr(254);
$s = iconv("GB2312","UTF-8",$str);
var_dump($s);
?>

返回
string(0) “”

mb_convert_encoding的用法見官方:

http://cn.php.NET/manual/en/function.mb-convert-encoding.php

php中的另外一個函數iconv也是用來轉換字符串編碼的,與上函數功能相似。

下面還有一些詳細的例子:
iconv ― Convert string to requested character encoding
(php 4 >= 4.0.5, php 5)
mb_convert_encoding ― Convert character encoding
(php 4 >= 4.0.6, php 5)
用法:
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
需要先enable mbstring 擴展庫,在 php.ini里將; extension=php_mbstring.dll 前面的 ; 去掉
mb_convert_encoding 可以指定多種輸入編碼,它會根據內容自動識別,但是執行效率比iconv差太多;
string iconv ( string in_charset, string out_charset, string str )
注意:第二個參數,除了可以指定要轉化到的編碼以外,還可以增加兩個后綴://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 會自動將不能直接轉化的字符變成一個或多個近似的字符,//IGNORE 會忽略掉不能轉化的字符,而默認效果是從第一個非法字符截斷。
Returns the converted string or FALSE on failure.
使用:
發現iconv在轉換字符”―”到gb2312時會出錯,如果沒有ignore參數,所有該字符后面的字符串都無法被保存。不管怎么樣,這個”―”都無法轉換成功,無法輸出。 另外mb_convert_encoding沒有這個bug.
一般情況下用 iconv,只有當遇到無法確定原編碼是何種編碼,或者iconv轉化后無法正常顯示時才用mb_convert_encoding 函數.
from_encoding is specified by character code name before conversion. it can be array or string

主站蜘蛛池模板: 九九久久国产精品大片 | 男生插曲女生身全过程 | 国产女人与黑人在线播放 | 97精品国偷拍自产在线 | 亚洲精品无码一区二区三区四虎 | 小黄飞二人转 | 性888xxxx入欧美 | GAY空少被体育生开菊 | 66美女人体 | 曰产无码久久久久久精品 | 99久久人妻无码精品系列性欧美 | 挤奶门事件完整照片 | 高跟丝袜岳第一次 | 十二月综合缴缴情 | 一级片mp4| 亚洲AV成人无码网天堂 | 动漫H片在线观看播放免费 动漫H片在线播放免费高清 | 国产一卡2卡3卡4卡孕妇网站 | 香蕉鱼视频观看在线视频下载 | 亚洲成A人片在线观看中文不卡 | 亚洲国产精品一区二区久久第 | 亚洲久久少妇中文字幕 | 欧美精品专区免费观看 | 日本女人bbb | 成人在免费观看视频国产 | 成人小视频免费在线观看 | 偷拍精品视频一区二区三区 | WWW亚洲精品久久久乳 | 口工漫画r18全彩啪啪 | 在线观看永久免费网站 | 囯产免费精品一品二区三区视频 | 日韩 国产 欧美视频二区 | 白丝高中生被c爽哭 | 国产在线不卡 | 日本妈妈JMZZZZZ | jizz非洲| 97久久无码精品AV | 美女被触手注入精子强制受孕漫画 | 影视先锋男人无码在线 | 精品无码国产自产在线观看水浒传 | 欧美fxxx |