PHP把汉字转化成unicode码

博客围绕将GB编码内容转换为UTF - 8编码的算法展开,给出了一个PHP函数gb2utf8。该函数通过读取gb2312.txt文件构建编码表,对输入的GB编码字符串进行逐字符处理,最终实现转换,并给出了调用示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

比如,把:“最新推荐GB”转化成:  
 
最新推荐GB  
 
请问算法。谢谢  
---------------------------------------------------------------  
 
测试成功,gb2312.txt下载  
http://www.phpx.com/download/utf8/gb2312.txt  
 
function  gb2utf8($gb)  
{  
           if(!trim($gb))return  $gb;  
           $filename="gb2312.txt";  
           $tmp=file($filename);  
           $codetable=array();  
           while(list($key,$value)=each($tmp))  
                       $codetable[hexdec(substr($value,0,6))]=substr($value,7,6);  
             
           $utf8="";  
           while($gb)  
           {  
                       if  (ord(substr($gb,0,1))>127)  
                       {  
                                   $this=substr($gb,0,2);  
                                   $gb=substr($gb,2,strlen($gb));  
                                   $utf8.="&#x".dechex(hexdec($codetable[hexdec(bin2hex($this))-0x8080])).";";  
                       }  
                       else  
                       {  
                                   $utf8.="&#x".dechex(ord(substr($gb,0,1))).";";  
                                   $gb=substr($gb,1,strlen($gb));  
                       }  
           }  
             
           return  $utf8;  
}  
 
 
echo  gb2utf8("中文Abc");  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值