使用Python进行Unicode编码解析

最新推荐文章于 2025-02-19 09:56:49 发布

原创最新推荐文章于 2025-02-19 09:56:49 发布 · 2.5k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#python #pycharm

Python 专栏收录该内容

4 篇文章

订阅专栏

该博客介绍了如何将存储为UTF-8的Unicode编码字符串进行解码。主要利用`codecs`库中的`escape_decode`方法处理转义字符，将字节序列还原为Unicode字符串。

原数据类型：txt文本，文本编码是UTF8，但是内容是Unicode编码（应该是这么理解）
在这里插入图片描述

import codecs
def utf82unicode(string):
    """
    函数功能：将utf-8保存的Unicode解码
    :param string:传入字符串，转为union
    """
    byte_list = bytes(string, encoding='utf-8')
    byte_transform = codecs.escape_decode(byte_list, "hex-escape")
    s = byte_transform[0].decode('utf-8')
    return s