Python与C++数据交互编码问题

本文讲述了在Python后台服务器与C++客户端通过socket进行数据交互时遇到的编码解码问题。首先,Python socket.recv()接收到的数据格式不正确,经过分析发现需要使用"utf-16"解码才能得到正确的unicode数据。然而,当尝试编码回原始格式时,数据尾部出现"x00"字符。最终,作者推测这可能是由于C++的字符串以/0字符结尾,导致转换问题。总结教训,强调在不同语言间进行数据交互时,特别是涉及中文时,了解并正确处理字符集非常重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在写后台的时候遇到一个需求:
我的python后台服务器需要建立一个服务端socket跟C++客户端进行一些数据的交互

出现问题:
Python socket.recv(1024)接收到的数据是格式不正确的。
比如客户端传过来的数据格式是“4,10080”
服务端接收到的数据格式是 “ 4, 1 0 0 8 0”

分析问题:
客户端传输过来的数据类型是unicode,但是并不知道是什么样的编码解码类型,坑!!!非常坑!!!
然后打印Python接收到的初始数据发现是str类型,说明了Python的socket.reccv()对数据流进行了编码
于是在尝试了N种解码方式以后终于发现,用“utf-16”的解码方式能够从原始接收数据中得到正确的unicode数据

第二波问题:
在获取到正确的unicode数据进行多种方式编码,发现编码后的string数据都是“4, 10080/x00”

第二波分析问题:
因为未知客户端那边的编码解码方式,是不是因为我的编码方式和客户端的解码方式是不一样的,所以取到的数据是不正确的

结论:
1. unicode的出现是在C和C++之后,也就是

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值