sqlite3 jdbc、c接口、python接口处理中文时遇到的问题及其解决方法

本文探讨了在使用SQLite3数据库时遇到的中文字符集问题,并提供了针对Python和Java (SQLiteJDBC) 接口的具体解决方案。对于Python,通过设置Connection的text_factory属性为str来确保数据正确读取;对于Java,需要进行适当的字符集转换。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

sqlite3 jdbc、c接口、python接口处理中文时遇到的问题及其解决方法

 

sqlite(版本3),以下简称sqlite3,目前功能已经非常强大。目前支持的字符集,包括UTF-8, UTF-16,UTF-16le,UTF-16be。

可是在我们直接使用gbk编码的时候,很可能就会遇到问题。

因为目前,很多人会使用c/c++接口来访问sqlite3数据库,当然,也有人使用python接口来访问它。
1. 使用python时,要想正确的取到c++接口insert/update以后的数据,需要设定Connection的text_factory值为str,
意思是直接使用原来存储时的encoding形式。

con=sqlite3.connect(r"e:\t\testsqlite3.db")
con.text_factory=str

2. 使用sqlite jdbc访问的时候,如果想正确的取到c接口insert/update以后的数据,必须进行转码。
不过,转码时很奇怪,居然是用到:

String.getBytes("ISO_8859_1"), "GBK")

看来,c接口存储到sqlite3里边的数据,默认都是ISO_8859_1格式的,除非在insert/update以前,将其转换成utf-8再进行入库操作。

目前,sqlite jdbc以及python默认的存储方式是将字符串转换成utf-8串,再进行入库,非常标准。它们自己的upsert操作,然后取出数据,不会有任何问题。这个在我的前一篇短文里也有详细的描述。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值