前言:
嗨喽~大家好呀,这里是魔王呐 ❤ ~!
python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取
公司同事邀我一起给SQLSERVER 2008导数, 数据来源有高斯和ORACLE, 数据文件保存格式有UTF-8和GBK。
当我在做测试导入的时候发现SQLSERVER 2008数据库的WITH选项不支持CODEPAGE=‘65001’, 即UTF-8文件编码格式导入。 所以需要把UTF-8编码的文件统一转换成GBK, 代码如下。
示例一:
import os, sys
import chardet
source_file = sys.argv[1] # 源文件
dest_file = sys.argv[2] # 转后的目标文件
# 确定源文件字符编码
for row in open(source_file, 'rb'):
tmp = chardet.detect(row)
language = tmp.get("encoding")
if language.upper == 'UTF-8':
charset = "UTF-8"
else