python 处理 unicode 格式的 csv 文件

python 处理 unicode 格式的 csv 文件

好久没有写 Blog 了,文中很多信息其实没有严格查文献啦,所以会有不对的地方。
献丑了。。。

  • 前言
  • CSV 摘要简介
  • python 处理 unicode 格式的 csv 文件

前言

任务需要,需要增加一个翻译机制,提供 js 接口。
- 需要便于对接原有的翻译数据(基于 excel 表格)。
- 需要方便修改翻译。
- 至少支持 windows 和 linux 平台。

以上原因,只好采用 csv 文件格式用来进行处理。(也有想过 web 的形式,但是暂时没有找到比较好的形式)。
但是用 csv 的时候,发现 csv 的标准是非强制的,很多情况下对于 中文等多国语言兼容性不好。
研读一下 office 等软件对 csv 的处理方式,在不识别 文件编码时,会使用 unicode 格式进行解析。
最后决定采用 unicode 的 csv 文件进行翻译信息的处理。

CSV 摘要简介

  • CSV 文件是一种表格文件规范(非强制)。
  • 可以通过 ‘,’ (逗号)’ ’ (空格)‘\t’ (制表符) 分列。
  • 通过 ‘\n’‘\r’‘\r\n’ (windows) 分行。
  • 通过 Excel 等软件打开可以显示为表格的形式。

python 处理 unicode 格式的 csv 文件

# -*- coding: utf-8 -*-

import os
import shutil
import commands
import inspect
import sys
import csv
import codecs
import cStringIO

# import unicodecsv as csv

G_CHAR_NEWLINE = '\n'
G_EN_KEY_MAP = False        # True
G_EN_SHOW_SPACE = False     # True

def get_csvdata_value(csv_data_list, line_index, rows_index):
    if (line_index < len(csv_data_list) 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值