python 处理 unicode 格式的 csv 文件
好久没有写 Blog 了,文中很多信息其实没有严格查文献啦,所以会有不对的地方。
献丑了。。。
- 前言
- CSV 摘要简介
- python 处理 unicode 格式的 csv 文件
前言
任务需要,需要增加一个翻译机制,提供 js 接口。
- 需要便于对接原有的翻译数据(基于 excel 表格)。
- 需要方便修改翻译。
- 至少支持 windows 和 linux 平台。
以上原因,只好采用 csv 文件格式用来进行处理。(也有想过 web 的形式,但是暂时没有找到比较好的形式)。
但是用 csv 的时候,发现 csv 的标准是非强制的,很多情况下对于 中文等多国语言兼容性不好。
研读一下 office 等软件对 csv 的处理方式,在不识别 文件编码时,会使用 unicode 格式进行解析。
最后决定采用 unicode 的 csv 文件进行翻译信息的处理。
CSV 摘要简介
- CSV 文件是一种表格文件规范(非强制)。
- 可以通过 ‘,’ (逗号)、’ ’ (空格) 或 ‘\t’ (制表符) 分列。
- 通过 ‘\n’、‘\r’、‘\r\n’ (windows) 分行。
- 通过 Excel 等软件打开可以显示为表格的形式。
python 处理 unicode 格式的 csv 文件
# -*- coding: utf-8 -*-
import os
import shutil
import commands
import inspect
import sys
import csv
import codecs
import cStringIO
# import unicodecsv as csv
G_CHAR_NEWLINE = '\n'
G_EN_KEY_MAP = False # True
G_EN_SHOW_SPACE = False # True
def get_csvdata_value(csv_data_list, line_index, rows_index):
if (line_index < len(csv_data_list)