.csv格式文件转换为.dat文件

该篇文章介绍了如何使用Python读取一个GBK编码的CSV文件,进行数据清洗后将其转换为UTF-8编码的DAT文件,同时展示了如何处理文件名和编码设置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#!/user/bin/python
# -*- coding:utf8 -*-
import os
import re
import sys

file_name = 'movies'
xml_file_name = file_name + '.csv'
fobj = open(xml_file_name, 'r', encoding='gbk')  # 指定使用gbk编码读取CSV文件
fobj_dat = open(file_name + '.DAT', 'w', encoding='utf-8')  # 指定使用utf-8编码写入DAT文件
flag = True
testdata_num = 0
dic_task_des = {}
for line_num, line_content in enumerate(fobj.readlines()):
    if flag == True:
        testdata_num = testdata_num + 1
        line_content = re.sub(',\n|,\r\n|\n', '', line_content)
        line_content = re.sub(',', '::', line_content)
        fobj_dat.writelines(line_content + '\n')
fobj_dat.close()

task_des = {}
task_des[file_name] = dic_task_des

fobj.close()

file_name修改为自己的文件名字,如果原csv文件为utf-8格式,可修改为:fobj = open(xml_file_name, 'r', encoding='utf-8')  

### 将 `.dat` 文件转换为 `csv` 文件的方法 #### 方法一:使用 Python 和 Pandas 库 Pandas 是一个强大的数据分析库,在Python环境中可以轻松实现`.dat`到`csv`的转换。首先,加载`.dat`文件的内容至 DataFrame 对象中,之后利用`to_csv()`函数将其另存为 CSV 文件。 ```python import pandas as pd # 假设 .dat 文件中的数据是以某种分隔符(比如空格、逗号等)分割开来的 df = pd.read_table('datafile.dat', delimiter=' ') # 需要根据实际情况调整delimiter参数 df.to_csv('output.csv', index=False, encoding='utf-8') ``` 此过程涉及到读入原始的数据并写入新的格式,期间可以通过设置不同的参数来满足具体需求,如编码方式的选择或是是否保留索引列等问题[^1]。 #### 方法二:借助专门工具 TableConvert 实现在线转换 对于那些不熟悉编程的人来说,TableConvert 提供了一种无需编写任何代码就能完成多种表格形式互的服务。该平台不仅限于HTML、JSON、Markdown 表格或 Excel 到 DAX 的变,同样适用于简单的`.dat`到`csv`的操作。操作简便快捷,只需上传待处理文档,选择目标格式后点击执行按钮等待片刻即可下载成果文件。值得注意的是整个流程均在用户的本地浏览器内运行,保障了信息安全私密性[^2]。 #### 方法三:采用专业 GIS 及测量行业软件 SKLDAT 完美版 针对特定领域内的应用场合,例如涉及地理信息系统(GIS)项目时,则可能需要用到像SKLDAT这样的专用应用程序来进行更复杂精细的任务——不仅仅是基本类型的变换,还包括但不限于坐标系投影定义、属性字段映射等一系列高级特性。此类程序往往具备图形化交互界面,便于非技术人员上手操作;同时提供了批量作业的支持,极大提高了工作效率[^3]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值