python list数据用pandas的csv输出

本文介绍了一种使用Python的正则表达式模块re进行文本处理的方法,将一段中文文本分割成list,并通过随机采样生成负样本数据集。最后,利用Pandas将数据集输出为CSV文件,便于进一步的数据分析和机器学习应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在用python操作文件的时候,经常会碰到数据是list格式的,但是导出的时候需要用到pandas,我这里写了一个转换的样例,供大家参考:

构造list数据

text='《中国青年报》消息称,吉利德公司表示,已与中国卫生部门达成了协议,支持开展两项临床试验,以确定瑞德西韦作为冠状病毒潜在治疗手段的安全性和有效性。研究主要包含两项:一项是评估针对“已住院但未表现出显著临床症状的患者”的疗效,一项是评估针对“出现较严重临床症状患者”的疗效。'
import re
pattern = r',|\.|/|;|\'|`|\[|\]|<|>|\?|:|"|\{|\}|\~|!|@|#|\$|%|\^|&|\(|\)|-|=|\_|\+|,|。|、|;|‘|’|【|】|·|!| |…|(|)'
result_list = re.split(pattern, text)
print(result_list)

negative_samples=[]
for i in range(len(result_list)-1):
    text1=result_list[i]
    text2=result_list[i+1]
    if(len(text2)<2):
        continue
    if(len(text1)<2):
        continue
    index1=random.randint(1,len(text1))
    index2=random.randint(1,len(text2))
    strip1=text1[:index1]
    strip2=text2[:index2]
    negative_samples.append([strip1,strip2,0])

利用pandas输出 

import pandas as pd
column_name = ['texta', 'textb','label']
csv_name='sentence_consistent.csv'
xml_df = pd.DataFrame(negative_samples, columns=column_name)
xml_df.to_csv(csv_name, index=None) 

然后就大功告成了哈

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

农民小飞侠

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值