在用python操作文件的时候,经常会碰到数据是list格式的,但是导出的时候需要用到pandas,我这里写了一个转换的样例,供大家参考:
构造list数据
text='《中国青年报》消息称,吉利德公司表示,已与中国卫生部门达成了协议,支持开展两项临床试验,以确定瑞德西韦作为冠状病毒潜在治疗手段的安全性和有效性。研究主要包含两项:一项是评估针对“已住院但未表现出显著临床症状的患者”的疗效,一项是评估针对“出现较严重临床症状患者”的疗效。'
import re
pattern = r',|\.|/|;|\'|`|\[|\]|<|>|\?|:|"|\{|\}|\~|!|@|#|\$|%|\^|&|\(|\)|-|=|\_|\+|,|。|、|;|‘|’|【|】|·|!| |…|(|)'
result_list = re.split(pattern, text)
print(result_list)
negative_samples=[]
for i in range(len(result_list)-1):
text1=result_list[i]
text2=result_list[i+1]
if(len(text2)<2):
continue
if(len(text1)<2):
continue
index1=random.randint(1,len(text1))
index2=random.randint(1,len(text2))
strip1=text1[:index1]
strip2=text2[:index2]
negative_samples.append([strip1,strip2,0])
利用pandas输出
import pandas as pd
column_name = ['texta', 'textb','label']
csv_name='sentence_consistent.csv'
xml_df = pd.DataFrame(negative_samples, columns=column_name)
xml_df.to_csv(csv_name, index=None)
然后就大功告成了哈