NLP 多列表嵌套合并一个list

该博客介绍了如何处理自然语言处理(NLP)中遇到的多列表嵌套合并问题,以及在输出CSV格式时,针对标点符号未分离的挑战。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

读取txt文本并按照空格分词

sentence_list =[]
with open("train_all.txt",'r') as f:
    for line in f:
        sentence_list.append(list(line.strip(' ').split(' ')))

在这里插入图片描述
#多个嵌套list合并成一个

def nested_list(list_raw,result):
    for item in list_raw:
        if isinstance(item, list):
            nested_list(item,result)
        else:
            result.append(item)
    return  result

#输出CSV格式

def main():
    list_raw = sentence_list
    result = []
    with open('sentence.csv','w') as out:
        for d in  nested_list(list_raw,result):
            out.write(str(d)+'\n')
main()

在这里插入图片描述
先记录一下,代码还有问题,标点符号没有分开。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值