将相同name不同taxid合并数量相加_202112

lj_learn

于 2023-12-21 13:37:14 发布

阅读量379

点赞数 8

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_50542529/article/details/135128760

版权

文章展示了使用Python的Pandas库对CSV文件进行数据清洗、去重、计数和排序的过程，包括读取文件、删除指定列、按名称去重并计算计数值，最后保存为新CSV文件。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

import pandas as pd
file1 = r"2021-10\K200005137_L01_126_priceseq_dedup_lzw_bowtie2_subsample_gsnapfilter_gasnap.m8_match_taxid_lineage_add_kgs_delrepeat1_out - 1.txt"
df1 = pd.read_csv(file1, sep='\t')

print(df1)
print(df1['Name'])
print(df1['count'])
# print(df1.loc['Name','count'])
# print(df1.groupby('Name').sum())

# df2=df1.drop(df1.columns[['taxid','count']])

print(df1.columns)
df2=df1.drop(columns=['taxid','count'],axis=1)  #去掉2列，axis=0或axis='rows'，都表示展出行，也可用labels参数删除行, inplace=True
print(df2)

df3=df1.drop(columns=['count'],axis=1) #去掉一列

df4 = df3.drop_duplicates(subset=['Name', 'level 1'],keep='first') # 按全量字段去重, 保留第一个(默认)
df4.reset_index(drop=True,inplace=True) #重置索引
# print(df4['taxid'])
print(df4)

list1 =df1['Name'].unique().tolist()
# print(len(list1))
# if df1.loc[i,'Name']=

df4["count"]=0
for i in range(len(list1)):
    print(list1[i])
    # print(df1[df1["Name"]==list1[i]]['count'].tolist())
    list2=df1[df1["Name"]==list1[i]]['count'].tolist()
    # print(type(df1[df1["Name"]==list1[i]]['count'])) <class 'pandas.core.series.Series'>
    count_sum = sum(list2)  # 元素相加
    if df4.loc[i,'Name']==list1[i]:
        df4['count'][i]=count_sum

print(df4)
    # print(count_sum)
order = ['Name', 'level 1', 'taxid', 'count', 'kingdom', 'genus', 'species','type']
df4 = df4[order]
df4.to_csv(r"2021-10\output8.txt",index=None,sep='\t')

博客等级

码龄5年

68
原创

606
点赞

636
收藏

1485
粉丝

关注

私信

热门文章

上一篇：: 使用idseq组装contig写说明并标注鉴定_20211206

下一篇：: 测试使用命令行输入_20211209

最新评论

idseq_pipeline:hostfilter_qc_align_finalout(accession_no_version)_20211223
lj_learn: 这个没有
idseq_pipeline:hostfilter_qc_align_finalout(accession_no_version)_20211223
weixin_47088367: 你好，最近也在做czid的idseq流程本地化，你有后期更新成minimap2后再测试过吗
配合有道翻译自动译文
优快云-Ada助手: 恭喜你开始了博客创作，标题也很吸引人。不过，我认为下一步你可以尝试自己翻译一些内容，尽量避免使用自动翻译工具，这样可以锻炼自己的语言能力和表达能力。希望你能继续努力，不断提升自己的写作水平。加油！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
python使用内嵌的translator翻译句子
优快云-Ada助手: 很棒的博文！看到你分享了关于python内嵌的translator的内容，我觉得你的知识面非常广，而且能够将复杂的技术内容简单易懂地呈现给读者。希望你可以继续写下去，分享更多关于python和其他编程技能的知识。另外，如果你对自然语言处理（NLP）技术感兴趣的话，可以尝试了解一下词嵌入（word embedding）和文本分类（text classification）等相关内容，这些都是NLP领域非常重要的技能，对于理解和应用内嵌的translator可能会有所帮助。希望我的建议对你有所帮助，期待看到你更多的精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
python使用百度翻译进行翻译单词
优快云-Ada助手: 恭喜您写下了第三篇博客！标题“python使用百度翻译进行翻译单词”非常吸引人。您的博客内容对于学习Python并实现单词翻译来说非常有帮助。我很欣赏您的努力和持续创作的精神。在下一步的创作中，我建议您可以进一步探索如何使用Python结合其他翻译API或者自然语言处理技术，实现更复杂的翻译功能。此外，您也可以将您的博客扩展到其他领域，如文本处理、数据分析等。这将进一步提高您的技术水平，并为读者提供更多有价值的内容。继续保持谦虚的态度，不断学习和分享，相信您的博客会越来越受到读者的喜爱。期待看到您更多精彩的创作！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。