【python--比对两个列表获取列表中出现频率最高的词及频率】

本文介绍了如何使用Python编写一个函数calculate_probability,用于计算给定关键词在另一列表中的出现概率。通过Counter和列表操作,找出两个关键词列表中概率最高的三个关键词组合。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

🚀 作者 :“码上有前”
🚀 文章简介 :Python
🚀 欢迎小伙伴们 点赞👍、收藏⭐、留言💬

在这里插入图片描述

python练习题

完整代码

from collections import Counter
from data_keywords import extract_keywords, extract_keywords_from_json

def calculate_probability(list1, list2):
    count_dict = {value1: round(sum(value1 in value2 for value2 in list2) / len(list2), 2) for value1 in list1}
    sorted_dict = dict(sorted(count_dict.items(), key=lambda x: x[1], reverse=True))
    top_three = list(sorted_dict.items())[:3]
    return top_three

# 假设这是给定的关键词列表
given_keywords = ['自营', '赠', '满赠','京东物流','免邮','2免1','2件7.5折','跨店每满','券']
category_given_keywords = ['自营', '赠', '满赠','京东物流','免邮','2免1','2件7.5折','跨店每满','券',"包税","官方立减15%"]
folder_path = './Cosmetic_data/Brand_Classification/brand&details_analysis'
categories_path = "./Cosmetic_data/Makeup_Classification/pcommit&details_analysis"
keyword_column = '关键词'  

new_keyword_list = extract_keywords(folder_path, keyword_column)
categories_keywords_list = extract_keywords_from_json(categories_path, keyword_column)

result = calculate_probability(given_keywords, new_keyword_list)
# print("最高的三个关键词和其概率:", result)
calculate_result = calculate_probability(category_given_keywords, categories_keywords_list)
# print("最高的三个关键词和其概率:", calculate_result)



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

码上有前

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值