数据科学与Python基础入门
1. 寻找最热门兴趣的简单方法
要找出最热门的兴趣,有一种简单的方法,即对单词进行计数。具体步骤如下:
1. 将每个兴趣转换为小写,因为不同用户可能会对他们的兴趣进行不同的大小写处理。
2. 将兴趣拆分为单词。
3. 对拆分后的单词进行计数。
以下是实现该功能的代码:
from collections import Counter
# 假设 interests 是一个包含用户和兴趣的列表
# 这里省略 interests 的具体定义
words_and_counts = Counter(word
for user, interest in interests
for word in interest.lower().split())
# 列出出现次数超过一次的单词
for word, count in words_and_counts.most_common():
if count > 1:
print(word, count)
运行上述代码后,会得到如下结果(除非你期望 “scikit-learn” 被拆分为两个单词,否则结果应该符合预期):
| 单词 | 出现次数 |
| — | — |
| learning | 3 |
| java | 3 |
| python | 3 |
| big | 3 |
| da
超级会员免费看
订阅专栏 解锁全文

31万+

被折叠的 条评论
为什么被折叠?



