python的笔记

本文介绍NumPy库中的argsort函数使用方法,展示如何通过该函数获取数组元素从小到大的索引值,并结合[::-1]实现从大到小排序。通过具体代码示例,解释如何利用这些索引值从词汇表中选取高频词汇,适用于文本分析和主题模型场景。

 

  np.argsort(x):返回数据x从小到大的索引值,记住是一个索引值。当你想获取从小到大的数据的时候,用到这个

  data[::-1]:对数据data进行倒转

1 a=[0,1,2,3,4,5]
2 a[::-1]
3 Out[3]: [5, 4, 3, 2, 1, 0]
4 import numpy as np
5 np.argsort(a)
6 Out[5]: array([0, 1, 2, 3, 4, 5], dtype=int64)

   list是通过下标访问的,我们可以使用已经获得的下标获取list里面的数据

1 topic_to_topwords = {}
2 for j, topic_to_word in enumerate(dat['topic_term_dists']):
3     top = np.argsort(topic_to_word)[::-1][:top_n]               # 概率从大到小的下标索引值
4     msg = 'Topic %i '  % j
5     oo = dat['vocab'][254].strip()
6     tt = dat['vocab'][254].strip()[:35]
7     top_words = [dat['vocab'][i].strip()[:35] for i in top]
8     msg += ' '.join(top_words)

 

 1 for j, topic_to_word in enumerate(dat['topic_term_dists']):
 2     top = np.argsort(topic_to_word)[::-1][:top_n]               # 概率从大到小的下标索引值
 3     msg = 'Topic %i '  % j
 4     # 通过list的下标获取关键词
 5     top_words = [dat['vocab'][i].strip()[:35] for i in top]
 6     # 数据拼接
 7     msg += ' '.join(top_words)
 8     print(msg)
 9     # 将数据保存到字典里面
10     topic_to_topwords[j] = top_words

  快速的将list保存到字典数据中

转载于:https://www.cnblogs.com/demo-deng/p/9706611.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值