- 博客(5)
- 收藏
- 关注
原创 Spark学习笔记:Examples部分(1)-KMeans
最近开始学spark,看了一段时间官网后,从官网上给的github上的examples开始学起。作为自己的一个笔记,有需要的人也可以看一看,反正我是菜鸡。。。也不知道能写几篇,尽力而为吧import sysimport numpy as npfrom pyspark.sql import SparkSessiondef parseVector(line): return np.array([float(x) for x in line.split(' ')])#计算到点p.
2021-05-25 12:30:07
277
原创 Gensim中动态主题模型——dtmmodel的使用
import gensimimport jiebaimport pandas as pdfrom gensim import corpora,modelsfrom gensim.models.wrappers import DtmModelfrom gensim.corpora import Dictionaryfrom collections import defaultdict...
2019-06-02 15:06:55
5535
21
原创 numpy.bincount介绍以及巧妙计算分类结果中每一类预测正确的个数
之前接触到bincount这个函数,简单的以为它就是计算分类结果中每一类的数量,如下:import numpy as npa = np.array([0,1,3,2,1])binc = np.bincount(a)print(binc)结果输出是这样:[1 2 1 1]这个结果表示0有1个,1有两个,2和3各有一个。但是今天又发现了一个不为人知的巧妙用法,是在一篇论...
2019-04-19 11:04:38
1591
原创 爬取百度词条内链接
"""Created on Tue Dec 19 15:23:28 2017@author: Administrator"""import urllib.requestfrom bs4 import BeautifulSoupimport reurl = 'https://baike.baidu.com/item/%E7%BD%91%E7%BB%
2017-12-19 19:51:25
1945
原创 python爬取有道翻译出错 {‘errorcode’:50}
import urllib.requestimport urllib.parseimport jsoncontent = input("Enter the words needs translated:")url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=ugc"data = {}
2017-12-19 14:55:44
22525
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人