
python
文章平均质量分 55
N_琪无可挡ki
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
k均值算法——python实现
无监督学习中应用最多的就是聚类,其中k均值算法就是典型的聚类算法,下面是一段从文本中读取30数据,然后进行聚类的过程,包括输出读取的数据集、随机选择的K个初始均值向量、30行数据各自所属的类别以及最后的聚类中心,因为每次是随机选择K个初始均值向量,所以每次运行结果不一样的。如果各位需要全部引用的话,请标注来源,具体的数据集需要的话,可以找我要。import numpy as npimport m...原创 2018-07-05 14:53:14 · 4318 阅读 · 1 评论 -
朴素贝叶斯之垃圾邮件自动识别系统
该垃圾邮件自动识别系统的实现是基于朴素贝叶斯分类法的应用,主要使用的是Python语言。在项目初期,也是参考了一些网址,然后根据自己的理解画系统流程图并进行编程。(如:http://blog.youkuaiyun.com/shijing_0214/article/details/51200965)给大家分享一些写类似任务的项目文档说明的技巧:一般从原理分析、识别过程和结果分析三方面进行阐述。原理分析主要是...原创 2018-07-19 16:13:50 · 1929 阅读 · 0 评论 -
豆瓣评论第一页爬取
import requests# 先进行第一次安装from lxml import etreeimport pandas as pdurl="https://book.douban.com/subject/1084336/comments/"r=requests.get(url).texts=etree.HTML(r)# 获取文本内容用text(),观察下面获取的第一个、第二个文本...原创 2018-10-16 11:08:12 · 462 阅读 · 0 评论 -
scrapy的安装
一般我们cmd——>pip install scrapy进行安装,但是pip包管理工具是与Linux系统兼容的,与Windows系统兼容一般。所以在Windows系统执行前面命令时,很可能出现各种问题,其中就有依赖包的缺失或不兼容,需要重新进行安装,此时就要下载相应的whl文件(https://www.lfd.uci.edu/~gohlke/pythonlibs/)。本人在安装和创建项目时具...原创 2018-10-16 12:06:26 · 240 阅读 · 0 评论