- 博客(6)
- 收藏
- 关注
原创 NMF非负矩阵分解
参考文献:Lee D D , Seung H S . Learning the Parts of Objects by Non-Negative Matrix Factorization[J]. Nature, 1999, 401(6755):788-791.这篇文章是NMF首先被提出的文章,1999年发表于《Nature》。NMF即非负矩阵分解,是一种(非线性)降维的方法,常用于文本和图像的...
2020-03-23 15:55:08
1110
1
原创 VMware Ubuntu虚拟机学习笔记(一)
密码设置与更新:1. Root密码的设定 1) 命令:sudo passwd root 2) 输入两遍新的密码 3) 命令:su root-->输入密码-->切入root用户 4) 命令:exit-->退出root用户2. Ubuntu的更新 1) 命令:sudo apt-get upd...
2020-03-22 16:59:20
1350
转载 Python爬虫学习之selenium+ChromeDriver实现爬虫
selenium+ChromeDriver实现爬虫参考:https://blog.youkuaiyun.com/u010986776/article/details/79266448selenium所做的事情,恰恰是驱动真正的浏览器去执行请求和操作无头浏览器:PhantomJS —— 成为历史ChromeDriverSelenium和ChromeDriver的安装与配置Selenium库的...
2020-03-22 16:36:27
1215
1
原创 Python爬虫学习之下载源文件与数据存储
下载源文件与数据存储下载源文件 urlretrieve多用于非结构化的数据(图片等),以下载http://www.pythonscraping.com 上的logo.jpg为例:'''urlretrieve'''from urllib.request import urlretrievefrom urllib.request import urlopenfrom bs4 import ...
2019-11-18 21:42:31
357
原创 Python爬虫学习之API与模拟ajax请求
API的使用——通过API向服务器请求数据优点:简单直接,高效率地批量爬取;解决动态网页的爬取。缺点:通过API的缺点是有些网站会限制API调用的次数和频率,用户需要付费来升级成高级用户来获取更灵活的API调用。HTTP协议在HTTP协议下,客户端和服务端通过交换各自的消息进行交互。由像浏览器这样的客户端发出的消息叫做请求(requests),被服务端回应的消息叫做响应(respons...
2019-11-18 21:37:00
1488
原创 利用R ggplot2包进行数据可视化(一)
一个好的可视化例子各国家都喜爱哪些宠物?by La Nación作品地址 该作品于2017年10月14日发表在《阿根廷国家报》上,并获得了2018凯度信息之美奖艺术、娱乐与文化类奖项。该作品以GFK研究所对22个国家的网民进行的调查为基础。 从该作品的图表类型来看,可视为簇状条形图。创作者采用人物和宠物的卡通形象巧妙地替代条形图,极具趣味也不失直观性,受众能够从中获知的信息也比较充...
2019-09-27 21:09:18
1915
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人