使用程序:jupyter notebook
语言:Python3
jupyter中 Markdown用来写笔记,同时能写html代码,Code用来写代码
特性:代码编写顺序无所谓,执行顺序一定是自上而下的。(只要在一个cell中执行定义好多变量函数等,那么数据就会被加载到当前文件缓存中)
-jupyter快捷操作:
-插入cell a,b 上插,下插
-删除cell x
-执行cell shift+enter
-切换cell模式 m,y 切 markdown,切code
-切换成编辑模式 代码左侧双击
-执行结果收回 结果左侧双击
-打开帮助文档 shift+tab 调用方法时不知道方法用法
-自动补全 tab
-查看快捷键 空白区域左键+h
原文件可导出为html File--DownLoad as--html一般情况下不要导出,会造成图片缺失
爬虫:编写程序模拟浏览器上网爬取数据
分类
-通用爬虫(爬一整张页面源码数据)
-聚焦爬虫(爬取一部分数据,建立在通用爬虫基础上)
-增量式爬虫(监测网站更新情况,以便爬取最新更新出来的数据)
-分布式爬虫(提高爬取效率的终极武器,一般情况不用,因为太快了,会干扰别人网站