
Python
文章平均质量分 90
python基础
三七水
这个作者很懒,什么都没留下…
展开
-
python学习笔记(四):网络爬虫基础
网络爬虫爬虫一种按照一定的规则,自动抓取万维网信息的程序或脚本。用户获取网络数据的方式浏览器提交请求,下载网页代码,解析/渲染成页面。爬虫的方式是模拟浏览器发送请求,下載网页代码,只提取有用的数据存放于数据库或文件中。区别爬虫程序只提取网页代码中对我们有用的数据,并且爬虫 抓取速度快,量级大。网络爬虫的规模小规模中规模大规模数据...原创 2020-01-10 10:23:10 · 328 阅读 · 0 评论 -
python学习笔记(三):使用jieba库进行文本词频统计
词频统计从网上搜索下载若干篇中文或英文文本文件,编写Python程序代码,对下载的中英文文档分别进行词频统计(去除无关的构词,增添新创的构词),并对前20个频率最高的内容制作词云图。停用词表 https://github.com/goto456/stopwords(如有特殊停用词也可自己添加修改)jieba库常用函数函数描述jieba.cut(s)精确模式,返回一个可...原创 2020-01-10 09:04:24 · 3825 阅读 · 1 评论 -
python学习笔记(二):函数的复用
函数的定义函数是一段具有特定功能的、可重用的语句组,用函数名来表示并通过函数 名在需要的地方调用执行,不需要在每个执行地方重复编写这些语句。每次 使用函数可以提供不同的参数作为输入,以实现对不同数据的处理;函数执 行后,还可以反馈相应的处理结果。Python定义一个函数使用def保留字,语法形式如下: def <函数名>([参数列表]): [’’’注释’’’] <...原创 2019-12-04 23:24:33 · 1530 阅读 · 0 评论 -
python学习笔记(一):常用数据对象与操作
数据对象对象是python语言中最基本的概念,在python中处理的一切 都是对象。python中有许多内置对象可供编程者使用,内置对象可直接 使用,如数字、字符串、列表、字典等。非内置对象需要导入模块才能使用,如正弦函数sin(x),随机数产生函数random( )等。对象类型类型名称示例简要说明数字int, float, complex1234, 3....原创 2019-11-30 09:02:46 · 1105 阅读 · 0 评论