
Python
Python基础、爬虫以及一些小工具
遇见0和1
不畏将来,不念过往,如此安好......
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python字典排序与取值
前言一个非本专业的坑货,让我帮做的一道Python题,还很无chi 的那啥希望我帮写注释,简直不能忍 (〃´皿`)q…最后,我为了维护时间的和平,就当复习一下Python知识了。题目题目都懒得打,直接截他发给我的图片源代码每一行都写注释了,就不分析什么鬼了#定义一个 find_max_and_min 函数def find_max_and_min(stock_dict): ...原创 2020-03-06 21:47:50 · 1291 阅读 · 0 评论 -
用Python分析上海的楼盘信息并进行数据可视化
前言好久不写爬虫了,深夜想买房 不~我不想。我就是去看了一下上海的新楼盘信息,明白一个道理…“现在我买不起(╬ ̄皿 ̄)”!运行结果先看一下运行后的效果,有兴趣再往下看~虫子开始了目标网址:https://sh.newhouse.fang.com/house/s/b91/?ctm=1.sh.xf_search.page.1 如下所示,我们需要拿到每个楼盘的name和价格本来想像下面那...原创 2020-02-26 00:41:38 · 890 阅读 · 0 评论 -
Python百度AI语音识别——文字转语音
接上一篇内容,这次利用百度AI提供的语音合成api,将爬取到的小说文字数据转化为音频数据。需要有一个百度账号,然后再创建一个语音合成的应用,参照官方python调用百度语音合成api接口详细文档(可参照我另一篇博客:Python实现简单截图识别获取文字信息 这里不再详细说明)创建一个百度AI语音识别应用(免费的)官方网址:https://ai.baidu.com/tech/speech点击立...原创 2020-01-09 20:13:34 · 6029 阅读 · 6 评论 -
Python爬取小说实例
前言这里以笔趣阁中的一部小说(https://www.biduo.cc/biquge/40_40847/)为例,将每一章的内容爬取下来保存到本地。特别声明:该分享仅供参考与学习使用,请勿用于其他商业等非法用途,如有侵权请联系我删除该博文!如下是我们要爬取的小说目录先看源码import requestsfrom lxml import etreeurl = "https://www...原创 2020-01-06 12:53:49 · 4649 阅读 · 10 评论 -
Python实现简单截图识别获取文字符号信息
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.youkuaiyun.com/weixin_42365530有时候我们百度出来一些自己需要信息后,想要直接复制粘贴(借鉴借鉴),提升工作效率,比如学校要求写什么加油稿,期末总结,思想汇报啊…额~,被请去办公室喝茶了,到时别说是博主教的啊!但是百度文库经常会限制我们复制...原创 2019-11-10 21:13:19 · 3862 阅读 · 7 评论 -
pygal的简单应用:利用pygal库分别绘制雷达图、柱状图和折线图
在Python中,pygal 是一个常用数据可视化的数据图库,它以面向对象的方式来创建各种数据图,而且使用 pygal 可以非常方便地生成各种格式的数据图,包括 PNG、SVG、JPG 、GIF等。使用 Pygal 也可以生成 XML etree、HTML 表格…这次简单分享利用pygal库分别绘制雷达图、柱状图和折线图三种基本图形先看一下三个运行效果图:今天只讲pygal模块的简单应...原创 2020-01-04 20:56:36 · 1757 阅读 · 0 评论 -
数据处理常用方法及示例——Python数据清洗
Python用request获取到的网页数据常常要经过筛选处理,转化为我们需要的数据之后再保存到本地,但有些数据过于杂乱要经过多步处理才能转化为我们所需的数据,其实这也算是一种反爬措施。今天总结一些常用的数据处理方法,涉及到 re 正则库和 xpath(lxml库)语法一、str.replace() ---- 替换描述Python中 replace() 方法把字符串中的 old(旧字符串) ...原创 2019-12-15 22:00:08 · 887 阅读 · 0 评论 -
关于Python在安装库(pip install xxx)时的常见问题以及解决方法
Python提供了很多的库(也可称模块、框架),使用起来也非常的方便,相对来说它也极大的减少了我们的代码量,但在安装我们所需要的库时,经常会出现一些问题导致安装失败。常见的问题主要是:安装超时(raise ReadTimeoutErrorself._pool, None, ‘Read timed out.’)和提示“找不到满足要求的版本(ERROR: Could not find a versio...原创 2019-12-10 18:18:35 · 2891 阅读 · 2 评论 -
Python爬虫+数据清洗+数据可视化基础案例
最近迷上了Python爬虫,我们的hadoop课程也正好涉及到了这个内容,所以就想结合课程内容(爬取京东手机评论https://item.jd.com/100003060627.html#crumb-wrap)写一篇关于python爬虫到数据可视化的完整流程打开网站https://item.jd.com/100003060627.html#crumb-wrap检查...原创 2019-12-04 22:56:52 · 22923 阅读 · 4 评论