
Python
Python学习笔记
山与先生
试错求真
展开
-
Windows10系统turtle安装报错ERROR: Command errored out with exit status 1
Windows 10系统安装Turtle时报错:ERROR: Command errored out with exit status 1File “C:\Users\NN\AppData\Local\Temp\pip-install-uh24l_4m\turtle\setup.py”, line 40except ValueError, ve:^SyntaxError: invalid syntax错误提示setup.py第40行有语法错误。 PyCharm→Setting安装tu原创 2020-05-28 14:39:14 · 1057 阅读 · 0 评论 -
Python手记-12:Python书籍之荐
部门定期购入技术类书籍,为此APP组的同事还开发了“青松借阅”来管理,分享一下Python的基本书籍:《Python金融大数据挖掘与分析全流程详解》入门实践推荐☆☆☆☆☆,配套案例和讲解视频资源齐全,全书共16章,内容涉及Python基础知识、网络数据爬虫技术、数据库存取、数据清洗、数据可视化、数据相关性分析、IP代理、浏览器模拟操控、邮件发送、定时任务、文件读写、云端部署、机器学习等,可以实现舆情监控、智能投顾、量化金融、大数据风控、金融反欺诈模型等多种金融应用,入门的小伙伴们都去看吧!原创 2020-05-19 14:45:28 · 234 阅读 · 0 评论 -
Python手记-11:PyQuery爬取豆瓣电影评论
PyQuery允许对xml文档进行jQuery查询,该API尽可能类似于jQuery,PyQuery使用lxml进行快速的xml和html操作。1.PyQuery简介(1)初始化PyQuery对象包括:字符串初始化、URL初始化、文件初始化# -*- coding: utf-8 -*-# @Author : ChengYu# @File : pyquery_film.py# @Project: Python Notes# @CreateTime : 2020/5/12 8:56:30原创 2020-05-19 09:20:32 · 979 阅读 · 0 评论 -
Python手记-10:Beautiful Soup爬取豆瓣经典书单
1.Beautiful Soup简介Beautiful Soup名字来源于《爱丽丝梦游仙境》,是一个可以从HTML或XML文件中提取数据的Python库,当前版本4.4.0,Beautiful Soup 3目前已经停止开发,官方推荐使用Beautiful Soup 4(简称BS4),官文指路:https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/,不得不说Beautiful Soup官文的可读性秒爆lxml的。Beautiful Soup最主要的功能是.原创 2020-05-11 17:20:10 · 1003 阅读 · 0 评论 -
Python手记-0:PyCharm设置注释模板(Python Script)
用PyCharm新建Python文件时,头部相关注释是重复工作,提高效率一劳永逸:File→Settings→Editor→File and Code Templates→Python Script,输入如下脚本:# -*- coding: utf-8 -*-# @Author : ChengYu# @File : ${NAME}.py# @Project: ${PROJECT_NAM...原创 2020-05-08 15:43:19 · 891 阅读 · 0 评论 -
Python手记-9:Python LXML库XPath的爬取晋江书目
1. lxml库lxml是功能最丰富且易于使用的库,用于处理Python语言中的XML和HTML,还可实现WEB爬取,官文参考:https://lxml.de/,完整的PDF文档下载链接https://lxml.de/lxmldoc-4.5.0.pdf,但是阅读起来……em……怪自己不够聪明的样子。Linux下安装lxml库:[root@chengyu ~]# pip3 instal...原创 2020-05-07 15:33:36 · 37999 阅读 · 3 评论 -
Python手记-7:爬虫初体验-Requests库与re库的使用
学习内容: Requests库 正则表达式re库 heads参数 findall()、append()、sub()、split()、strip()函数 枯燥学习好几天,今天就拿即将学习的知识中的案例来提升一下学习的热情,百度资讯搜一波热词“罗志祥”,参考《Python金融大数据挖掘与分析》书中的案例:# -*- coding: utf-8 -*- #...原创 2020-04-27 09:09:50 · 786 阅读 · 0 评论 -
Python手记-5:Python入门基础
官方宣布,截至2020 年01月01日,Python2已停止更新,Python 2.7是Python 2.x最后的版本。关于Python 3.x 版本与Python 2.x之间的区别可以参考:https://www.runoob.com/python/python-2x-3x.html。关于Python编码规范参考:https://zh-google-styleguide.readthedoc...原创 2020-04-21 17:35:23 · 422 阅读 · 0 评论 -
Python手记-4:Anaconda spyder启动异常Spyder crashed during last session
Spyder 4.0.1运行关闭时没有保存脚本,再次打开弹出:按照上图给出的解决方案打开powershall prompt执行:spyder --reset重启Spyder:呃,顽疾仍在:anaconda对于python版本的管理还是很方便的,所以这里用anaconda才实现32位和64位python共存今天需要调用一个dll动态函数库,但是本地的python...原创 2020-04-15 09:52:42 · 1428 阅读 · 0 评论 -
Python手记-3:Anaconda、Pycharm下NumPy、Pandas库安装
本案例中工具版本说明:Anacond 3(个人版)、Python 3.8.2(专业版)、Pycharm 2019.3.4关于NumPy简介移驾:http://www.numpy.org/关于pandas简介移驾:https://pandas.pydata.org/docs/getting_started/overview.htmlNumPy库是pandas库的基础,它们主要用于完成数据...原创 2020-04-14 17:29:29 · 6816 阅读 · 1 评论 -
Python手记-8:python一次性爬取多页数据并存入CSV文件
1. 一次性爬取多页豆瓣绘本数据Python手记-7中实现了单页爬取数据,本节来试试多页数据爬取,案例背景为豆瓣图书网页实现绘本的多页数据爬取,先看看网址信息:复制出来:第一页:https://book.douban.com/tag/%E7%BB%98%E6%9C%AC?start=0&type=T第二页:https://book.douban.com/tag/%E7%...原创 2020-04-29 16:17:24 · 8001 阅读 · 3 评论 -
Python手记-6:爬虫技术基础(网页结构基础+MySQL 8.0+Redis 5安装)
爬虫分步:抓取页面、分析页面、存储数据。1.抓取页面1.1 网页结构基础以Google Chrome浏览器为例,F12键或者右键“查看网页源代码”即可查看当前的网页源代码。通过“选择”按钮和“Elements”选项卡可以获取网页指定区域的源代码文本格式及位置信息,另外结合google analytics对目标网页进行访问数据统计和分析,感兴趣的可以了解下。1.2 HTML...原创 2020-04-23 15:57:31 · 294 阅读 · 0 评论 -
Python手记-2:Python IDE之PyCharm安装简介
1.前言集成开发环境(IDE,Integrated Development Environment )是用于提供程序开发环境的应用程序,一般包括代码编辑器、编译器、调试器和图形用户界面等工具。集成了代码编写功能、分析功能、编译功能、调试功能等一体化的开发软件服务套件。Python IDE款类众多,随便搜搜就是“10种”或者“8种”的推荐款,功能大同小异,具体到个人的选择完全看个人习惯和喜好...原创 2020-04-02 15:54:26 · 484 阅读 · 0 评论 -
Python手记-1:Windows10、macOS、CentOS7平台下Python3环境搭建简介
目录1.Windows 102.macOS3.Linux(CentOS7)首先去Python大本营—https://www.python.org/溜达一圈:你想要的源代码、官方文档资源一应俱全,pick当前最in版本3.8.2(最原始的可供下载的版本2.0.1),在Windows10、macOS、 Linux环境下都试一遍,因为懒所以没来得及详读官文就在广大网友的爽文下一知半解先简...原创 2020-04-01 11:54:18 · 413 阅读 · 0 评论