自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (1)
  • 收藏
  • 关注

原创 如何给自己动手做一个拥有绝对掌控权的外卖小程序

自己开了一个小店,想要接入线上平台,实现外卖点单的功能,怎么搞呢?可能封面已经告诉你了……一、加入美团爸爸,这应该是最普遍的办法。从本质上来看,饿了么、美团这两个平台都属于流量平台,其自身拥有着强大用户体系和完善的运营体系。而所谓的平台流量就是平台自身手握众多资源,例如淘宝、京东、饿了么、美团、滴滴等平台都属于平台自身掌握着流量。然鹅,在享受流量福利的同时我得接受:...

2020-03-05 18:11:13 825

原创 pyinstaller无法打包含requests库

源文件运行正常,用pyinstaller打包成exe文件发现无法运行简单的爬虫程序,包含有requests和pandas库,由于源文件运行正常,经过打包逐块测试,发现无法使用requests。解决办法由于是好久之前写的程序,考虑版本更新,一开始先卸载pyinstaller,安装最新版本,发现还是不行,看官方文档发现是支持requests的,再搜了一下requests的最新版本发现到2.18...

2019-09-27 22:00:01 1360

原创 筛选b站高质量python爬虫视频教程地址合集(含代码)

爬取Python关键词下的1000条播放最多的视频,筛选标题或简介或标签里包含爬虫的结果,剔除时长小于60分钟,和收藏比小于10%,按收藏比排序后得到的结果。筛选结果比较片面,但也可以方便找到自己需要的视频教程了。视频标题播放量收藏播放比视频时长30个小时搞定网络爬虫(全套详细版)带源码433238.27%17452019 黑客编程:安全工具开发7136...

2019-07-21 23:16:30 1741

原创 python抛硬币游戏,统计连续相同多少次的结果有多少次

抛10万次硬币,连续出现10次正面的情况有多少次呢?貌似老师喜欢布置这样的作业呀import numpy as np # numpy 基础数据包 需要安装 pip install numpyfrom collections import Counter # collections 内建统计接口result = [] #result 预设结果集nsteps = 100000 + 1 ...

2019-06-26 22:52:44 1879

转载 理解Numpy中的多维数据对象ndarray

NumPy的ndarray:一种多维数组对象NumPy最重要的一个特点就是其N维数组对象(即ndarray),该对象是一个快速而灵活的大数据集容器。你可以利用这种数组对整块数据执行一些数学运算,其语法跟标量元素之间的运算一样。要明白Python是如何利用与标量值类似的语法进行批次计算,先引入NumPy,然后生成一个包含随机数据的小数组:In [12]: import numpy as np...

2019-06-24 10:51:50 856 1

原创 利用ipython测试代码运行时间

IPython的魔术函数(%time和%timeit)在开发和测试代码的过程中,IPython的魔术函数(%time和%timeit)能够让你轻松得到代码运行时间信息。Python 3.5.2 (v3.5.2:4def2a2901a5, Jun 25 2016, 22:18:55) [MSC v.1900 64 bit (AMD64)]Type 'copyright', 'credits'...

2019-06-24 10:39:32 1036

转载 python3安装和设置

由于人们用Python所做的事情不同,所以没有一个普适的Python及其插件包的安装方案。由于许多读者的Python科学计算环境都不能完全满足本书的需要,所以接下来我将详细介绍各个操作系统上的安装方法。我推荐免费的Anaconda安装包。写作本书时,Anaconda提供Python 2.7和3.6两个版本,以后可能发生变化。本书使用的是Python 3.6,因此推荐选择Python 3.6或更高版...

2019-06-17 00:04:32 356

转载 python+按键精灵实现百度指数数据爬取

百度指数本身已经很好用了,但是如果进行二次整理,需要把原始数据采集下来就不是那么方便了。网页的请求只有一次,需要的具体数据随鼠标的移动变化,所以,常规的requests请求网页,解析网页并不能满足需求,感觉可以使用selenium模拟完成鼠标移动,进而获取数据,但是还没进行实际测试,检查网页源代码,感觉事情并没有那么简单,只好先选择另外一种,比较笨的方法。实测在数据量不大的情况下,效果显著...

2019-06-13 17:08:50 4968

原创 linux下安装scrapy遇到的问题--Is libxml2 installed?解决方法

当前环境:tencent 云主机centos7,python3按照scrapy文档,直接pip3 install scrapyerror: command 'gcc' failed with exit status 1*********************************************************************************Cou...

2019-05-05 21:34:14 1040

原创 git自学记录常用命令备忘

windows git 入门: 创建本地版本库 cmd命令窗口,使用命令git启动git程序 :git cd到一个需要管理的文件夹下 :cd /f/learngit/ 本地版本管理 本地编辑好文件后,添加,并提交 : git add 学习gi...

2019-03-03 00:10:17 155

转载 东方财富网-股吧论坛帖子信息采集

参考网址:http://guba.eastmoney.com/ 采集目标:帖子标题,阅读数、评论数、链接、发布时间代码如下:import requestsfrom bs4 import BeautifulSoupimport timeimport csvimport re#复制请求头head ={'Accept':'text/html,application/xhtml+xml,app...

2018-06-12 11:28:12 9707 6

原创 使用selenium爬取二手房源信息

​​​试了用requests来爬取58,效果不是很好,因为每一个链接地址点击之后,都会生成很多参数,如果不加的话,很快就会跳验证码,所以使用了selenium进行模拟点击,不去管这些参数怎么生成了,实测采集整个城市的信息都很流畅。话不多说,先记录下代码:from selenium import webdriverimport time,re,csvfrom bs4 import Beautif...

2018-05-02 21:45:15 771

《用Python玩转数据》视频教程

本课程主要面向非计算机专业学习者,不局限某个专业和学历层次,需要一些程序设计的基本概念如计算机求解问题的框架和一些如素数判断这样的基本算法,缺少上述基础的同学不用担心,在上课过程中可以根据课程自己进度补充一下相关知识就可以了。 整个课程以Yahoo财经数据为基础,通过构建一个个喜闻乐见的案例,让大家可以以更直观的方式领略Python的简洁、优雅和健壮,同时探讨Python除了在商业领域之外在文学、社会学和新闻等人文社科类领域以及在数学和生物等理工类领域同样拥有便捷高效的数据处理能力,并可以触类旁通将其灵活应用于各专业中。整个课程分5个模块,从Python基本语法开始,到Python中如何从本地和网络上进行数据获取,如何表示数据,再到如何对数据进行基础和高级的统计分析及可视化,到最后如何设计一个简单的GUI界面来表示和处理数据,层层推进。

2018-08-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除