- 博客(84)
- 资源 (5)
- 收藏
- 关注

原创 51job开启多线程迅速抓取信息,速度提升十倍!!!
# 51job多线程import requestsimport chardetfrom bs4 import BeautifulSoupimport csvfrom openpyxl import Workbookimport randomimport timeimport threadingfrom selenium import webdriverimport timeimport xlwtimport csvimport pandas as pdfrom selenium.
2021-01-23 10:29:14
249
2

原创 一键获取前程无忧招聘信息,并存储到excel中,全程只需要输入职位名称(51job 你要的自动化 这里全都有~~~)
一键获取前程无忧招聘信息(51job 你要的自动化 这里全都有~~~)代码可直接运行哦
2021-01-16 19:50:34
676

原创 设计师们的福音,二十行代码破解pexels反爬,轻松get高质量图片(全自动化操作,高清大图,且免费使用)
二十行代码破解pexels反爬,轻松get高质量图片(开心到飞起,画质超高!!!)
2020-12-23 18:45:40
699
4

原创 用selenium获取动态简书加载的(阿贾克斯)信息,一键自动化操作......(香~)
用selenium获取动态加载的(阿贾克斯)信息,一键自动化操作......(香~)
2020-12-04 16:46:09
290

原创 通过python开启线程,获取网页数据并远程访问云服务器,持久化存储到Mysql跟mongodb数据库中
- ubuntu下mysql/mongodb的安装以及开启远程连接- 网页静态数据的抓取- 通过python的来远程访问操作云服务器上的mysql/mongodb)
2020-11-09 16:10:50
377

原创 数据分析三剑客:Numpy、Pandas、Matplotlib(你想看的这里都有,超详细版本)
写在前面的话:一直以来,笔者都非常想尝试将所学的知识体系化从而搭建出一名数据分析师应该具备的知识框架与数据处理能力,三剑客将是这条路的起点,本文为笔者原创,耗费近一周左右的私人时间,原创不易,希望读者盆友们多多指正,时间有限,文中出现的错误也希望大家指正,最后,本文的源码跟数据集笔者已放至微信公众:天玄小屋,有需要的盆友可自便。
2020-10-30 21:15:56
957

原创 分分钟避坑抓取 安居客 住房信息,并存储到CSV跟XlSX中去.........
python csv存储避坑,出现自动空白行,将参数newline设置为’ ‘ 即可!
2020-10-28 00:31:04
549
2

原创 一键抓取史上最牛 wall paper ----wallhaven
全程使用BeautifulSoup完成简述思路后直接上代码新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入简述思路后直接上代码首先我们观察发现该网站的基盘网址主要分为翻页与type两大部分,对于翻页可直接用for循环解决
2020-09-22 15:11:25
1727

原创 python大全终结篇
Python 机器学习——基础必看:函数Lambda 表达式类与对象魔法方法函数函数的定义函数以def关键词开头,后接函数名和圆括号()。函数执行的代码以冒号起始,并且缩进。return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。函数的调用【例子】def printme(str): print(str)printme("我要调用用户自定义函数!") printme("再次调用同一函数") temp = pr
2020-09-05 23:59:10
194

原创 Python基础(容器类型大整合,全网最全)
Python入门(中)简介Python 的常见容器类型:列表、元组、字符串、字典、集合内容大纲:列表元组字符串字典集合序列列表1. 列表的定义列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对象用逗号将每个元素一一分开2. 列表的创建创建一个普通列表【例子】x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']print(x, type(x))['
2020-09-03 23:08:41
1299

原创 Python基础整理大全——01
Python基础入门:从变量到异常处理--阿里云天池录学习内容**1、 变量、运算符、变量类型****2、 掌握条件语句****3、 掌握循环语句****4、异常处理**学习时间学习产出与总结学习内容1、 变量、运算符、变量类型1.1变量1.1.1 注释:#、‘’‘ ’‘’#这是一个注释'''print("Hello World!")'''1.1.2运算符*1.1.2 :算术运算符(+、-、、/、//、%) '''在这里呢,玄宝发现算术运算符就包括了常见的四则运算+、-、
2020-08-28 23:14:58
434

原创 爬虫!教你用python里的json分分钟爬取腾讯招聘动态网站求职信息!(结构化数据)
爬虫!教你用python里的json分分钟爬取腾讯招聘动态网站求职信息!(结构化数据)人生苦短,我用python
2020-03-26 22:57:01
1099
原创 HIVE 安装与部署(一路通畅)
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pSuy9wGP-1685593445058)(Hive3安装.assets/image-20201109145136486.png)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3vjqE28B-1685593445059)(Hive3安装.assets/image-20201109145621381.png)]此信息类似于计数器 用于告知用户插入数据的相关信息 但是不影响程序的正常执行。
2023-06-01 12:25:02
536
原创 8、【文本分析】之TF-IDF、LDA主题模型的实战演练进行数据向量化(并用贝叶斯进行新闻分类)
8、【文本分析】之TF-IDF、LDA主题模型的实战演练进行数据向量化(并用贝叶斯进行新闻分类)
2022-06-19 17:04:39
509
原创 7、【贝叶斯算法】之实现一个简单的拼写纠正补全器
* P(c), 文章中出现一个正确拼写词 c 的概率, 也就是说, 在英语文章中, c 出现的概率有多大* P(w|c), 在用户想键入 c 的情况下敲成 w 的概率. 因为这个是代表用户会以多大的概率把 c 敲错成 w* argmaxc, 用来枚举所有可能的 c 并且选取概率最大的...
2022-06-19 09:20:39
204
原创 6、【集成学习】之bagging、boosting、stacking浅析
6、【集成学习】之bagging、boosting、stacking浅析
2022-06-19 07:32:10
206
原创 5、【Grid_Search-K折合交叉验证】使用网格搜索进行k折合交叉验证寻找最佳算法参数组合
上次案例中,通过手动写K折合交叉验证找出了最佳参数,然而在最终预测结果上并不理想,故此处使用sklearn自带的Grid_Search库进行搜索。
2022-06-18 09:03:19
316
原创 4、【逻辑回归】信用卡欺诈检测(下采样、SMOTE,调整sigmod函数阈值)
对于一个二分类问题,首先想到的还是逻辑回归!(我愿称逻辑回归为最nb的二分类算法,目前为止)
2022-06-16 19:23:11
1020
原创 2、【数据特征预处理】(接上一章特征抽取即转文本数据为数值数据后,特征的标准化、缺失值处理以及特征值选择)
机器学习预处理详细流程,理论+demo
2022-06-12 11:35:08
179
原创 将dataframe转换为图片保存
import dataframe_image as dfidf = pd.DataFrame()dfi.export(df, "test.png")
2022-03-22 23:26:43
1892
原创 利用鸢尾花数据集对比贝叶斯分类器跟决策树的分类情况 (非二元分类 三分类问题)
对于这样一个简单的三分类问题,我打算直接采用2.5:7.5的划分并用贝叶斯跟决策树分别训练对比分类效果,详细步骤如下:
2022-03-21 11:04:02
2933
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人