
python
大海怪
数据可视化、数据分析、机器学习
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
正则表达详解
python正则表达式详解 博客主页:https://blog.youkuaiyun.com/weixin_43897615 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。可以使用事先定义好的⼀些特定字符、及这些特定字符的组合,组成⼀个“规则字符串”,这个“规则字符串”⽤来表达对字符串的⼀种过滤逻辑。 正则表达式是一种小型的、高度专业化的编程语言,(在Python中)它...原创 2020-04-15 13:47:13 · 1063 阅读 · 3 评论 -
RF特征选择
随机森林特征选择 特征选择的意义: 这可以通过使用重要性分数来选择要删除(最低分数)或要保留的功能(最高分数)来实现。这是一种特征选择,可以简化正在建模的问题,加快建模过程(删除要素称为尺寸缩减),在某些情况下,可以提高模型的性能,并且提高模型的范化能力。 随机林特征重要性: 随机林是最受欢迎的机器学习方法之一,因为它们的精度、鲁棒性和易用性都比较好。它们还提供两种简单的特征选择方法:均值减少杂质...原创 2020-04-14 15:25:53 · 2878 阅读 · 0 评论 -
APScheduler
定时任务框架APScheduler 文章目录定时任务框架APScheduler安装概念调度流程cron 任务 最近由于要用到定时任务, 因此对APScheduler做了总结 操作系统一般都会自带定时任务,但是使用APScheduler可以进行更加高度定制的控制。 apscheduler 使用起来十分方便。提供了基于日期、固定时间间隔以及crontab 类型的任务,我们可以在主程序的运行过程中快...原创 2020-04-02 23:00:29 · 11185 阅读 · 6 评论 -
爬虫
文章目录爬虫第一讲一、爬虫定义二、爬虫分类三、HTTP协议和HTTPs协议四、爬虫的一般流程五、响应状态码 爬虫第一讲 一、爬虫定义 网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟客户端发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序。 二、爬虫分类 通用爬虫 :通常指搜索引擎的爬虫,比如google, 百度,搜狗这样的爬取整个互联网 聚焦爬虫,针对特定网站进行爬取,...原创 2020-03-25 13:18:56 · 1878 阅读 · 4 评论