- 博客(12)
- 收藏
- 关注
原创 快速从frame中提取出满足某列特征值的子frame函数
有的时候我们需要经常从一个frame中提取子集,这个子集可能是frame中满足某列中某个值的子集。虽然这种提取子集的方法我们可以通过pandas中的条件索引和布尔索引实现,但如果需要重复多次提取子集,还是会比较麻烦的,所以我写了一个函数,其功能是快速返回一个frame中符合某列某值条件子frame。
2022-11-21 23:48:31
416
原创 近期零碎知识点汇总
简单总结一下近期在进行任务处理时用到的各种零碎方法,涉及pandas、re。后续有时间会对这次博客中提到的零碎方法进行补充更新
2022-11-03 11:54:48
302
原创 python爬虫入门——requests库、BeautifulSoup库和re库
对于大多数网页,如果它们的页面是由html代码静态生成的,那么我们可以通过访问网页的源代码,即网页对应的html文档内容,从文档中解析出我们想要的内容,然后将其摘录下来,存储在一定的数据结构中
2022-10-22 10:37:53
1847
原创 python爬虫入门——html(xml)语言知识
简单的python爬虫程序能够让用户从一个或多个网页中提取想要的信息。由于我最近需要爬取某个网页资源信息,所以开始入门python爬虫类的相关知识
2022-10-15 17:15:32
595
原创 sklearn中分类器的多数量快速训练与可视化
在处理分类任务时,需要构建一个合适的分类器,而如何确定一个合适的分类器是比较耗时耗力的过程。这里从sklearn的官方文档获得启发,快速遍历不同的分类器进行分类任务,并进行评价得分和可视化展示。
2022-10-07 12:29:08
2353
原创 关于python中函数的浅议
函数的本质是接收一些参数,对参数进行特定规则的处理,最终输出一些结果。python中的函数能够帮助用户快速完成程序化的工作,灵活地组合运用函数则能够完成多样化的任务。python的函数支持接收一系列参数,并对系列参数在函数体中进行加工,最终返回一些结果
2022-10-05 17:01:29
300
原创 sklearn中随机森林和梯度提升树的一维回归比较
随机森林和梯度提升树都是集成评估器,它们由许多基评估器组成,而两种集成评估器的训练模式有所不同,前者是独立训练多个基评估器,基于它们结果的平均做出最终评价;后者则在每次训练中有所侧重,目的是降低集成评估器的偏差,最终将多个较弱的基评估器整合成一个强大的集成评估器
2022-09-28 20:24:28
632
原创 关于matplotlib中自定义函数快速绘图的浅议
虽然matplotlib提供了许多快捷绘图函数和方法,但是每个人的绘图风格和思路总有特异化的规律,在我长时间地使用堆砌代码的方式进行绘图后,开始尝试一种个性度更高、绘图更快捷并且更为灵活的方式
2022-09-24 19:27:34
943
原创 pandas中合并数据的concat()方法
除了merge函数外,pandas还提供了concat函数对dataframe或series进行数据链接。与merge函数不同的是,concat函数更侧重于在原dataframe(series)进行数据的直接添加。
2022-09-12 23:46:08
568
原创 sklearn中特征的方差过滤法:VarianceThreshold()简述
sklearn中特征的方差过滤法:VarianceThreshold()简述
2022-09-12 16:50:33
8693
2
原创 pandas合并Dataframe或Series操作——merge()函数_1
pandas中合并dataframe的操作,merge()函数的用法。
2022-09-09 22:50:10
3054
1
翻译 Matplotlib中Object-oriented方法绘图流程tutorial——基于官方文档案例
Matplotlib中Object-oriented绘图方法实例。
2022-09-02 13:58:41
488
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人