- 博客(6)
- 收藏
- 关注
原创 pandas对dataframe的两列取交集并集
输入:一个dataFrame,其中的两列是集合。输出:对两列合并成新的一列,内容为两列的交集。
2022-10-17 23:11:12
2368
原创 基于ERNIE的汽车之家评论多标签分类
给定用户购车后关于“最满意的一点”的文字评论,输出该评论描述的是【空间、动力、油耗、外观、内饰、舒适性、操控感、性价比】中的哪几个维度。
2022-10-07 17:10:09
696
原创 利用conda批量安装包
利用conda批量安装包今天做事碰到这么一个需求:我用的IDE是Spyder,包管理工具是conda,并且我已经在电脑A上把代码调通了,需要迁移到新电脑B上运行,怎么样快速配置好环境呢?这里采用的解决方案是共享环境。具体做法如下:第一步,电脑A上保存当前的环境。此处的envName自行替换成相应的虚拟环境名,envName.yaml可随意命名。conda activate envNameconda env export > envName.yaml第二步,将envName.yaml复制到
2021-06-30 19:45:54
6320
原创 利用爬虫获取免费IP代理
项目目标通过爬虫获取“西拉代理”(http://www.xiladaili.com)上的高匿代理,并储存至一个列表。项目分析首先对网页进行观察,主体内容如下图所示。不但指明了代理IP、协议类型,还有存活时间、打分这些数据。有需要的朋友,可以根据存活时间、打分来有选择性地挑选一些代理,这样获得的代理更加稳定。我仅展示最朴素的方法,即爬取网页上的所有代理。网页下方有翻页按钮,点击不同页码,可以看到网页url也是非常有规律地在变动。一看到这么规整的数据展示,就想到了表格。我们打开浏览器的开发者模式
2021-06-25 20:39:50
2183
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人