- 博客(20)
- 收藏
- 关注
原创 常用的开源数据集网站
这些开源数据集网站提供了丰富的数据资源,可以满足各种需求,包括机器学习、数据分析、科研等。请在使用这些数据集时,注意遵守相关的数据使用规定和法律法规,并尊重数据提供者的权益。
2024-06-22 10:09:36
3382
1
原创 利用 Python 自动抓取微博热搜,并定时发送至邮箱
需要获取User-Agent、Accept、Accept-Language、Accept-Ecoding、Cookie五个字段,前四个字段可能都是相同的,主要是Cookie不同。
2024-03-13 16:41:40
1834
原创 豆瓣电影Top250
在先前的基础上,获取每部电影的导演、编剧、主演、类型、上映时间、片长、评分人数以及剧情简介等信息,并将获取到的信息保存至本地文件中。在先前创建的项目webCrawler下的doubanCrawler文件夹中创建downloadTop250.py。,获取每部电影的中文片名、排名、评分及其对应的链接,按照“排名-中文片名-评分-链接”的格式显示在屏幕上。例如:要获取《肖申克的救赎》电影的导演,将鼠标移至该电影的导演处,右击鼠标出现。
2024-03-13 16:31:44
1416
原创 Kettle Node.js
如:https://nodejs.org/dist/v18.18.0/node-v18.18.0-x64.msi。这个要用迅雷下载,从迅雷的下载服务器的获取镜像。
2024-03-08 23:34:07
402
1
原创 Trackers 列表集合
这个项目每天都会更新BitTorrent Tracker 列表。整合了全网热门 Tracker,经过筛选过滤,最终得到了一个优质的 Tracker 列表。
2024-03-08 22:52:12
13468
1
原创 解决Realtek Audio、Control Center 3.0的故障
解决Realtek Audio、Control Center 3.0的故障
2024-02-19 15:24:33
9831
2
原创 关于Python的电影信息爬取与数据可视化分析报告
课程的实验报告,内容参考了某篇论文,整理的时候找不到出处了。也用了GPT辅助写作,整个实验报告仅供图一乐。代码隐藏了具体的网址,有需要可以私信。
2024-02-13 23:30:48
5227
3
原创 Hadoop分布式集群安装过程记录
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统( Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System)。
2023-10-30 00:43:28
120
2
原创 基于Python的顺序表实现一元多项式相加
第1个多项式: [[2.0, 3], [3.2, 5], [-6.0, 1], [10.0, 1]]第2个多项式: [[6.0, 1], [1.8, 5], [-2.0, 3], [1.0, 2], [-2.5, 4], [-5.0, 1]]最后输出文件abc.out。
2023-04-16 02:32:32
1055
3
电影,国内外电影信息数据集
2023-06-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人