自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

半城之北的博客

一般都是平日里的实践记录

  • 博客(20)
  • 收藏
  • 关注

原创 常用的开源数据集网站

这些开源数据集网站提供了丰富的数据资源,可以满足各种需求,包括机器学习、数据分析、科研等。请在使用这些数据集时,注意遵守相关的数据使用规定和法律法规,并尊重数据提供者的权益。

2024-06-22 10:09:36 3382 1

原创 利用 Python 自动抓取微博热搜,并定时发送至邮箱

需要获取User-Agent、Accept、Accept-Language、Accept-Ecoding、Cookie五个字段,前四个字段可能都是相同的,主要是Cookie不同。

2024-03-13 16:41:40 1834

原创 豆瓣电影Top250

在先前的基础上,获取每部电影的导演、编剧、主演、类型、上映时间、片长、评分人数以及剧情简介等信息,并将获取到的信息保存至本地文件中。在先前创建的项目webCrawler下的doubanCrawler文件夹中创建downloadTop250.py。,获取每部电影的中文片名、排名、评分及其对应的链接,按照“排名-中文片名-评分-链接”的格式显示在屏幕上。例如:要获取《肖申克的救赎》电影的导演,将鼠标移至该电影的导演处,右击鼠标出现。

2024-03-13 16:31:44 1416

原创 一键掌握:道客巴巴文档高效下载全攻略,无需积分轻松获取学习资料

道客巴巴文档的下载攻略

2024-03-11 22:40:32 8346 2

原创 Kettle Node.js

如:https://nodejs.org/dist/v18.18.0/node-v18.18.0-x64.msi。这个要用迅雷下载,从迅雷的下载服务器的获取镜像。

2024-03-08 23:34:07 402 1

原创 我的RPA

机器人流程自动化(Robotic Process Automation,RPA)

2024-03-08 23:29:17 521 2

原创 Trackers 列表集合

这个项目每天都会更新BitTorrent Tracker 列表。整合了全网热门 Tracker,经过筛选过滤,最终得到了一个优质的 Tracker 列表。

2024-03-08 22:52:12 13468 1

原创 在线LaTeX公式编辑器

【代码】在线LaTeX公式编辑器。

2024-03-08 22:15:50 455 1

原创 轻量级Web富文本编辑器——wangEditor

最近在优快云写博文,被它的富文本编辑器折磨到了。

2024-02-19 17:00:23 558 1

原创 解决Realtek Audio、Control Center 3.0的故障

解决Realtek Audio、Control Center 3.0的故障

2024-02-19 15:24:33 9831 2

原创 博客搭建的随记

随着技术发展,现代静态站点生成器正逐渐弥合与动态系统的差距。

2024-02-18 02:28:43 394

原创 关于Python的电影信息爬取与数据可视化分析报告

课程的实验报告,内容参考了某篇论文,整理的时候找不到出处了。也用了GPT辅助写作,整个实验报告仅供图一乐。代码隐藏了具体的网址,有需要可以私信。

2024-02-13 23:30:48 5227 3

原创 HBase安装过程记录

这个bash脚本的主要作用是在集群环境里自动化下载和安装HBase到指定目录,并配置为分布式模式运行。

2024-02-11 17:41:02 419 1

原创 Hadoop分布式集群安装过程记录

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统( Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System)。

2023-10-30 00:43:28 120 2

原创 xsync集群分发脚本

提前配置好SSH免密登陆。

2023-10-26 17:36:58 112

原创 ZooKeeper安装过程记录

ZooKeeper安装过程记录,可作为Bash Shell脚本用来快速部署

2023-10-26 09:13:20 131

原创 使用Java API操作HDFS

使用Java API操作HDFS的三个简单例子,上传、下载、查看文件。

2023-10-25 15:12:26 135 1

原创 数据分析时遇到的错误记录

pandas使用过程中的错误

2023-09-23 22:19:30 1981 1

原创 基于Python的网络爬虫——猫眼电影TOP100

【代码】基于Python的网络爬虫——猫眼电影TOP100。

2023-06-07 15:14:25 2838 2

原创 基于Python的顺序表实现一元多项式相加

第1个多项式: [[2.0, 3], [3.2, 5], [-6.0, 1], [10.0, 1]]第2个多项式: [[6.0, 1], [1.8, 5], [-2.0, 3], [1.0, 2], [-2.5, 4], [-5.0, 1]]最后输出文件abc.out。

2023-04-16 02:32:32 1055 3

电影,国内外电影信息数据集

将近3000条数据,包含有Video_Name_CN(中文译名),Video_Name(原名),Video_Address(国家),Video_Type(类型),Video_Language(语言),Video_Date(上映时间),Video_Number(评分),Video_Time(时长),Video_Director(导演),Video_Cast(演员表),这些基础信息。

2023-06-07

猫眼电影Top100.csv

猫眼电影TOP100榜里的数据

2023-06-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除