自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 机器学习总结

工具库:Python(Scikit-learn、TensorFlow/PyTorch)、数据可视化(Matplotlib/Seaborn)。- 进阶案例:尝试用AutoKeras处理结构化数据(如房价预测)或图像数据(MNIST手写识别)。- 模型评估指标:准确率、精确率、召回率、F1值(分类);- **可视化**:使用Matplotlib绘制真实值与预测值对比图(代码略)。- 基础理论:掌握监督学习(回归/分类)、无监督学习、深度学习核心概念。- 辅助设计:ChatGPT(思路规划、代码框架生成)。

2025-05-14 11:19:11 388

原创 爬虫作品教程

然后在这个 div 元素内,使用 find_all() 方法找到所有 class 为 'bt' 的 a 标签,这些 a 标签包含了每首诗歌详情页的链接和标题信息。使用 open() 函数创建一个名为 诗词爬取.txt 的文本文件,并以写入模式 'w' 打开,设置编码为 'utf-8' ,以便后续将爬取到的诗歌内容写入文件。- 发送请求获取诗歌详情页的内容,同样带上请求头 headers ,并设置响应的编码为 'utf-8'。

2025-04-23 11:25:42 1552

原创 爬虫学习总结

但获取到的代理IP并非全部可用,还需要编写代码对其进行可用性检测,通过发送简单的请求测试IP能否正常工作,筛选出有效的代理IP,构建可用的代理IP池。在数据解析阶段,针对书籍文本的排版特点,准确提取章节标题和正文内容,并进行必要的文本清洗,去除多余的空白字符和HTML标签,最终将爬取到的内容整理成完整的书籍文档进行存储。在近期的爬虫学习过程中,我围绕诗词名句网诗歌爬取、三国演义书籍爬取、代理服务器ip列表爬取以及外网评论爬取等任务展开了实践,收获颇丰,对爬虫技术有了更深入的理解和掌握,现总结如下。

2025-04-23 10:53:52 2174

原创 AI辅助完成Python数据可视化

推荐使用[Kaggle电商销售数据集](https://www.kaggle.com/datasets/kyanyoga/sample-sales-data),包含订单日期、商品类别、销售额、地区等字段。plt.rcParams['font.sans-serif'] = ['SimHei'] # Windows系统。plt.rcParams['font.sans-serif'] = ['SimHei'] # 解决中文乱码。**任务1:绘制月度销售额折线图****任务2:绘制商品类别占比饼图**

2025-04-07 17:38:10 342

原创 微信好友数据分析案例

该项目包括以下功能:保存好友信息到文件中,给好友发送信息,好友性别可视化好友所在省份可视化,所在城市可视化,特殊好友可视化,签名词云化,好友头像集成,人脸识别,好友头像的分类和分析。给该项目加做界面:easggui或者tkinter或者django 。利用pyinstaller打包exe。

2025-04-07 16:42:17 725

原创 自然语言处理

self.btn_file = tk.Button(text="选择文件", command=self.load_file){"人名": ["nr"], "武器": ["weapon"]})| NLP分析系统 || 词频统计 || ---------- 结果展示区 ----------- |原始文本 → 预处理 → 分词 → 统计 → 分析 → 可视化。self.title("NLP分析系统")

2025-03-17 17:32:11 278

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除