Watersoo-优快云博客

原创基于决策树算法的鸢尾花分类教程

从数据的获取、预处理，到模型的训练和评估，每一步都进行了详细的代码展示和说明。在实际应用中，还可以进一步调整决策树的参数（如最大深度、最小样本数等）来优化模型性能，也可以尝试使用其他分类算法进行对比，以找到最适合数据集的方法。决策树算法是一种简单直观的分类和回归算法，它通过对数据特征的逐步划分来构建树形结构，从而实现对样本的分类。鸢尾花数据集包含 4 个特征（花萼长度、花萼宽度、花瓣长度、花瓣宽度）和 3 个类别（山鸢尾、变色鸢尾、维吉尼亚鸢尾），共 150 条样本。# 对测试集进行预测。

2025-05-14 11:27:33 451

原创 Python网络爬虫实战教程：爬取齐齐哈尔大学官网

print(f"开始爬取: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")writer.writerow(['爬取时间', site_info['crawl_time']])writer.writerow(['网站标题', site_info['title']])writer.writerow(['网站URL', site_info['url']])writer.writerow(['导航链接', 'URL'])

2025-04-23 11:29:21 1377

原创数据分析案例

例如在Python中，可使用pandas库的read_excel()或read_csv()函数来读取Excel或CSV格式的学生信息表。3. 同学所在省份中国地图可视化：需使用pyecharts库，结合中国地图的地理数据，将同学所在省份的数据映射到地图上。map_chart.set_global_opts(title_opts=opts.TitleOpts(title="同学所在省份分布"))◦ 总结：总结在完成此次数据分析和可视化任务中的收获，如对数据处理的新认识，对相关库的使用心得等。

2025-04-07 17:25:09 776

原创借助豆包完成 Python 数据分析与可视化项目教程

popular_products = data.groupby('商品名称')['购买数量'].sum().sort_values(ascending=False).reset_index()sales_by_date = data.groupby('购买日期')['销售额'].sum().reset_index()plt.plot(sales_by_date['购买日期'], sales_by_date['销售额'])data['购买日期'] = pd.to_datetime(data['购买日期'])

2025-04-07 17:19:26 488

原创微信好友昵称数据分析与可视化案例

假设我们已经通过合法途径获取了微信好友昵称数据，保存为`wechat_friends.csv`文件，包含字段：`nickname`(昵称)、`gender`(性别)、`remark`(备注)。print(f"\n使用特殊符号的好友比例: {users_with_symbols.mean()*100:.1f}%")print(f"平均长度: {df['nickname_length'].mean():.2f}")print(f"最短昵称: {df['nickname_length'].min()}")

2025-04-07 16:06:48 552

原创自然语言处理编程

wordcloud.WordCloud().generate(text)：生成词云。django.http.HttpResponse()：处理HTTP请求。collections.Counter(tokens)：统计词频。matplotlib.pyplot.pie()：生成饼状图。统计特定实体：统计文本中的人名、地名和武器，并保存结果。实体统计：显示统计的人名、地名和武器列表，并保存为文件。jieba.lcut(text)：对文本进行分词。seaborn.barplot()：生成柱状图。

2025-03-17 17:08:34 512