- 博客(6)
- 收藏
- 关注
原创 基于决策树算法的鸢尾花分类教程
从数据的获取、预处理,到模型的训练和评估,每一步都进行了详细的代码展示和说明。在实际应用中,还可以进一步调整决策树的参数(如最大深度、最小样本数等)来优化模型性能,也可以尝试使用其他分类算法进行对比,以找到最适合数据集的方法。决策树算法是一种简单直观的分类和回归算法,它通过对数据特征的逐步划分来构建树形结构,从而实现对样本的分类。鸢尾花数据集包含 4 个特征(花萼长度、花萼宽度、花瓣长度、花瓣宽度)和 3 个类别(山鸢尾、变色鸢尾、维吉尼亚鸢尾),共 150 条样本。# 对测试集进行预测。
2025-05-14 11:27:33
451
原创 Python网络爬虫实战教程:爬取齐齐哈尔大学官网
print(f"开始爬取: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")writer.writerow(['爬取时间', site_info['crawl_time']])writer.writerow(['网站标题', site_info['title']])writer.writerow(['网站URL', site_info['url']])writer.writerow(['导航链接', 'URL'])
2025-04-23 11:29:21
1377
原创 数据分析案例
例如在Python中,可使用pandas库的read_excel()或read_csv()函数来读取Excel或CSV格式的学生信息表。3. 同学所在省份中国地图可视化:需使用pyecharts库,结合中国地图的地理数据,将同学所在省份的数据映射到地图上。map_chart.set_global_opts(title_opts=opts.TitleOpts(title="同学所在省份分布"))◦ 总结:总结在完成此次数据分析和可视化任务中的收获,如对数据处理的新认识,对相关库的使用心得等。
2025-04-07 17:25:09
776
原创 借助豆包完成 Python 数据分析与可视化项目教程
popular_products = data.groupby('商品名称')['购买数量'].sum().sort_values(ascending=False).reset_index()sales_by_date = data.groupby('购买日期')['销售额'].sum().reset_index()plt.plot(sales_by_date['购买日期'], sales_by_date['销售额'])data['购买日期'] = pd.to_datetime(data['购买日期'])
2025-04-07 17:19:26
488
原创 微信好友昵称数据分析与可视化案例
假设我们已经通过合法途径获取了微信好友昵称数据,保存为`wechat_friends.csv`文件,包含字段:`nickname`(昵称)、`gender`(性别)、`remark`(备注)。print(f"\n使用特殊符号的好友比例: {users_with_symbols.mean()*100:.1f}%")print(f"平均长度: {df['nickname_length'].mean():.2f}")print(f"最短昵称: {df['nickname_length'].min()}")
2025-04-07 16:06:48
552
原创 自然语言处理编程
wordcloud.WordCloud().generate(text):生成词云。django.http.HttpResponse():处理HTTP请求。collections.Counter(tokens):统计词频。matplotlib.pyplot.pie():生成饼状图。统计特定实体:统计文本中的人名、地名和武器,并保存结果。实体统计:显示统计的人名、地名和武器列表,并保存为文件。jieba.lcut(text):对文本进行分词。seaborn.barplot():生成柱状图。
2025-03-17 17:08:34
512
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人