- 博客(7)
- 收藏
- 关注
原创 Hadoop学习心得
在搭建伪分布式和完全分布式环境的过程中,我踩过不少坑,比如SSH免密配置、防火墙问题、配置文件参数错误等,这些经历反而让我对Hadoop各组件的依赖关系和运行原理有了更直观的感受。这段Java代码的作用是配置和设置一个基于Hadoop MapReduce框架的作业,包括设置作业的配置信息、Mapper和Reducer类、数据类型、分区信息以及输入输出路径等,并提交作业等待其执行完成,目的是实现一个特定的分布式数据处理任务(如排序等,从作业名称"luo sort"推测)
2025-12-25 14:39:47
555
原创 Python数据可视化
{ name: "温度", data: [7.0, 6.9, 9.5, 14.5, 18.2, 21.5, 25.2, 26.5, 23.3, 18.3, 13.9, 9.6] },categories: ["一月", "二月", "三月", "四月", "五月", "六月", "七月", "八月", "九月", "十月", "十一月", "十二月"],"玩具与爱好": "#f76262",{ name: "电子产品", value: 400 },{ name: "服装", value: 300 },
2025-10-25 17:10:16
560
原创 python任务5.4脱发因素分析及预测
import pandas as pdimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.model_selection import train_test_split #划分训练集和测试集from sklearn.ensemble import RandomForestClassifier #随机森林from sklearn.preprocessing import LabelEncoder from sklearn.
2025-06-26 16:02:23
1626
原创 python任务5.3分类
plt.rcParams['axes.unicode_minus']=False #设置负轴符号显示问题。mpl.rcParams['font.family']='SimHei'# 设置中文显示问题。'Diastolic blood pressure':'舒张压','Systolic blood pressure':'收缩压',plt.title(f'{col_name}箱线图')'Blood sugar':'血糖','Heart rate':'心率','CK-MB':'肌酸激酶同工酶',
2025-06-19 16:33:49
755
原创 项目5.2【订单数据分析和聚类】
L = (data.groupby('用户名')['付款时间'].max() - data.groupby('用户名')['付款时间'].min()).dt.days.reset_index()channel_revenue=data.groupby('渠道编号')['付款金额'].sum().sort_values(ascending=False).reset_index()该实现结合了轮廓系数法与手肘法的优势,先通过轮廓系数定量确定最佳K值,再通过分组统计揭示不同客户群的行为特征12。
2025-06-12 16:24:37
1846
原创 Python项目5.1
df.head(1)In [30]:#查看数据df.info()从数据反馈结果来看:Date列存在空缺值,并且不是日期类型。Patient_name列存在信息混合一起情况,需要拆分年龄和性别。
2025-06-05 17:24:49
1773
原创 关于python的学习心得
通过实验课的实力操作,让我更好的理解如何在真实环境中使用Python,让我对编程时刻保持兴趣和热情,让我觉得学习Python是一件很有意义的事情。在对编程有了基础的实践和探索后,我觉得Python拥有广泛的应用领域和强大的功能,不仅可以帮助我更好的理解编程,还可以让我应对各种问题和挑战。作为大学生的我们,在未来的工作中会遇到各种各样复杂的问题,我们都可以通过Python来解决,Python会成为未来我们学习和工作中解决问题的重要工具,我也要好好学习编程代码,不断学习积累提升自己的编程。
2024-12-20 09:17:55
284
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅