- 博客(6)
- 收藏
- 关注
原创 **Hadoop学习心得:从入门到实践的蜕变之旅**
从最初的迷茫,到亲手搭建集群的兴奋,再到解决性能瓶颈的成就感,每一步都让我感受到技术的魅力。1. **系统化学习核心概念**:通过《Hadoop权威指南》、官方文档和视频课程,梳理Hadoop三大核心组件(HDFS、MapReduce、YARN)的底层逻辑,理解数据分块、副本机制、任务调度等基本原理。- **故障排查方法论**:遵循“日志分析→组件状态检查→网络/权限验证→社区搜索”的流程,例如曾因DataNode无法注册到NameNode,通过查看`hadoop-daemon.log`发现端口冲突问题。
2025-12-25 18:08:40
339
原创 数据可视化学习心得(含代码)
通过本次学习,我不仅掌握了技术工具,更重要的是建立了“以用户为中心、以数据为基础、以洞察为目标”的可视化思维。未来,我将继续深入学习,努力将复杂的数据转化为清晰的故事,为科学决策提供有力支持。学习过程中,我意识到作为数据工作者,必须秉持客观、公正的原则,确保可视化结果真实、透明。fig = px.line(daily_sales, x='date', y='sales', title='交互式每日销售额趋势',labels={'sales': '销售额', 'date': '日期'})
2025-11-08 16:01:51
348
原创 深入解析Python数据可视化:从问题到解决方案(扩展版)
缺失列与冗余列:某些文件缺少关键字段,或包含无关列。步骤5:数据验证与清洗检查NaN值分布:print(merged_df.isna().sum())处理异常值:如Price列的字符串类型,使用df['Price'] = pd.to_numeric(df['Price'], errors='coerce')转换为数值,错误值设为NaN。使用pd.to_datetime()统一日期格式(如df['Date'] = pd.to_datetime(df['Date'], format='%Y-%m-%d'))。
2025-06-28 15:25:35
819
原创 【无深入解析Python数据可视化:从问题到解决方案】
文件2列名: ['UserID', 'Age', 'Sex', 'Purchase_Amount']问题分析:列名差异导致合并时无法对齐,部分数据被识别为缺失值(NaN)。df['date'] = pd.to_datetime(df['date'], errors='coerce', format='%Y-%m-%d')3. 数据合并与验证使用pd.concat()合并多个DataFrame,并验证结果:# 合并数据。# 示例:将'UserID'映射为'user_id'步骤2:批量重命名列名。
2025-06-28 13:33:12
532
原创 关于我对Python的看法
Python,这个名字让人联想到丛林中蜿蜒前行的大蟒蛇,而在编程语言的世界里,Python同样以它的独特魅力吸引着无数开发者。从人工智能到数据分析,从网络应用到自动化测试,Python的应用领域广泛,令人瞩目。正如“人生苦短,我用Python”这句话所说,Python让开发者能够更专注于算法和数据结构的设计,而非纠结于底层的细节。Python的强大不仅仅在于它的语法,还在于它丰富的库和第三方支持。学习Python让我体会到编程的乐趣和高效,它让我能够快速实现自己的想法,而不必陷入繁琐的语法和细节之中。
2024-12-19 15:51:01
254
原创 关于我对Python的看法
其实一开始学习python的时候我是抗拒的,(可能当时还是有着c语言是万能,其他都不重要的这种落后信念吧,)在我初次接触的时候,我发现其实python的大多数功能都是类似c语言的,有一些复杂的代码甚至能用同样的c语言代码来完成。Python是一门简单,实用,创作性强的语言技术,可以运用于Web应用开发,网络系统维护,科学与数学计算,网络编程上都有建树,可以说只要和网络相关都能看到它的身影,且上手简单,是最适合新手者入门学习的计算机语言之一,即使是我这菜鸟,也很快就能上手适应。(4) 可以当作函数的返回值。
2024-12-19 15:44:01
438
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅