CDA一级《精益业务数据分析》读书笔记
第一章 表结构
第二章 数据库
第三章 描述性统计分析
第四章 多维数透分析
第五章 业务分析方法
第六章 业务分析报告与BI可视化
第七章 职业发展
前言
随着AI大模型的发展,越来越多基础性、重复性的劳动都能交给机器人了,表哥表姐急需转行数据分析师。本文可以解决新手小白转行数分的困惑,以及如何高效利用AI完成数据分析、提升决策效率。
一、数据分析师要了解什么?
应用领域:
金融:风险评估、信用评级、投资决策
医疗:疾病诊断、治疗效果评估、药物研发
电商:精准营销、用户行为分析、商品推荐
教育:教学质量评估、学生学习情况分析
二、数分流程
数据采集
来源:内部数据库、外部数据提供商、网络爬虫、传感器等
方法:API 接口获取、数据库查询、网络抓取工具
数据清洗
处理缺失值:删除、填充(均值、中位数、众数等)
处理异常值:识别与修正错误数据,平滑噪声数据
处理重复值:删除重复记录
数据探索
描述性统计:计算均值、中位数、标准差等
数据可视化:绘制直方图、折线图、散点图等
数据建模
选择合适的模型:回归分析、分类算法、聚类算法等
模型训练与优化:调整参数,提高模型性能
结果评估
评估指标:准确率、召回率、F1 值、均方误差等
模型比较:选择最优模型
结果呈现
撰写分析报告:清晰阐述分析目的、方法、结果与建议
可视化展示:使用图表、仪表盘等直观呈现结果
三、数据安全与立法
数据安全
数据存储安全:加密存储、定期备份
数据传输安全:使用安全协议,防止数据泄露
访问控制:设置权限,限制数据访问范围
相关立法
立法目的:规范数据处理活动,保护个人、组织的合法权益
国内:《网络安全法》《数据安全法》《个人信息保护法》
国外:欧盟《通用数据保护条例》(GDPR)
四、总结
以上就是转行数据分析师需要了解的基础,明天进入表结构。