一、几个大类的任务
1. 与外界进行交互
读写各种各样的文件格式和数据库。
2. 准备
对数据进行清理、修整、规范化、重塑、切片切块、变形等处理以便进行分析。
3. 转换
对数据集做一些数学和统计运算以产生新的数据集。比如说,根据分组变量对一个大表进行聚合。
4. 建模和计算
将数据跟统计模型、机器学习算法或其他计算工具联系起来。
5. 展示
创建交互式的或静态的图片或文字摘要。
本文概述了数据处理领域的五大核心任务:与外界交互、数据准备、数据转换、建模计算及成果展示。这些任务覆盖从原始数据获取到最终分析报告生成的全过程。
一、几个大类的任务
1. 与外界进行交互
读写各种各样的文件格式和数据库。
2. 准备
对数据进行清理、修整、规范化、重塑、切片切块、变形等处理以便进行分析。
3. 转换
对数据集做一些数学和统计运算以产生新的数据集。比如说,根据分组变量对一个大表进行聚合。
4. 建模和计算
将数据跟统计模型、机器学习算法或其他计算工具联系起来。
5. 展示
创建交互式的或静态的图片或文字摘要。
您可能感兴趣的与本文相关的镜像
HunyuanVideo-Foley
HunyuanVideo-Foley是由腾讯混元2025年8月28日宣布开源端到端视频音效生成模型,用户只需输入视频和文字,就能为视频匹配电影级音效
1452
292

被折叠的 条评论
为什么被折叠?