数据可视化与机器学习入门
1. 数据可视化概述
数据可视化的种类繁多,难以一一列举。可以访问 D3 可视化图库(https://github.com/d3/d3/wiki/Gallery),这里集中了多种可视化类型。在进行数据可视化时,最重要的是要考虑利益相关者的目标,思考图形化的信息展示如何帮助他们。一切操作都应有合理的理由,且要契合具体情境,不能仅仅为了娱乐而制作花哨的展示。
1.1 交互式展示
交互式展示将分析与图形展示相结合,功能强大。当底层数据快速变化时,用户通常希望监控这些变化,并可能针对不同情景执行相应操作。因此,交互设计应围绕这些常见活动展开,使用户能够专注且快速地处理数据。创建强大的交互式仪表盘需要具备用户体验设计方面的知识和技能。
1.2 仪表盘自动化
仪表盘的创建需要自动化,基于云的服务很适合这一需求。它们提供可扩展且容错的基础设施,能让你顺利搭建数据处理流程。以下是一些不错的选择:
- PythonAnywhere(https://www.pythonanywhere.com),它依赖于亚马逊网络服务(AWS)。
- 谷歌云平台(https://cloud.google.com)。
此外,也可以使用 OpenStack(https://www.openstack.org)创建本地解决方案。借助 Kaggle 的 API 和相关指南,能快速开启仪表盘创建工作。
2. 机器学习基础
机器学习是人工智能的一个子领域,致力于通过算法和技术从数据中提取知识。其核心要素是大数据,因为没有机器的帮助,手动处理大量数据几乎是不可能的。作为计算