《大数据之路:阿里巴巴大数据实践》语录 目录 一、数据采集 1 ◆日志采集 1 ▼浏览器的页面日志采集 1 ▼无线客户端的日志采集 2 (1) 页面事件 3 (2) 控件点击事件 3 (3) 其它事件 3 (4) 特殊场景 3 (5)H5 & Native 日志统一 4 (6)设备标识 4 (7) 日志传输 5 ▼日志采集挑战 5 (1) 日志分流与定制处理 5 (2) 采集与计算一体化设计 5 (3)大促保障 5 ◆数据同步 6 ▼直连同步 6 ▼数据文件同步 6 ▼数据库日志解析同步 6 ▼阿里数据仓库的同步方式 7 (1) 批量数据同步 7 (2) 实时数据同步 7 ▼数据同步遇到的问题与解决方案 8 (1)分库分表的处理 8 (2)高效同步和批量同步 8 (3) 增量与全量同步的合并 8 (4)同步性能的处理 8