客户关系管理中的数据处理与分析
1. 国际姓名和地址的考量
1.1 字符集问题
在处理国际姓名和地址时,会遇到字符集的挑战。传统的 ASCII 编码最多只有 255 个可能的字符,对于非英语书写系统所需的数千个字符而言,它远远不够。因此,需要使用 Unicode 标准。Unicode 由国际系统架构组织 Unicode 联盟定义,版本 6.2.0 已为 110,182 个可能的字符定义了具体解释,涵盖了美洲、欧洲、中东、非洲、印度、亚洲和太平洋地区的主要书面语言。
1.2 Unicode 解决方案的实施
要实现 Unicode 解决方案,需要确保系统的各个层面都支持 Unicode:
1. 操作系统 :当前主流操作系统的最新版本大多已支持 Unicode。
2. 字符处理设备 :所有捕获、存储、传输和打印字符的设备都必须支持 Unicode。
3. 数据仓库工具 :包括排序包、编程语言和自动化 ETL 包等数据仓库后台工具也需支持 Unicode。
4. DW/BI 应用 :数据库引擎、BI 应用服务器及其报表编写器和查询工具、Web 服务器和浏览器等都要支持 Unicode。
DW/BI 架构师不仅要与数据管道中每个软件包的供应商沟通,还应进行各种端到端测试。例如,在旧应用程序的数据捕获屏幕上捕获一些包含 Unicode 字符的姓名和地址,然后将它们通过系统传输,最后从 DW/BI 系统的最终报告或浏览器窗口中打印出来,检查特殊字符是否仍然存
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



