PHP 实现文本文件与数据库表之间的数据转换
1. 引言
在处理实际数据时,数据清理是一项必要且繁琐的工作,特别是对于那些并非通过自动流程收集的数据。本文将详细介绍如何使用 PHP 对存储在网站文本文件中的数据进行清理,并将其转换为数据库表。同时,还会展示如何将数据库表中的数据导出到文本文件进行存档,以及如何从文本文件备份中恢复数据库表。
2. 戏剧数据集示例
假设有一家剧院公司计划来年的戏剧节目,并创建了一个文本文件 plays.txt ,每行包含戏剧名称、作者姓名以及演出的开始和结束日期。然而,即使是这样一个小数据集,也存在不少问题和错误,这在“现实世界”的数据中是很典型的:
- 前六个标题用双引号括起来,其他则没有,这些双引号都需要去除。
- 缺少一个逗号来分隔作者 Henrik Ibsen 和日期 Apr 6 。
- 日期 Aug 24 中有不必要的额外空格。
- 部分逗号后面有不必要的空格。
- 戏剧 She Stoops to Conquer 的开始日期 May 4th 被遗漏。
- 日期格式(如 Jan 12 )不适合未来的处理,例如检查今天之后的下一场演出。
- 最后一部戏剧的名称中包含引号字符,这会导致问题。
对于如此小的数据集,公司可以在硬盘上手动纠正所有问题,然后上传修正后的版本。但对于稍大的数据集,手动检查和修正就变得非常困难。因此,我们将展示如何使用 PH
-1
超级会员免费看
订阅专栏 解锁全文
1121

被折叠的 条评论
为什么被折叠?



