数据抓取、保存与调查项目实战
在数据处理的过程中,我们常常需要从各种来源获取数据,对其进行分析,并将结果保存下来。本文将介绍如何在R环境中进行数据抓取、保存,以及如何使用LimeSurvey开展一项市场调查项目。
数据抓取与R数据保存
在R中,我们可以通过网页抓取的方式获取大量数据。例如,我们可以运行代码在多个页面地址上操作,下载不同学校的教职工总数,并构建表格。还可以进一步探索页面,抓取其他元素,如大学名称。以下是相关代码示例:
header <- html_nodes(page, ".headerlg");
name <- html_text(header);
paste("The total number of faculty at",name,"is",totfaculty);
一旦开始抓取数据,你会发现可以获取的数据非常丰富。结合从数据库、平面文件和脚本中读取的数据,你可以在R控制台中迅速建立一个小型的数据仓库。那么,当数据都收集好后,该如何处理呢?通常,我们会希望将数据保存下来,以便后续使用。
在使用R的过程中,我们会创建许多对象。可以使用 ls() 命令随时查看这些对象。当关闭R时,会收到一个提示,询问是否要保存工作区的“镜像”。这意味着下次打开R时,工作区和历史记录将被恢复,再次输入 ls() 命令,一切都和上次离开时一样。
为了更好地管理工作区,我们可以使用以下命令:
| 命令 | 功能 | 示例 |
| — | — | — |
|
超级会员免费看
订阅专栏 解锁全文
625

被折叠的 条评论
为什么被折叠?



