R语言与文本挖掘:功能、问题及解决方案
1. R语言简介
R是用于统计计算和图形处理的语言与环境,它是一个GNU项目,与贝尔实验室(现朗讯科技)的John Chambers及其同事开发的S语言和环境类似,可以看作是S的另一种实现。虽然存在一些重要差异,但许多为S编写的代码可以在R中直接运行。
R提供了广泛的统计(线性和非线性建模、经典统计测试、时间序列分析、分类、聚类等)和图形技术,并且具有高度可扩展性。S语言常是统计方法研究的首选工具,而R则为参与相关研究提供了开源途径。
R的优势之一是能够轻松生成设计精良、适合出版的图形,包括必要的数学符号和公式。在图形的细微设计选择上,默认设置经过精心考虑,但用户仍可完全控制。
R由Ross Ihaka和Robert Gentleman创建,目前由R开发核心团队进行开发。R环境可通过CRAN上的打包系统轻松扩展。R以源代码形式作为自由软件提供,遵循自由软件基金会的GNU通用公共许可证,可在各种UNIX平台及类似系统(包括FreeBSD和Linux)、Windows和Mac OS上编译和运行。
2. R语言常见问题及解决方案
2.1 程序化运行R脚本
- 问题描述 :有一个基于数据库当前内容生成报告的R脚本,数据库每天会多次添加或删除记录。希望计算机每天凌晨4点运行该脚本,以便早上能得到最新报告;或者在数据库添加一定数量的新记录后重新运行脚本。提问者使用的是Windows系统,但也可将脚本放在Linux机器上以简化流程。
- 解决方案 :
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



