- 读Excel的包:readxl
- 读word的包:docxtractr
doxctractr能够对Word中的表格进行提取,提取的格式是一个列表。通过对这个列表的操作,能够获知一个doc/docx文件中的表格数量,提取表格中的内容。
常用函数:
read_docx
docx_extract_tbl
本文介绍使用R语言包readxl和docxtractr读取Excel和Word文档的方法。readxl适用于Excel文件读取;docxtractr则能提取Word文档内容及表格,并以列表形式返回,便于进一步的数据处理。
doxctractr能够对Word中的表格进行提取,提取的格式是一个列表。通过对这个列表的操作,能够获知一个doc/docx文件中的表格数量,提取表格中的内容。
常用函数:
read_docx
docx_extract_tbl
1074

被折叠的 条评论
为什么被折叠?