AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。
AMiner平台:https://www.aminer.cn
文本挖掘是指从大量文本数据中抽取事先未知的、可理解的、最终可用的知识的过程,同时运用这些知识更好地组织信息以便将来参考。直观的说,当数据挖掘的对象完全由文本这种数据类型组成时,这个过程就称为文本挖掘。
该论文集共收录93篇论文,最高引用数为2920,其中来自清华大学的唐杰老师发表了6篇相关论文,在所有学者中最多,而华人学者中,来自清华大学的李涓子教授和UIUC的Jiawei Han教授同样在此领域颇有研究。
论文集地址: https://www.aminer.cn/topic/5e7d9a78ea0348b7e22edd7b