本文是在看过https://zhuanlan.zhihu.com/p/57292999,此篇文章后的总结文章。将自己和这位师兄的建议更好地融合,现在才研一,再更新ing。
1. 简介:
本科时期经常用知网来查一些硕士、博士学术论文,及被知网收录的论文。
但是到了研究生时期,需要查一些国外文献,我们应该在哪里检索呢?
(要好好利用学校图书馆的资源,一般连学校的校园网,可以访问以下链接进行下载。)
2. 检索入口
英文论文(国际会议文章等)检索入口:
3. 期刊
我的实验室导师认可的会议和期刊:
AAAI、IJCAI、MM、SIGIR、WWW、EMNLP、DASFAA、COLING
4.方向选择及了解一个领域的方式
选择方向:对于一个新的领域,你至少需要了解: 关键词、关键技术、领域划分、重要的论文列表以及重量级大牛。 随后,再选择自己感兴趣的方向,进一步细分和研究。
了解一个领域的方式一般有以下几种:
- 看综述和优秀学位论文(新领域一般没有)
阅读:几篇很有影响力的综述(survey)或者几篇优秀的学位论文,找到:关键词、关键技术、论文列表(而且是分好类的)、领域划分、大牛名单。
TIPS: 一篇好的综述非常有用,可以省去很多时间和精力。不过有survey也说明该领域已经比较成熟。 - 找关键词
关键词(keyword)是搜索的核心,也是找到论文的核心。好的关键词库能够串起一大片好论文,甚至一个领域,也能帮助我们快速识别某篇论文是否属于我们领域。不过,寻找关键词不能心急,需要不断阅读不断积累。等关键词积累到一定程度,你就会发现对领域的认识到了一个新的高度。
以下是我寻找关键词的流程:从中文关键词入手(如果已经知道英文关键词最好!)寻找英文关键词和论文;用已知的关键词(英文),搜索并阅读相关论文,扩充关键词库;分类和细化关键词,删除一些干扰的结果;分析最近的热门论文,更新和扩充关键词
例如: 最开始我只知道数据匿名和数据隐私,通过搜索和阅读文献,我发现数据匿名和数据隐私类的论文一般有以下关键词data privacy, data anonymization, privacy preserving data publishing等;同时,数据的匿名操作在不同论文中的说法也不一致,有用anonymize, coarse, distort, clean, sanitize等等。那么这些关键词就可以扩充到我的关键词库中,方便我鉴别某篇论文是否属于我的研究领域。后期发现,其实用coarse, clean的人很少,只是在论文中避免重复使用anonymize时才会出现,所以可以弱化这两个关键词。
WARNING: 上面所述的关键词特指英文关键词,中文关键词由于翻译和语境问题,更加多样化,统一性太差。
TIPS: 关键词积累很漫长,需要阅读大量文献;但是随着时间推移,这些关键词会帮助我们更好的理解这个领域 - 参考文献方式
准备开始找:搜到一篇相关论文(论文越好参考文献越有价值),从该篇论文的参考文献(reference)入手,不断增加论文,分类论文。
WARNING: 简单有效的方法!但是,需要有明确的目标。整个过程需要不断的增加论文,并分类论文。不然手头的论文只会越来越杂(论文多到不敢想象,但是真正对你有用的就那么几篇)。做好过滤和分类,可以大大提高入门速度。
TIPS: 相关工作(related work)一般会提供很好的文献分类,参考这个章节可以帮助我们划分手头的论文。 - 大牛效应
找到一篇或者多篇好文章
挨个查作者最近的论文,论文都很好,那么就收藏(论文+大牛)
5. 如何阅读论文
- 论文各部分的重要性
摘要 abstract: 论文最重要的部分,一般由导师直接把关
引言 introduction: 重要性仅次于摘要,内容更加易懂
相关工作 related work: 对领域内工作的分类和总结
其他章节: 论文细节,对于理解本论文非常重要。
总结 conclusion: 全文总结和展望
参考文献 reference: 论文引用的文献列表
附录 Appendix: 部分无法放到正文中的内容,如过分细节的证明和算法 - 快速阅读(泛读)
如果时间有限,直接读abstract是最高效的方法。如果时间还很充裕,那么就把introduction也读一遍。读完这两部分,就应该能基本理解论文的核心思想。
WARNING:读得速度越快,对论文的理解越差,甚至会出现误解。因此,想要好好理解一篇论文,精读是非常必要的。 - 精读
通过泛读(快速)阅读筛选完论文之后,需要精读部分的重要论文。我个人建议将精读分为几个阶段进行:
理解论文基本原理: motivation,所用的理论?
理解论文详细内容: 深入理解论文细节,包括定义、假设和相关公式等,能够重现实验(未必需要): 能否重现整个实验,并得到相同结果?
组织讨论: 与其他人进行讨论,可能有没有疏忽的地方?或者理解不到位的地方?
设计更好的方案: 能不能更进一步,设计更好的方法?
每个阶段可以对应一次或者多次阅读,通过多次阅读来加深对论文的理解。不要指望一口气能够理解整篇论文。很多原因会造成理解不够深入甚至理解错误,例如现阶段的知识面不够,或者对于某些概念理解错误等。所以需要多次阅读(如果有必要,多次讨论)来避免这类问题。
WARNING:讨论是非常必要的(最好由阅读论文的人主讲),当其他人从他的角度提出疑问时,很可能会给意想不到的惊喜。