目录
1.如何阅读英文文献,有哪些高效的方法或者辅助工具?
2.评判聚类效果好坏的指标是什么?
3.有git的入门资料推荐么?
如何阅读英文文献,有哪些高效的方法或者辅助工具?
1.方法
先是通读文献综述(理解专业术语和基本概念),起初时应以泛读为主;再研读自己研究领域的经典论文50篇+;
确定研究方向之后,要以精读为主,要做到边读文献边做笔记,尤其是在文献中遇到的疑惑点(可以查看参考文献)做出Hightlight标记,因为这些疑惑点将是我们后期主要关注的对象;每周抽出1-2个小时对自己看过的论文进行梳理,总结(可以依照自己的读书笔记进行整理、分类);在自己的脑海中树立一个“框架”,即好的paper是如何围绕着“提出什么样的问题”(idea)、“如何分析存在的问题”、“怎样具体解决问题”这些脉络,进行层层递进,逐一展开的,同时自己也要发出疑问,“他还存在哪些不足和需要改进的地方”;
最后,尝试着做论文的复现工作(我个人认为实现起来是有难度的,待于进一步强化训练)。有时论文的复现可能存在偏差,个人理解是发现论文中的亮点,以作者提出的实际问题出发,为什么作者用文中的idea处理提出的问题,针对论文中的结论是否还有更好的优化方案,这一点可能是难点,我们需要多参考文献,可能好的idea,是综合数篇论文产生的,并不是一蹴而就,拍脑袋瓜子就能想出来的!
2.翻译工具
Google翻译
有道词典
文献整理
3.文献整理
XMind思维导图:
https://www.xmind.net
Evernote印象笔记:
https://www.yinxiang.com
Mendeley文献管理:
https://www.mendeley.com
Endnote文献管理软件
4.拓展:
How to read a paper :
https://blog.youkuaiyun.com/weixin_41246832/article/details/83691363
评判聚类效果好坏的指标是什么?
聚类的目标结果是簇内相似度尽可能高,簇间相似度尽可能低。
两种度量方法:
一种是将结果与参考模型比较,称为外部指标;
主要有Jaccard系数(JCI),FM指数(FMI),Rand指数(RI),这些指标值在[0,1]之间,值越大越好;
一种是直接考察聚类结果,称为内部指标。
主要是基于距离的度量,有DB指数(DBI),值越小越好;Dunn系数(DI),值越大越好。常见的距离度量有闵可夫斯基距离(一类距离的定义),欧式距离,曼哈顿距离,切比雪肤距离,余弦距离等
外部指标主要刻画的是聚类模型和参照模型的相似程度,所以这些指标越大,说明距离的结果与参照模型比较相近,效果比较好;内部指标主要是基于簇内样本点的距离及簇与簇之间距离来计算的,簇与簇中心间距越大说明两个簇较远,而簇内样本点间的平均距离刻画了簇内的点的集中程度,距离越大说明点比较分散,距离小说明点比较集中,理想的聚类效果是簇与簇之间距离尽量大,而簇内点尽量集中。
如果是写paper可以看一下这个:
https://www.zhihu.com/question/19635522/answer/283447266
有git的入门资料推荐么?
1.gitbook:
https://git-scm.com/book/zh/v2
2.廖雪峰的git教程:
https://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000