介绍arxiv.org的文献更新管理工具arxiv-sanity

arxiv-sanity提供了一个更方便的方式来浏览和管理arxiv.org上的预印本论文。它支持缩略图预览、按相关性排序、自定义收藏库、搜索引擎以及个性化推荐。通过TF-IDF算法,用户可以轻松找到与自己研究领域相关的论文,并利用个人图书馆功能跟踪感兴趣的内容。此外,arxiv-sanity主要关注机器学习领域,包括CV、CL等子领域,其源代码已在GitHub上开源。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我们都知道arxiv.org是一个非常大的预印本资源库,里面有大量的优质论文,但缺点是浏览、搜索和排序不是很方便。这个库每天会更新大量的论文,可不幸的是,你只能通过这样超级长的列表去找,还没有标签。

这样特别容易让人和一些优秀的有趣儿的论文擦肩而过,这些论文可能是和你的研究领域相关的。所以接下来你可能就能猜到这个arxiv-sanity是干什么用的了。

    首先,arxiv-sanity在展示最新更新的文献时,提供了可读性更强的缩略图预览模式方便读者来快速预览,并在缩略图下方的绿色区域显示文献的abstract 。

     更重要的是,它可以让你根据自己的阅读兴趣对文献进行重新排序。比如这里有一篇关于对人体姿态估计的文献是你感兴趣的,点击右上角的' rank by tf-idf similarity to this',文献列表会根据按照与这篇文章的相关度进行排序,我们会看到arxiv上所有关于人体姿态识别的论文。这个功能是基于TF-DF算法来实现的,效果很好。(一种文档特征提取法,它是由Salton在1988 年提出。其中TF 称为词频,  IDF 称为反文档频率, 感兴趣的可以自己百度。)

    我们还可以搜索文档。比如我们搜索Geoff Hinton,我们就可以看到他最近在arxiv发表的文献了。

    如果你是注册用户,在登录账户之后,还可以把自己感兴趣的文献收藏的你的个人图书馆。比如,我喜欢上图的这篇人体姿态估计的文献,点击右上角存盘图标,(看到了吗

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值