可以用ChatGPT搜索论文了

 Datawhale干货 

作者:陈萍,来源:机器之心

搜索arXiv最相关论文一键直达,多亏了ChatGPT,几天就完成。

看来论文搜索工具也开始卷了!

对于天天查找论文的小伙伴来说,有一个好用的搜索工具,那简直不要太开心,效率妥妥的上升。

但现实结果却是,要么搜索工具不给力,要么自己输入的关键词不起作用,反正,自己脑海里想找寻的论文和搜索出来的结果不能说毫无关系,简直是天差地别。

下面我们将要介绍的这个网站,可以帮你搞定论文搜索遇到的难题,网站名为 arXiv Xplorer,专门用于对 arXiv 上的论文进行语义搜索。根据项目作者介绍,该网站的内部算法使用了 OpenAI 的最新嵌入模型,可以为用户进行搜索查询,从而找到最相关的论文。

2c74ab22ec23d178477819f0d891454a.png

arXiv Xplorer地址:https://arxivxplorer.com/

项目作者表示:OpenAI 新的嵌入 API 给他留下了深刻的印象,因此他想看看该嵌入是如何在实践中使用的。所以他花了几天时间来构建这个项目,到目前为止,它工作得非常好。除此以外,他还用 ChatGPT 编写了 80% 的 UI,用 pinecone 来存储向量数据库,并用 googlecloud 函数来嵌入查询并执行查找。

想要了解嵌入模型更多内容,可以前去网站查看。

嵌入模型:https://openai.com/blog/new-and-improved-embedding-model/

借助 arXiv Xplorer,你可以找到所需论文,即使是你的描述非常模糊,甚至只是输入「有趣的 ML 论文」这种没有信息含量的描述,该引擎也能帮你完成。如下所示,输入几个关键字后该网站展示的查询结果。

866639b8e3a79c820ed56bef68a7c5f3.png

在此过程中,相比谷歌或 arXiv 自己的搜索等传统搜索工具来说,你还能发现以前从未见过的有趣论文,相比来说,似乎 arXiv Xplorer 效果更胜一筹。

你也可以通过粘贴 arxiv url 直接搜索类似的论文,举例来说,下图的输入是论文《A Generalist Agent》的地址,搜索结果显示(红框),A Generalist Agent 相似度为 100%,其他的搜索结果按照得分依次展开。

be713815c99e11267115203bfe4d48bd.png

除此以外,你还可以点击上图红框中的小三角,之后界面变成下图所示,显示论文参与者和摘要,下面还有两个功能:「More Like This」将会显示更多相似论文;「View」会链接到论文在 arXiv 的主页。

c26bdd866067a72addd8816bd1758ec6.png

看到这个功能齐全的网站,网友的好奇心也是憋不住了,问道「你用到了 OpenAI 的嵌入技术,但是这项技术是收费的,那你为此交了多少钱?」。项目作者表示:「将所有论文嵌入 CS 类别(约 50 万篇)需要 40 美元。」

44e727cf0eca910ba3908c4aba23d1dd.png

还有网友对技术展开了一系列问题,例如:「这个网站是嵌入了所有 arXiv 的标题吗?」项目作者表示:「他把所有论文的标题和摘要都嵌入了,最初手动做余弦相似度和排序,但 pinecone 使它超级简单!」

6e2df757f153e435a4bea347cc0deed0.png

还有网友建议到:「这个工具搜索功能做得很好!如果能够按发布日期查看和排序,那就太酷了。」对于这一点,项目作者表示之后会不断优化,争取实现更完美的功能。

0fd5e7b1641ae90304960c60e28dde19.png

参考链接:https://twitter.com/tomtumiel/status/1611729847700570118?s=20&t=sW31zy64CvhMH81ntcxzXw

103ae47993cbf0294f89fe6401303aa5.png

整理不易,三连

ChatGPT 可以在论文搜索与阅读过程中作为高效的辅助工具,帮助研究人员快速理解领域背景、定位关键文献、提炼核心观点,并提升阅读效率。以下是具体的使用方法和技巧: --- ### 一、辅助**论文搜索** 1. **确定研究关键词与主题表达** - 使用 ChatGPT 帮助你优化搜索词,适应不同数据库(如 Google Scholar、PubMed、CNKI)的检索语法。 ```prompt 我想查找关于“基于Transformer的医疗文本分类”相关论文,请帮我生成英文检索关键词和组合。 ``` - 输出示例: ``` ("Transformer" OR "BERT" OR "LLM") AND ("medical text classification" OR "clinical NLP") AND ("deep learning") ``` 2. **推荐相关研究方向与经典文献** - 让 ChatGPT 列出该领域的代表性模型或综述文章: ```prompt 请推荐5篇关于医疗自然语言处理的经典综述论文,包括标题、作者和发表年份。 ``` 3. **构建文献综述框架** - 快速生成某一主题下的子领域结构,便于系统性检索: ```prompt 请为“大语言模型在教育中的应用”这一主题设计一个文献综述的提纲。 ``` --- ### 二、辅助**论文阅读** 1. **摘要生成与简化** - 将复杂摘要翻译成通俗易懂的语言: ```prompt 请用简单中文解释以下英文摘要的意思:[粘贴摘要] ``` 2. **重点内容提取** - 提取论文的研究问题、方法、数据集、结论等关键信息: ```prompt 请从以下段落中提取:研究目标、使用的方法、实验数据集、主要结论:[粘贴引言或结论部分] ``` 3. **术语解释与背景补充** - 遇到不懂的技术术语时,让 ChatGPT 解释: ```prompt 什么是LoRA微调?它在大模型训练中有何优势? ``` 4. **图表描述理解** - 若无法查看图示,可将图注或描述输入,请求解释其含义: ```prompt 这个图表显示了准确率随训练轮次的变化趋势,请分析可能说明什么问题。 ``` 5. **批判性思考支持** - 辅助评估论文局限性或提出改进思路: ```prompt 这篇论文只在英文数据集上测试模型效果,可能存在哪些局限? ``` 6. **多篇论文对比分析** - 输入几篇论文的核心信息,让 ChatGPT 对比异同: ```prompt 请比较BERT、RoBERTa和DeBERTa在自然语言理解任务上的主要区别。 ``` --- ### 三、实用技巧与注意事项 ✅ **高效用法建议**: - 结合 Zotero 或 Notion 使用:将每篇论文的关键点由 ChatGPT 总结后存入笔记系统。 - 使用提示词模板批量处理多篇论文。 - 利用“继续写下去”功能补全推理过程。 ⚠️ **注意事项**: - ChatGPT 不直接访问最新论文数据库,不能替代正式检索。 - 回答可能包含“幻觉”(虚构文献),需验证引用真实性。 - 敏感或未发表内容避免输入。 --- ### 示例流程:快速掌握一篇陌生论文 1. 复制标题和摘要 → “请简要总结这篇论文的研究贡献。” 2. 粘贴方法部分 → “这个模型结构是如何工作的?请画出流程图描述。”(文字版) 3. 粘贴实验结果 → “作者在哪个数据集上取得了SOTA?相比基线提升了多少?” 4. 最后提问 → “这篇论文有哪些潜在缺陷?我可以如何改进?” --- 通过合理使用 ChatGPT,可以显著缩短文献调研时间,提高科研效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值