用1天时间开发了一款AI搜索助手！大量的token消耗把我劝退！分享一些经验心得！

最新推荐文章于 2025-09-18 14:04:08 发布

原创最新推荐文章于 2025-09-18 14:04:08 发布 · 2.3k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #ai #搜索引擎

本文讲述了作者开发AI搜索引擎助手Miku时遇到的挑战，特别是Token消耗问题。LLM+搜索强调事物对象级别搜索，有望取代传统搜索引擎，但高昂的Token成本限制了发展。文章还探讨了如何通过深度理解和个性化来提升搜索质量和价值，以及在商业应用中的复杂工作流程和个性化需求。

这个月早初的时候，我花了1天时间开发了一款AI搜索引擎助手Miku，刚开发完因为token的大量消耗成功把我劝退。但不可否认的是，AI搜索引擎即将颠覆传统的搜索引擎，而且这个趋势已经到来。

本篇文章我将和你分享开发这个产品过程中的一些经验。

搜索的核心：事物对象级别的搜索

回到搜索引擎本身，搜索引擎的早期出现是为了解决互联网上信息过载的问题。随着互联网的快速发展，越来越多的网页被创建并发布，用户需要一种有效的方式来找到他们感兴趣的信息。

因此，搜索引擎的出现提供了一种更便捷、更高效的方式来检索互联网上的信息。

但是，搜索的本质在于以最少的信息输入，获取到最精准的结果。用户希望直接搜索最终的答案，例如用户问：“AI搜索引擎有哪些？”，希望得到对事物的精准描述——BingAI、Monica...，而非返回很多页面，让用户自己从众多页面中寻找正确答案。

而传统搜索引擎只能返回很多相关页面，用户需要从海量文本中自行寻找答案，即所谓字符串级别的搜索。

而llm+搜索即所谓事物对象级别的搜索，会对用户的语义进行解析，过滤掉网页返回当中无关的内容，并总结摘要精准返回给用户。

基于搜索的核心，llm+搜索必将取代传统搜索引擎。现在市场上也越来越多相关产品了，如monica，秘塔，perplexity，walles AI，thinkany等。

每一次搜索背后烧的是大量的Token

每一次搜索首先需要通过相关的搜索API返回相关文本内容，返回抽取的内容可以有标题、摘要、来源和对应的链接。

由于仅仅通过标题和摘要扔给大模型来解析是远远不够的，因为这些内容通常包含的信息不够全面，往往输出的搜索质量也不高。

于是需要获取每一个返回链接具体页面内的详细内容，并过滤掉无关的html，保留主要的文本内容，在将这些文本合并+prompt+用户输入问题暴力扔给大模型。当然其中为了提高搜索结果的质量，也可以采取相关的RAG策略进行检索，比如相似度匹配和知识简谱等。无论如何，这样每一次搜索都需要消耗大量的Token。

我简单几次测试下来，如果采样在8条搜索结果的情况下，平均每一次消耗的token大概在2-3万token，甚至有一次消耗接近5万token。