
搜索引擎
文章平均质量分 77
吴脑的键客
凡人修仙,AGI散修。领域展开——四海皆兄弟!!!了解更多前沿资讯,关注公众号——吴脑的键客
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
在 OpenSearch 中建立有效的混合搜索: 技术和最佳实践
像 BM25 这样的文字搜索方法可以提供快速、准确的关键词匹配,但却无法捕捉到查询的含义或上下文。相反,语义搜索擅长理解意图和自然语言,但可能会遗漏重要的关键词,尤其是在基于事实的搜索中。随着越来越多的使用案例(尤其是在使用生成式人工智能的应用中)同时要求关键字精确度和语义理解,混合搜索变得至关重要。OpenSearch 中的混合搜索结合了两种方法的优势,以提高相关性和灵活性。原创 2025-04-30 14:19:38 · 743 阅读 · 0 评论 -
OpenAI放大招:免费开放ChatGPT搜索 无需登录也可用
ChatGPT搜索功能的升级不仅体现在易用性上,更在于其强大的信息抓取和解析能力。与谷歌等传统搜索引擎的收录模式相比,ChatGPT能够更快速地抓取网络信息,实现分钟级别的实时解析。这意味着用户能够迅速获得与查询相关的最新信息。自去年10月起,OpenAI率先向付费用户提供了搜索引擎功能,随后在同年12月,该功能向所有用户全面开放。而此次更新,则彻底取消了账户注册的限制,使得任何用户都可以轻松访问ChatGPT的搜索服务。此外,ChatGPT搜索还优化了用户界面,使其更加接近传统搜索引擎的体验。原创 2025-02-06 09:31:33 · 364 阅读 · 0 评论 -
Elasticsearch开源仓库404 7万多star一夜清零
从社交媒体的动态来看,Elasticsearch 昨晚不仅仅丢失了 star 数,就连仓库本身都“404”了,而且受影响的还包括 Elastic 公司组织下的其他仓库。部分恢复:在 12:51 UTC 至 15:09 UTC 期间,除了 Kibana 仓库外,所有其他仓库都被改回为公开状态,并且它们的分支(forks)正在恢复中。今天,Elasticsearch 团队公布了此次“GitHub 仓库归零”事故的具体过程,万万没想到居然是内部人员操作失误——将原本的公开仓库设置成了“私有”。原创 2024-10-31 21:12:06 · 1008 阅读 · 0 评论 -
AWS 将 OpenSearch 纳入 Linux 基金会旗下
Karnik还指出,OpenSearch 生态系统为该项目增加了很多自己的创新,包括将其从基于集群的系统转变为更加云原生的架构,该项目最近推出了计算与存储分离以及分段复制等更新,随着人工智能的出现,人们对作为向量数据库的OpenSearch的兴趣也在增加。但有趣的是,Elastic 选择将此作为与其限制性更强的许可证并行提供的一个选项,因为正如该公司所说,“我们有非常喜欢 ELv2 的用户”。“在某些方面,它变得更加有机,我们正在采取这些有机的步骤,以找出如何让更多的人成为项目的一部分”。原创 2024-09-17 06:49:23 · 871 阅读 · 0 评论 -
Elasticsearch常用的IK分析器原理
IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。从3.0版本开始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。在2012版本中,IK实现了简单的分词歧义排除算法,标志着IK分词器从单纯的词典分词向模拟语义分词衍化。原创 2024-08-26 11:03:50 · 486 阅读 · 0 评论 -
Caffe、PyTorch、Scikit-learn、Spark MLlib 和 TensorFlowOnSpark 概述
在 AI 框架方面,有几种工具可用于图像分类、视觉和语音等任务。有些很受欢迎,如 PyTorch 和 Caffe,而另一些则更受限制。以下是四种流行的 AI 工具的亮点。原创 2024-06-16 14:20:19 · 1211 阅读 · 1 评论 -
TF-IDF在现代搜索引擎优化策略中的作用
TF-IDF算法是一种经典且广泛使用的文本特征提取方法,尽管有一些局限性,但在许多实际应用中依然表现良好。理解和掌握TF-IDF算法对于从事自然语言处理和信息检索领域的研究人员和工程师来说,是非常重要的。原创 2024-06-16 13:59:34 · 1121 阅读 · 0 评论