- 博客(20)
- 收藏
- 关注
原创 SQLord: 基于反向数据生成和任务拆解的 Text-to-SQL 企业落地方案
本文提出了一种面向企业级应用的NL2SQL解决方案SQLord,针对现有方法在业务逻辑复杂、领域数据稀缺、评估困难等问题进行了创新性改进。SQLord通过反向数据生成技术自动合成标注数据用于模型微调,采用基于自动化工作流的方法分解复杂查询任务,并设计了包含执行评估、语义一致性评估的GPT-Judge多维度评估框架。实验表明,SQLord在Spider数据集和企业真实场景中均显著优于现有方法,在线准确率持续超过90%,已成功应用于全球最大B2B电商平台的多个核心业务场景。相关成果发表在WWW'2025会议。
2025-05-27 17:25:58
993
2
原创 Cursor:全面详解开箱即用的 AI 工具(附科学使用方式)
从年中cursor开源以来,逐渐火遍全网,成为编程的又一更强力助手,在亲身使用了三个月后写下该教程,供广大开发者参考,cursor的使用十分简单,看完你会了解到集成了先进LLM的cursor在编程方面的强大。(结尾总结有彩蛋)
2025-01-02 22:18:30
1265
原创 深入浅出:多功能 Copilot 智能助手如何借助 LLM 实现精准意图识别
如果要搭建一个 Copilot 智能助手,比如支持 **知识问答**、**数据分析**、**智能托管**、**AIGC** 等众多场景或能力,那么最核心的就是基于LLM进行意图识别分发能力,意图识别的准确率直接决定了 Copilot 智能助手的能力上限。
2024-12-22 19:21:11
1511
2
原创 经典多模态模型CLIP - 直观且详尽的解释
在本文中,您将了解“contrastive language-image pre-training”(CLIP),这是一种创建视觉和语言表示的策略,效果非常好,可用于制作高度特定且性能卓越的分类器,而无需任何训练数据。
2024-12-12 21:06:56
994
原创 多模态RAG:通用框架方案调研汇总
多模态检索增强生成是一种新兴的设计范式,允许AI模型与文本、图像、视频等存储进行交互。在介绍多模态 RAG 之前,我们先简单了解一下传统的检索增强生成 (RAG)。
2024-12-10 17:30:23
1470
原创 LLMER必会技能:一行代码将任意python函数部署成http服务
Notice: LLMER增加新功能,任意python函数,只需一行代码即可部署成FastAPI服务
2024-12-04 11:57:19
275
原创 利用CLIP/BLIP的Embedding构建多模态RAG向量检索
在信息爆炸的时代,如何快速从海量数据中找到最相关的信息成为了一个重要的研究课题。RAG(Retrieval-Augmented Generation,检索增强生成)技术作为一种高效的信息检索与生成结合的方法,在自然语言处理领域展现了强大的应用潜力。其核心在于将预训练语言模型与检索模块结合,通过嵌入向量的高效匹配实现信息的精准获取。在RAG技术中,嵌入向量的生成和匹配是关键环节。本文介绍了一种基于CLIP/BLIP模型的嵌入服务,该服务支持文本和图像的嵌入生成与相似度计算,为多模态信息检索提供了基础能力。
2024-12-03 14:44:01
1222
原创 LLMER: 一个化繁为简的大模型(LLM)应用开发者神器
`llmer` 是一个轻量级的 Python 库,旨在简化大型语言模型(LLMs)应用中的复杂过程。它提供了用于并行处理、运行时管理、文件处理和Prompt格式化等常用的高级 API 和实用工具,从而不用每次都需要重复开发相关代码,简化工作。
2024-11-20 21:33:17
1094
原创 OpenAI-o1发布,断崖式碾压GPT-4o,AI能力迈上新台阶
OpenAI o1 的性能表现:理工科方面 (智力) 断崖碾压GPT4-o,达到人类竞赛选手,以及博士生水平。
2024-09-13 11:29:23
1154
原创 LLM驱动的NL2SQL方法论:现状、难点、优化
Natural Language to SQL (NL2SQL) 是指将用户的自然语句转为可以执行的 SQL 语句。综合考虑上述Prompt策略,以及经过大量的实践,我们可以总结一套比较通用的NL2SQL的Prompt方案。
2024-09-11 11:19:08
7128
原创 多模态大语言模型(MMLLM)的现状、发展和潜力
近年来,基于Transformer的大模型,如Swin Transformer和ViTAE Transformer,通过无监督预训练和微调策略,在多个视觉任务上展现出优越的性能,有望成为基础视觉模型(Foundation Vision Model),显著提升感知能力,推动AIGC领域的发展。:这种方法也被称为专家模型桥接器。在单纯的语言理解能力上,BLIP 比大语言模型和后续的 BLIP2.0 要弱很多,而如果只是用基本的图文对齐能力,BLIP 又显得非常笨重,因此在工业界,BLIP1.0 的使用并不多。
2024-08-08 00:54:10
1595
原创 全网最简洁 Code Agent,50行代码极速入门,带你通往AGI!
在人工智能领域,Code Agent不仅是技术进步的一个标志,更是我们迈向人工通用智能(AGI)的关键一步。AGI旨在创造能够执行任何智能任务的AI,而Code Agent的能力——自动编写和优化代码——是实现这一目标的基石之一。通过自动处理复杂的编程任务,Code Agent不仅提高了软件开发的效率,更重要的是,它使机器能够理解和执行与软件开发相关的高级认知任务,这是向AGI过渡的必要条件。
2024-07-25 13:34:50
927
原创 吴恩达揭示 Generative AI:打破知识壁垒,普惠全人类
生成式人工智能(AI)是近年来迅速发展的一个领域,它主要基于监督学习技术。在2010到2020年间,大规模监督学习技术的发展为现代AI技术奠定了基础。
2024-07-13 00:05:19
936
原创 吴恩达揭示 Generative AI:打破知识壁垒,普惠全人类
生成式人工智能(AI)是近年来迅速发展的一个领域,它主要基于监督学习技术。在2010到2020年间,大规模监督学习技术的发展为现代AI技术奠定了基础。
2024-07-12 23:13:58
1718
原创 微软企业级 AI 框架 Semantic Kernel 详解,LangChain 最强替代
Semanic Kernel 是微软开源的一个轻量级的开源开发套件,它让你可以轻松构建 AI Agent,并将最新的 AI 模型集成到您的 C#、Python 或 Java 代码库中;它提供了一个简单易用的 API,可以连接到各种 AI 服务,例如 OpenAI、Azure OpenAI 和 Hugging Face 等;并且它作为业高效的中间件,能够快速交付企级解决方案。
2024-07-07 14:09:45
4588
原创 一文教你面对高并发任务时如何选择:多进(线)程 VS 异步函数
在现代软件开发中,处理高并发和网络I/O密集型任务是一个常见的挑战。Python提供了多种方法来处理并发,其中最常用的是多进(线)程和异步编程。本文将探讨这两种技术在实际应用中的性能差异,并通过实验来比较它们在处理大量网络请求时的效率。
2024-06-29 20:58:04
1216
原创 Code Interpreter: 使用PandoraBox和LangGraph构建的Agent
我们将进一步探讨如何利用PandoraBox和LangGraph构建一个功能强大的Code Interpreter。这个项目采用了单Agent模式,旨在为开发者提供一个高效、灵活的代码解释工具。
2024-06-26 19:35:07
1174
原创 Pandora Box: Code Interpreter平替,Python驱动Agent最佳选择
在大型语言模型(LLMs)的时代,Pandora Box作为一款开创性的开源Python包,旨在赋能开发者和创新者创建基于LLM的应用程序和Agent。这一多功能工具旨在提供一个健壯且安全的Python环境,便于无缝集成和执行LLM驱动的项目。Pandora Box完全免费,通过pip install即可轻松安装。
2024-06-25 10:31:30
1251
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人