- 博客(904)
- 资源 (1)
- 问答 (3)
- 收藏
- 关注

原创 机器学习 专栏
随着现在以ChatGPT为代表的大模型发展,人工智能、机器学习、大模型 这些词逐渐火热起来了,所以是时候了解一下这些东西了,可能有的人会说不会太晚了吗,其实不晚,因为我们从来都是技术的创造者,只是技术的使用者而已,在一定程度上来说,及时的学会使用,对普通人来说就足以过上不错的日子。但是伴随着老的生产力的落幕,必然有新的生产力出现,否则整个社会的发展就陷入了停滞,其实我们可以看到现在的AI 发展的这么快,每一轮的技术发展都会有一二十年的生命周期,我们只能说传统互联网走到了夕阳西下的时候。
2024-03-30 13:11:30
170886

原创 数据仓库实战教程
以hadoop 作为基础生态,从0到进行数仓建设,主要分为基础篇和实战篇两部分,基础篇主要是各种组件的学习和案例,实战篇主要是三家企业的数仓设计案例,最后是扩展篇主要是实时数仓。
2020-12-28 09:19:07
223989
18

原创 Java集合汇总篇
一. 集合框架Java 集合框架一些列的接口和类来实现很多常见的数据结构和算法,例如 LinkedList 就是集合框架提供的实现了双向链表的数据结构,关于这一篇文章建议大家收藏,我会不断地完善和扩充它的内容,例如最下面的系列文章我以后也会对它进行不断的更新集合框架的接口集合框架提供了很多接口,这些接口都包含了特定的方法来实现对集合上的特定操作)我们将要学习这些接口以及子接口和它们的各种实现类,在开始之前我们先简单学习一下这些广泛运用的接口,可以看到整个集合框架,总共有三个顶级接口Collecti
2020-12-13 20:25:05
223731
3
原创 大模型——MCP 集成至 LlamaIndex 的技术实践
MCP(模型上下文协议,https://modelcontextprotocol.io)是面向 AI 应用交互的服务构建协议。开发者可通过该协议构建具备数据资源(resources)、功能工具(tools)和提示模板(prompts)的服务端点。
2025-04-04 14:36:38
102
原创 大模型——MCP 还没学完呢,MCPO又来了
MCPo 是一个简单、可靠的代理服务器,能够将任何基于 MCP 协议的工具转换为兼容 OpenAPI 的 HTTP 服务器。它通过标准化 RESTful API 接口,让复杂的工具变得易于使用,并支持与大语言模型(LLM)代理和应用程序的无缝交互。
2025-04-04 14:28:25
134
原创 大模型——如何在本地部署微软的OmniParser V2
微软的 OmniParser V2 是一款尖端的人工智能屏幕解析器,可通过分析屏幕截图从图形用户界面中提取结构化数据,使人工智能代理能够与屏幕元素进行无缝交互。该工具是构建自主图形用户界面代理的完美选择,它改变了自动化和工作流程优化的游戏规则。在本指南中,我们将介绍如何在本地安装 OmniParser V2、其运行机制、与 OmniTool 的集成及其实际应用。
2025-04-03 21:45:00
188
原创 记录一次StarRocks集群迁移的经历
新入职了一家公司,刚去做了两张报表后,接到一个任务,做StarRocks 集群迁移,背景是这样的就是以前是自建的SR,但是这个SR 是给线上业务用的,也就是说不是分析性业务,而是面向产品ToC 的,也了解了一下是因为单表数据量太大了,所以直接使用了SR,这多少有些让人哭笑不得了,现状是就目前这个SR 存在两个问题。但是遇到的问题是备份成功了,但是恢复的时候报错,云厂商说解决不了,3.0版本到3.3版本元数据发生变更,不能用备份恢复的方式来迁移。部署了半天,启动报错,错误忘记记录了,以后补上。
2025-04-03 12:00:08
88
原创 大模型——手把手教你在Ubuntu上部署Ragflow
相比较MaxKB而言,RAGFlow的部署过程可谓是复杂得多!我们之前已经介绍过了如何在macos 上部署Ragflow,今天我们看一下如何在Ubuntu上部署Ragflow。
2025-04-01 21:32:06
137
原创 大模型——手把手教你在macos上部署Ragflow
MacOS 要选择docker-compose-macos.yml来启动服务,这个配置文件已经针对MacOS环境做了特殊优化。如果你的电脑同时也安装了 Dify,大概率会端口冲突。RagFlow 的安装使用 Docker 完成,对应的目录文件下,有不同版本的**.yml**配置文件。进去之后,因为先添加模型,但是这里要注意模型的url ,因为是在doker 里面部署的。这里会提示我们没有设置系统模型,虽然我们添加了大模型。前面我们部署好了,就可以打开页面了,直接是。端口,所以这里我们输入IP 就可以了。
2025-04-01 21:16:52
369
原创 大模型——用腾讯ima对微信读书书架分类,还是DeepSeek懂我
最近使用ima比较多,结合个人阅读的场景,在家里有书柜就是一个分类问题,对于线上书架的书很多需要整理是一个问题,怎么样通过AI处理呢?然后我们就可以看到DeepSeek的分类,我们可以再进一步提问,让月度变得更加直观:对分类总结生成脑图。然后我们找到书架的地方,点击右上角的ima,提问:帮我整理书架上的书,进行分类,要求符合mece原则。首先我们下载ima.qq.com,进去ima客户端,输入weread.qq.com进入微信读书。今天我们就来一起撩一撩腾讯ima的解决方案。
2025-04-01 21:04:01
20
原创 大模型——带你快速了解大模型文件的存储格式
过去两年,开源 AI 社区一直在热烈讨论新 AI 模型的开发。每天都有越来越多的模型在Hugging Face上发布,并被用于实际应用中。然而,开发者在使用这些模型时面临的一个挑战是。我们将分析每种格式的,并提供,帮助你选择最适合的格式。
2025-04-01 07:43:17
332
原创 大模型——一文带你快速了解MCP
MCP 是一个开放协议,允许外部其他系统以一种通用的方式,向 AI 模型提供上下文(Context)。该协议定义了 AI 模型如何调用外部工具、获取数据和与外部其他服务交互。注:我们曾在什么是 MCP,Agent 通信协议的未来如何又如何?这篇文章中有介绍过:MCP 像一个“转接头”或者“通用插座”,它的作用是让各种不同的外部服务(比如 Google Drive、GitHub、Slack、本地文件系统等)通过一个标准化的接口与 AI 模型对接。
2025-04-01 07:37:32
98
原创 大模型——快速利用Dify轻松构建你的专属语料库
语料库,简单来说,就是大量文本数据的集合。对于训练或微调一个特定任务的语言模型来说,高质量的语料库至关重要。例如,如果您想让一个 LLM 擅长回答某个领域的专业问题,就需要用包含该领域知识的语料库对其进行训练。构建不同类型的语料库时,由于其目标、数据来源和预期用途的差异,可能会出现许多不同之处和问题。
2025-03-31 09:22:26
136
原创 大模型——RAG架构大揭秘:让你的模型更懂你!
但如果问题超出了它的知识范围,它可能就无能为力了。而RAG技术就像是一个“开卷考试”的学生,它不仅可以利用自己学到的知识,还能随时查阅一个巨大的“知识库”,从中找到最相关的资料,然后结合这些资料生成一个更准确、更丰富的回答。这就像是在一个巨大的图书馆里,你只需要说出你想要找的书的主题,系统就能立刻帮你找到最相关的几本书,并且还能告诉你哪些章节是你最需要看的。它的工作方式是这样的:当你问它一个问题时,它会从知识库中找出一些和你的问题最相似的文档,然后把这些文档和你的问题拼接在一起,扔给语言模型去生成回答。
2025-03-31 07:55:20
82
原创 大模型——Cherry Studio配置MCP服务全流程解析:让AI自动调用工具处理任务
最近 AI 领域真是隔几天就有一个新热度,随着越来越多的使用 MCP 制作的 Agent 产品出现,MCP 这个新名词也频繁刷屏,有着大火的趋势,那么什么是 MCP 呢?MCP 是一种接口协议,由 AI 大模型公司 Anthropic 在 2024 年 11 月推出,它的全称是 Model Context Protocol,即模型上下文协议!它是连接 API 和大模型的桥梁,通过 MCP,我们可以让 AI 模型能够用一种通用的语言和各种不同的工具与服务进行交流,比如浏览器,Excel 表格,网页截图等等。
2025-03-30 21:49:57
335
原创 大模型——MCP全解析,一步步教你借助第三方MCP Server开发Agent
现在一起来完成一个真正的Agent,这个Agent会使用第三方MCP Server中的工具来扩展自身能力,为了方便,这里借助LlamaIndex的FunctionCallingAgent来快速实现这个Agent(LangGraph请使用create_react_agent)。比如你的应用是一个Chatbot,可以从MCP Server中取出这些模板,让使用者选择使用。**快速的适应变化:**想象下,如果一个外部资源的接口发生变化,只需要访问它的MCP Server做修改,所有的LLM应用就可无缝适应。
2025-03-29 09:32:10
190
原创 大模型——Dify+Notion+DeepSeek 让你的知识库更加智能
我个人的主力笔记还是Notion,在Notion中存储了大量笔记资料,但Notion无法进行信息整合,另外搜索功能也很鸡肋,虽然目前Notion也集成了AI,那目测体感下来也就是一个GPT3.5的水平。配置文本分段设置和索引方法,自动分段或自定义规则,选择质量级别(高质量消耗更多令牌,也可以设置索引方法和检索参数,提高检索精准度。通过Dify+Notion的组合,可以将静态的知识库转变为智能的信息助手,真正实现知识的高效利用和价值最大化。而且我记笔记的特点是没有分类,没有标签的最原始信息,不使用任何模板。
2025-03-29 09:24:47
207
原创 大模型——使用Ollama本地部署Gemma-3-27B大模型,基于LangChain分析PDF文档
默认情况下,Ollama 运行语言模型的令牌上下文窗口为2048,当推理时发送的令牌数大于此数值,提示便会被截断。而谷歌 Gemma 3 大语言模型拥有高达 12.8 万令牌的超大上下文窗口,为充分发挥其优势,在本地部署时,基于 270 亿参数版本的 Gemma 3,结合硬件能力,从 gemma3:27b 派生了本地模型,将上下文窗口设置为 16000 个令牌。其具备多模态能力,能处理文本和图像;当用户输入任何研究论文的网址时,系统将根据提示摘要指令,在不丢失上下文信息的情况下,显示出连贯的摘要内容。
2025-03-28 07:54:37
380
原创 大模型——Dify + Notion 让你的个人知识库活起来
我个人的主力笔记还是Notion,在Notion中存储了大量笔记资料,但Notion无法进行信息整合,另外搜索功能也很鸡肋,虽然目前Notion也集成了AI,那目测体感下来也就是一个GPT3.5的水平。配置文本分段设置和索引方法,自动分段或自定义规则,选择质量级别(高质量消耗更多令牌,也可以设置索引方法和检索参数,提高检索精准度。通过Dify+Notion的组合,可以将静态的知识库转变为智能的信息助手,真正实现知识的高效利用和价值最大化。而且我记笔记的特点是没有分类,没有标签的最原始信息,不使用任何模板。
2025-03-28 07:49:25
55
原创 大模型——快速打造数据分析应用
整体的功能大致如下,后面我们把Text2SQL 的功能加入进来,也把更多的业务元数据加入进来,后面用户就可以提出更多切合业务的需求了。
2025-03-27 18:10:32
93
原创 大模型——提升自然语言转换为 SQL 查询(NL2SQL)准确度的探索-- LLaMA-Factory 蒸馏 DeepSeek 模型的方法介绍
提升自然语言转换为 SQL 查询可能的3个方向有:1. Prompt 工程,以用户角色提供充足的上下文信息;2. 建设知识库,以系统角色提供上下文信息;3. 增强模型的NL2SQL能力。在第3个方向上,我们发现:本地部署的 deepseek-r1:32b 的 NL2SQL 的准确度与满血版的在线 deepseek-r1:671b 存在较大差距。这说明模型能力会影响 NL2SQL 准确性。本文通过蒸馏 DeepSeek 模型,探索:通过提升模型专业能力,能够提高 NL2SQL 的准确度。
2025-03-27 17:11:55
275
原创 大模型——带你快速上手WrenAI,一款支持多语言的AI数据助手,从SQL生成到可视化全流程支持
WrenAI是一个 AI 驱动的端到端数据交互工具。它通过自然语言处理(NLP)技术,将用户的自然语言问题转化为精确的 SQL 查询,并生成相应的数据可视化和报表。这种直观的交互方式,使得无论是数据科学家还是业务人员,都能在不需要深入 SQL 技能的情况下,快速从数据中获取洞察。Wren AI 由三个核心服务组成:Wren UI、Wren AI服务、Wren引擎。WrenAI通过将自然语言处理与数据交互技术结合,为数据团队和企业提供了一个端到端的智能数据处理平台。
2025-03-27 09:11:09
132
原创 大模型——持续霸榜Github 的开源SQL AI代理 Wren AI
通过本文的介绍,相信你已经对WrenAI有了更深入的了解。无论是数据分析师、产品经理还是业务决策者,WrenAI都能成为你数据工作中的得力助手。
2025-03-27 09:08:37
166
原创 大模型——AI驱动的README生成器 效率翻倍
Post-Commit钩子是每个git提交之后运行的脚本。生成README.md文件。使用Llama 3模型对项目进行全面描述。自动提交README.md文件,使用标志机制避免无限循环。
2025-03-26 07:32:13
180
原创 大模型——最全梳理 一文搞懂RAG技术的5种范式!
高级 RAG 引入了具体的改进措施,以克服 Naive RAG 的局限性。为了提高检索质量,它采用了检索前和检索后策略。为了解决索引问题,高级 RAG 通过使用滑动窗口方法、细粒度分割和元数据的整合,改进了索引技术。此外,它还采用了多种优化方法来简化检索过程。模块化 RAG 架构超越了前两种 RAG 范式,具有更强的适应性和多功能性。它采用了多种策略来改进其组件,例如为相似性搜索添加搜索模块,以及通过微调完善检索器。为应对特定挑战,还引入了重组 RAG 模块和重排 RAG 管道等创新方法。
2025-03-26 07:31:33
144
原创 大模型——Text2SQL 的实现探究
*Spider、WikiSQL和CHASE等主流Text2SQL数据集提供****自然语言查询与SQL查询对应数据**Text2SQL数据集是指一类专门用于训练Text2SQL(文本到SQL)模型的数据集合。**,主要包含****数据集收集、数据预处理、模型选择与构建和微调权重***基于开箱即用的Text2SQL Agent结合业务整合到应用***通过自然语言描述完成复杂数据库的查询操作****开源的AI原生数据应用开发框架****是一个利用LLMs实现****主要包括两种:**
2025-03-25 20:20:38
431
原创 大模型——极简LangChain智能体开发入门指南
在人工智能快速发展的时代,大型语言模型(LLM)如 OpenAI 的 GPT 系列,已成为生成自然语言文本的核心技术。然而,将这些模型应用于实际应用(如聊天机器人或虚拟助手)时,开发者常常面临提示管理、外部数据集成和上下文保持的挑战。LangChain 作为一个开源框架,旨在简化这些复杂性,提供模块化工具,帮助开发者高效构建 LLM 驱动的应用。LangChain 于 2022 年 10 月由 Harrison Chase 在 Robust Intelligence 启动,迅速获得社区支持,GitHub 上
2025-03-25 20:15:44
202
原创 大模型—— 走进Langchain:全面解析
Langchain是一个用于开发由大型语言模型(LLM)支持的应用程序的框架。它提供了一系列的工具、接口和组件,旨在简化和加速LLM应用程序的开发过程。通过Langchain,开发者可以更方便地将LLM与外部数据源、工具以及其他组件进行集成,构建出功能丰富、复杂的应用程序。Langchain的技术架构是一个分层的、模块化的架构。从底层到高层,它包括了数据层、组件层、链、Agents 以及应用层。数据层负责与各种外部数据源进行交互,获取和存储数据;
2025-03-25 20:12:41
56
原创 大模型——LangManus:基于LangChain的开源多智能体助手
它的主要职责是过滤掉不必要的闲聊内容,例如简单的问候语、无意义的对话、以及涉及敏感话题(如政治、色情等)的请求。在过去,如果想自己实现一个 ReAct 风格的大语言模型应用,需要自己编写、调试 Prompt,设计工具调用协议,手工编排流程,如果要想做一个支持流式输出的前后端应用更是难上加难。我们的 LangManus 开源项目中也采用了上述基于 Multi-Agent Supervisor 和 ReAct 的架构,包含了多个智能体,并且已经集成了多种工具,使 AI 能够执行各种研究任务。
2025-03-25 08:57:47
432
原创 大模型——数万开发者推荐的LangGraph,Swarm让效率暴涨300%!
综上,LangGraph Multi-Agent Swarm适用于需要高度灵活性、复杂任务分解、持续交互和多步骤操作的场景,特别是在对话代理、专业报告撰写、代码生成等领域具有显著优势。LangGraph Multi-Agent Swarm 是使用 LangGraph 创建 swarm 风格的多代理系统。系统会记住最后一个处于活动状态的座席,确保在后续交互中,与该座席的对话恢复。SQL代理和研究特化多代理(STORM)对话代理和长运行多步骤LLM应用。智能代理检索与生成(RAG)系统。多智能体系统(MAS)
2025-03-25 07:52:47
153
原创 大模型——字节跳动开源AI Agent框架Agent TARS:智能化自动化的新利器
字节跳动开源的Agent TARS框架以其多模态能力、全面的工具支持和灵活的工作流程编排,为用户和开发者提供了一个高效、智能的自动化解决方案。无论是简化日常任务还是加速复杂项目,Agent TARS都展现出了巨大的潜力。对于有兴趣探索AI Agent的个人或团队来说,Agent TARS无疑是一个值得尝试的工具。未来,随着技术和社区的共同努力,Agent TARS或将成为AI自动化领域的重要里程碑。
2025-03-24 13:49:36
793
原创 大模型——Agent TARS:一键让AI托管电脑!字节开源PC端多模态AI助手,无缝集成浏览器与系统操作
Agent TARS 是一款开源的多模态AI助手,旨在通过视觉解析网页并无缝集成命令行和文件系统,帮助用户高效完成复杂任务。Agent TARS 的核心在于其强大的代理框架,能够通过事件流与UI无缝连接,实现任务的自动化执行。如果需要调整任务方向,可以在顶部的特殊输入框中输入你的想法并按下回车键。Agent TARS 将向远程服务器发送请求,上传 HTML 文件,并生成一个可分享的 URL。,Agent TARS 将你的任务打包为一个 HTML 文件,方便你与他人分享。页面下载最新版本的桌面程序包。
2025-03-24 13:48:11
506
原创 大模型——基于腾讯云大模型知识引擎的DeepSeek满血版模型搭建【法律大模型专家模型搭建实战】
大模型知识引擎(LLM KnowledgeEngine),是面向企业客户及合作伙伴的,基于大语言模型的知识应用构建平台,结合企业专属数据,提供知识问答等应用范式,更快更高效地完成大模型应用的构建,推动大语言模型在企业服务场景的应用落地。腾讯云大模型知识引擎结合企业专属数据,提供知识问答等应用范式及原子能力接口服务,能够更快更高效地完成大模型应用的构建,推动大语言模型在云通信与企业服务场景的应用落地。
2025-03-24 07:50:36
202
原创 大模型——Deepseek 实战全攻略,一文带你玩转Deepseek
Deepseek 是杭州深度求索人工智能基础技术研究有限公司旗下的一款基于 Transformer架构的大型语言模型。它在大规模无监督数据上进行预训练,学习到了丰富的语言知识和模式,能够生成高质量的文本、回答问题、进行文本摘要等多种自然语言处理任务。强大的语言理解能力:能够准确理解文本的语义和语境,处理复杂的语言结构和歧义。高效的生成能力:可以快速生成连贯、有逻辑的文本,满足不同场景下的需求。可扩展性:支持在不同的硬件平台上进行部署,并且可以根据具体任务进行微调,以适应特定的应用场景。
2025-03-24 07:46:20
167
原创 大模型——让Word插上AI的翅膀:如何把DeepSeek装进Word
1. 回到Word,点击“文件”->“选项”->“自定义功能区”。2. 在右侧的“主选项卡”中,右键点击“开发工具”,选择“添加新组”。3. 将新组重命名为“DeepSeek”,并选择一个你喜欢的图标。4. 在左侧的命令列表中,选择“宏”,找到我们刚刚创建的“CallDeepSeek”宏,将其添加到“DS生成”组中。5. 最后,将这个按钮重命名为“DeepSeek V3”。
2025-03-21 09:05:59
730
原创 大模型——智能模型新篇章:RAG + Fine-Tuning 混合增强策略
RAG和特定领域微调的结合,为提升大型语言模型的外部知识和领域专长提供了一种强大的解决方案。通过发挥这两种方法的优势,研究人员已经开发出了使大语言模型能够基于事实信息进行推理、适应专业领域,并生成更可解释和可信输出的方法。随着RAG和微调之间的联合作用不断被探索,我们可以预期未来的语言模型将不仅拥有广泛的知识,还能展现出深入的领域专长、推理能力和坚实的事实基础——这是迈向更知识渊博和可靠的AI系统的重要一步。
2025-03-21 09:04:50
520
原创 大模型——Deepseek 万能提问公式:高效获取精准答案
通过以上万能提问公式,你可以让 Deepseek 或其他 AI 工具更高效地理解你的需求,并提供精准、实用的答案。
2025-03-21 09:03:20
429
原创 数仓工具—Hive语法之不同纬度聚合
但是我们今天遇到的问题是,使用的工具不支持grouping sets,既然不支持grouping sets 那肯定就不支持cube 和rollup 了,所以这里我给大家介绍两个替代方案。提到不同纬度聚合,大家想到的肯定是grouping sets,或者是cube和rollup 其实这些我们之前都讲过,可以看看之前的文章。三个维度,你可以理解为订单表,这里我们就计算金额吧,需求是计算出每个产品的总金额,同时计算出每个品牌的总金额。这是一个小伙伴提供的思路,我自己试了一下,可以的。
2025-03-20 21:24:39
551
原创 大模型——Linly-Dubbing 本地部署教程:一键实现视频多语言 AI 配音等强大功能
是一个智能视频多语言 AI 配音和翻译工具,它融合了 YouDub-webui 的灵感,并在此基础上进行了拓展和优化。我们致力于提供更加多样化和高质量的配音选择,通过集成 Linly-Talker 的数字人对口型技术,为用户带来更加自然的多语言视频体验。通过整合最新的 AI 技术,在多语言配音的自然性和准确性方面达到了新的高度,适用于国际教育、全球娱乐内容本地化等多种场景,帮助团队将优质内容传播到全球各地。
2025-03-20 09:10:44
649
TA创建的收藏夹 TA关注的收藏夹
TA关注的人