AI粉嫩特攻队-优快云博客

原创 RAG越来越不准？一文详解元数据与标签的系统优化方法（附完整流程图+实用提示词）

——只要你的文档有“年份=2023”“主题=心血管”“类型=研究”这几个元数据，系统就能分分钟帮你锁定。如果能把三家的优点结合起来——既要“傻瓜式体验”，又能灵活应对复杂业务，还能保证检索又准又全，以及生成高质量的回复，就可能接近真正的RAG理想形态。在RAG里，标签的作用是“语义筛选”：你问“入职流程复杂怎么搞”，系统就能通过“新员工”“流程优化”等标签帮你找到对应答案。标签就像你在朋友圈发照片时随手加的“#心情好”这种tag，也像豆瓣用户会给《流浪地球》打的“硬科幻”“刘慈欣”“催泪”等。

2025-06-06 21:45:00 939

原创 RAG越来越不准？从Dify和ima知识库看元数据与标签如何让大模型更懂你

另外，Dify也支持让大模型自动识别用户问题中可能包含的元数据信息，只需要将手动模型改为自动模式，然后选择一个大模型即可(不过自动模式好像看不到实际提取的元数据的日志，所以不能方便的知道是否生效)。例如，用户想了解"A部门本周的工作情况"，可以选择"A部门"、"周报"这两个标签，并将"提交日期"设为本周，然后提问"帮我总结一下本周A部门的工作情况"。比如，开发者可以在”知识检索“节点上，手动设置权限控制、文件类别等元数据过滤，确保用户的问题被约束在指定的知识范围内，从而提升检索的安全性和相关性。

2025-05-28 23:50:00 828

原创 RAG越来越不准？你可能忽略了“元数据”的力量

内置元数据：在文件上传时自动提取或标注，不允许删除和修改，包括：文件名、文件类型(.docx、.jpg、.mp4等)、上传者、上传时间、更新时间、文件来源、文件大小、字数等信息。自定义元数据：支持文件上传后按需添加和修改，例如：内容摘要、文件类别(合同、报表、手册等)、适用行业、适用区域、适用期限、归属对象等。然后，用户选择了元数据：产品名：A 、产品名：B 、文档类型：产品宣传、文档类型：技术规范。[ ["产品名:X","文档类型:用户手册"], ["产品名:Y","文档类型:快速指南"]]

2025-05-14 21:14:00 256

原创别再堆文档了，大模型时代知识库应该这样建

知”是知道，“识”是辨识。你知道小明今年10岁，体重120斤，但仅凭这些信息，无法指导你做出“小明今天晚饭吃什么？”的决策。而当你获得一条“10岁儿童的正常体重范围是23-50kg”的信息时，你能够判断小明超重了，然后得出“清淡饮食更合适”的决策。

2025-04-21 21:32:00 553

原创【AI工具实战】一招解决英文视频困境，四步用AI搞定全中文字幕，你也可以！(文末附工具下载)

如果视频可以下载到本地...如果可以把视频的说话人音频转成字幕文件...如果可以把字幕文件转成中文...如果有视频播放器可以载入字幕文件...耶？不需要你是程序员，不需要你懂深奥理论，你只需要有一颗好奇的心，和那份"看到问题就想解决"的偏执与热情。搭建过程就不详述了，感兴趣的话，可以去参考这篇《如果字幕时间有偏差，可以在同步设置里微调，让字幕的显示时间提前一些或延迟一些。第四步：中文的srt文件搞定了，通过视频播放器载入字幕文件的活儿咋整？第二步：视频下载好了，把视频的说话人音频转成字幕文件的活儿咋整？

2025-04-05 12:11:00 737

原创 Dify开发必备：分享8个官方文档不曾解释的关键技巧

虽然在我已经用了很久，对Dify比较熟悉的情况下去写这篇文章，感觉依然只是展示了释放Dify潜能的冰山一角。可能还有更多的、更能释放dify潜力的方法，埋藏在深处，在我还没有发掘的地方。但仍然希望这篇文章能为你在Dify的探索之路上提供一些指引。技术永远在发展，这些经验可能会随着版本更新而过时，但踩坑过程中经历的解决问题的思路和方法会是我们永恒的财富。在这个AI飞速发展的时代，请保持好奇心和学习热情，愿我们都能在技术的海洋中，乘风破浪，不断成长。你用Dify时遇到过哪些坑点或爽点？欢迎评论区留言讨论。

2025-04-03 13:58:00 1084

原创编程神器Trae：当我用上后，才知道自己的创造力被低估了多少

回顾整个开发过程，我不禁再次感叹AI工具带来的变革。曾经，开发一款桌面应用对我这样的非专业开发者来说是非常难，更别说这种炫酷的效果了。而现在，借助trae这样的AI编码神器，我只需描述需求，AI就能生成符合预期的代码。这不仅仅是技术的进步，更是创造力的解放。AI拓宽了我们创造工具的边界，让我们敢于尝试曾经觉得困难的事情。每个人都可以成为创造者，用自己的想法解决实际问题。正如这次我用AI开发的音频转文字AI工具，它解决了离线转换大音频文件的痛点，也许正是你一直在寻找的答案。

2025-03-25 00:39:00 847

原创提示词工程师自白：我如何用一个技巧解放自己的生产力

咱们平时其实还是国产模型用的多，尤其是DeepSeek出世之前，用于生产环境的还是智谱、千问，网上各种流传的适用于chatgpt claude的提示词，就真的没那么适用。这款充电宝采用最新的超级快充技术，支持高达100W的充电功率，仅需15分钟即可为您的设备补充一天所需的电量，让您随时随地畅享无忧电力。加持后生成的文案按照"问题-解决方案-产品特点-使用场景-总结呼吁"的顺序展开，结构确实清晰流畅，且易于理解一些，读起来也更让我有情感共鸣，结尾还有呼吁行动，有助于促进转化。一天得奖自己好几个鸡腿子。

2025-03-23 17:06:00 923

原创数据、信息、知识、智慧：AI时代我们该如何思考？

从大数据到大模型，从大模型到知识库，从知识库到工作流，再到现在的多智能体协作，这不只是技术升级那么简单，它正在改变我们思考问题的方式，甚至改变我们工作和生活的方式。我们既是这场变革的见证者，同时也是参与者。如果能理解AI发展背后的这些规律和逻辑，就像掌握了一张未来世界的地图，帮我们在这个变化超快的时代找到属于自己的生态位。说了这么多，其实就想表达一个简单的想法：“AI的发展不是偶然的，而是遵循着人类认知发展的自然规律，了解了规律，就了解了AI的走向。工业革命解放了人类的体力，AI革命正在解放人类的脑力。

2025-03-21 00:14:00 996

原创 ChatBI≠NL2SQL：关于问数，聊聊我踩过的坑和一点感悟

"如果说数据是新时代的石油，智能问数就是能让普通人也能操作的智能钻井平台。"这里是**AI粉嫩特攻队！** ，这段时间真的太忙了，不过放心，关于从零打造AI工具的coze实操下篇正在进行中。今天，我们先聊聊另一个很热闹的主题——ChatBI。还记得那些陷入Excel地狱的日子吗？当同事问你"上个季度我们的销售增长率是多少"，你只能叹口气，打开庞大的数据库，编写一段复杂的SQL语句，然后祈...

2025-03-09 14:29:00 899

原创当懒惰遇上AI：我如何用Coze让大模型帮我整理2.5万字课程笔记

能写代码绝不动手，能用AI绝不写代码 —— AI粉嫩特攻队信条通过本文学会打造这个AI工具,只有一个要求:识字且会上网！一个小困扰有朋友最近在上一位大佬的线上直播课程，感叹道："老师讲得很好但节奏太快，根本来不及记录详细笔记，只能速记要点。课后想不起完整内容又怕有遗漏，只能来回拖动进度条找对应时间点，既耗时又耗心力。"作为一名坚守"能写代码绝不动手，能用AI绝不写代码"信条的特攻队...

2025-03-05 00:42:00 950

原创 AI时代的灵魂拷问：我们真正的核心竞争力到底是什么？

“当所有人都在谈论AI+的时候，今天我想聊一点不一样的...”上周，朋友看着我用Cursor在30分钟内完成了他过去需要两天才能完成的工作。那一刻，一种强烈的危机感涌上心头，他问我：“如果AI可以做得和我们一样好，甚至更好，那我们存在的价值是什么？”这恐怕是当下许多人都在思考的问题。时代变了，我们该怎么办？从对各行各业的影响程度来看，上一个时代属于互联网、大数据，而如今毫无疑问属于AI...

2025-03-02 21:46:00 698

原创 DeepSeek-R1的“思考”艺术，你真的了解吗？

大家好~，这里是AI粉嫩特攻队！今天咱们来聊聊一个有趣的话题——DeepSeek-R1到底什么时候会“思考”，什么时候又会选择“偷懒”？最近有朋友问我：“听说现在的AI都会‘推理’了，那它们是不是每次回答问题都要走一遍复杂的思维链(CoT)？”嗯……这个问题听起来简单，背后其实藏着R1设计的智慧和取舍。举个例子，当你问R1“你好”时，它显然不会给你甩出一串哲学式的推理过程吧？但如果问题是“如...

2025-02-22 19:57:00 337

原创程序员的生产力神器Cursor -新手实操指南

不得不说这个Cursor AI简直是神器中的神器！???? 代码自动补全就算了，关键是它能直接读懂我的意图，秒懂需求！为你自动生成整个项目级别的代码！开发过程丝滑得像在跟老朋友聊天，代码质量贼高，效率提升1000%！这哪是什么AI助手，简直就是贴心小棉袄！???? 程序员的生产力神器，多一点时间做更有意义的事不香吗～本篇指南从科普、安装、配置、学习(bai)研究(piao)、项目实战演练几个方面助你上手...

2025-02-16 17:42:00 2516

原创 AI开源项目层出不穷，MIT 和 Apache2.0究竟有什么区别？

AI 开源的黄金时代，开源协议你会区分吗？这几年，AI 技术的开源浪潮席卷全球。无数个人开发者和团队贡献的AI工具和框架层出不穷，AI 开源项目正以前所未有的速度涌现。开源不仅推动了技术的普及，也让更多开发者有机会参与到前沿技术的创新中。但你有没有想过，这些开源项目背后，协议的区分有多重要？作为开源作者，你希望自己的代码被更多人使用，但也想保护自己的权益；作为 Fork 开发者，你希望合法...

2025-02-16 17:25:00 751

原创人人都看得懂的DeepSeek入门科普

当大家都在好奇下一代AI会怎样改变我们的工作与生活时，中国公司 DeepSeek 正以惊人的速度和态度闯进大众视野。它究竟是什么，能做什么，又为何能在AI热潮里高调崭露头角？本文带你了解 DeepSeek 及其最新推出的两款大模型，顺便一起讨论它如何搅动整个 AI 行业的水面。1. DeepSeek是什么？DeepSeek = AI + 国产 + 免费 + 开源 + 强大DeepSeek...

2025-02-16 17:04:00 742

原创 DeepSeek普照的阳光下，继续RAG还是Distillation？

什么是RAGRAG概述RAG，全称为Retrieval-Augmented Generation(检索增强生成)，是一种结合了信息检索和文本生成的人工智能技术。简单来说，RAG通过从大量文档或数据库中查找相关信息，并基于这些信息来生成更准确、更有针对性的回答或内容。为什么需要RAG？在传统的文本生成模型中，比如一些大型语言模型，它们虽然能够生成流畅的文本，但有时候会因为训练数据有限或者记...

2025-02-16 16:39:00 546

原创在windows主机本地快速部署使用deepseek-r1大模型

一台配备 Windows 操作系统、12GB 或以上显存的英伟达显卡、8GB 或以上内存，并能连接互联网的电脑可以继续阅读以下内容。简介Ollama(用于下载和启动大模型)Ollama 专注于本地大型语言模型(LLM)的快速、极简安装和使用，例如 LLaMA 3.3 和 DeepSeek-R1。它提供开箱即用的体验，适合个人开发者和小规模实验研究，但不适用于高可用性和高并发的生产环境。...

2025-02-16 16:13:00 815

原创用python做时间序列预测十：时间序列实践-航司乘客数预测

本文以航司乘客数预测的例子来组织相关时间序列预测的代码，通过了解本文中的代码，当遇到其它场景的时间序列预测亦可套用。航司乘客数序列预测步骤# 加载时间序列数据_ts = load_data()# 使用样本熵评估可预测性print(f'原序列样本熵:{SampEn(_ts.values, m=2, r=0.2 * np.std(_ts.values))}')# 检验平稳...

2020-06-16 09:32:00 2619 1

原创用python做时间序列预测九：ARIMA模型简介

本篇介绍时间序列预测常用的ARIMA模型，通过了解本篇内容，将可以使用ARIMA预测一个时间序列。什么是ARIMA？ARIMA是'Auto Regressive Integrated Moving Average'的简称。ARIMA是一种基于时间序列历史值和历史值上的预测误差来对当前做预测的模型。ARIMA整合了自回归项AR和滑动平均项MA。ARIMA可以建模任何存在一...

2020-06-16 09:30:00 7619 2

原创用python做时间序列预测八：Granger causality test(格兰杰因果检验)

如果想知道一个序列是否对预测另一个序列有用，可以用Granger causality test(格兰杰因果检验)。Granger causality test的思想如果使用时间序列X和Y的历史值来预测Y的当前值，比仅通过Y的历史值来预测Y的当前值得到的误差更小，并且通过了F检验，卡方检验，则X对Y的预测是有一定帮助的。了解了Granger causality test的思想之...

2020-06-10 09:30:00 10157 2

原创用python做时间序列预测七：时间序列复杂度量化

本文介绍一种方法,帮助我们了解一个时间序列是否可以预测，或者说了解可预测能力有多强。Sample Entropy （样本熵）Sample Entropy是Approximate Entropy(近似熵)的改进，用于评价波形前后部分之间的混乱程度，熵越大，乱七八糟的波动越多，越不适合预测；熵越小，乱七八糟的波动越小，预测能力越强。具体思想和实现如下：思想Sample ...

2020-06-10 09:28:00 1593 1

原创用python做时间序列预测六：相关函数图、偏相关函数图、滞后图

经典的时间序列预测方法都是假设如果一个时间序列有显著的自相关性，那么历史值对预测当前值会很有帮助，但是究竟取多少阶的历史值，就需要通过分析相关函数图和偏相关函数图来得到。本文介绍如何什么是相关函数图和偏相关函数图，另外还会介绍一下滞后图。什么是自相关和偏自相关函数？先来解释下滞后阶数n，如果当前值和前2期的值有关，则n=2，那么可以用时间序列和它的2阶滞后序列来训练一个自回归...

2020-06-08 20:17:00 3624 2

原创用python做时间序列预测五：时间序列缺失值处理

有的时候，一些时刻或连续时间段内的值无法采集到，或者本身就没有值，本文将介绍如何处理这种情况。一般而言，有以下几种方法：对所有的缺失值用零填充。前向填充：比如用周一的值填充缺失的周二的值后向填充：比如用周二的值填充缺失的周一的值采用n最近邻均值法填充：比如n取2，则用t-2,t-1，t+1,t+2时刻的平均值来填充缺失的t时刻的值。单线性插值：取某个缺失值的时间点，做...

2020-06-08 20:06:00 6411 1

原创用python做时间序列预测四：平稳/非平稳时间序列

上篇文章简单提到了应该用平稳时间序列做预测，本文将介绍具体概念和原因。Stationary Series 平稳序列平稳序列有三个基本标准：1、序列的均值(mean)不应该是时间的函数(意思是不应该随时间变化)，而应该是一个常数。下面的左图满足这个条件，而右图的均值受时间的变化影响。2、序列的方差(variance)不应该是时间的函数。这种特性称为homoscedastici...

2020-06-02 16:39:00 4453 2

原创用python做时间序列预测三：时间序列分解

在初始概念篇中，我们简单提到了时间序列由趋势、周期性、季节性、误差构成，本文将介绍如何将时间序列的这些成分分解出来。分解的使用场景有很多，比如当我们需要计算该时间序列是否具有季节性，或者我们要去除该时间序列的趋势和季节性，让时间序列变得平稳时都会用到时间序列分解。加法和乘法时间序列时间序列的各个观测值可以是以上成分相加或相乘得到：Value = Trend + Seasonal...

2020-06-02 16:37:00 4391 2

原创用python做时间序列预测二：时间序列的一般数据格式和可视化

本文将介绍如何通过python来读取、展现时间序列数据。读取时间序列数据一般用cvs等电子表格的形式存储，这里以cvs为例：from dateutil.parser import parse from datetime import datetimeimport matplotlib as mplimport matplotlib.pyplot as pltimport...

2020-06-02 16:36:00 1157

原创用python做时间序列预测一：初识概念

利用时间序列预测方法，我们可以基于历史的情况来预测未来的情况。比如共享单车每日租车数，食堂每日就餐人数等等，都是基于各自历史的情况来预测的。什么是时间序列？时间序列，是指同一个变量在连续且固定的时间间隔上的各个数据点的集合，比如每5分钟记录的收费口车流量，或者每年记录的药物销量都是时间序列。时间序列的类型根据时间间隔的不同，时间序列可以是按年度(Annual)、...

2020-06-02 16:33:00 643

原创深度学习环境搭建：window10+CUDA10.0+CUDNN+pytorch1.2.0

去年底入手一台联想Y7000P,配置了Nvidia GeForce GTX 1660 Ti GPU，GPU内存6G，但是因为有GPU服务器，所以一直没有在这台笔记本上跑过模型，如今经过一番折腾，终于在此笔记本上搭建好了环境，并成功使用GPU训练了一些模型，本篇记录了环境搭建的过程。检查你的GPU首先确保你的电脑有Nvidia的GPU，并且支持CUDA，可以参考这个网址。安装vs...

2020-05-06 20:22:00 1156

原创理解中台

前段时间参加了IAS2019(互联网架构峰会)，本次峰会以中台为主题，所以又称中台战略大会，据说是全国首届关于中台战略的会议，会议上有许多优秀的企业架构师带来了他们各自在实践中台过程中的心得。本文就笔者对自己参与的会场的情况做一些分享，同时也写写自己参会以及查阅相关资料后关于中台这一概念的理解和体会。什么是中台？中台不是一个新名词。然而你如果想找到它的源头，可能真不太好找...

2020-01-14 16:10:00 333

原创 OAuth2.0概念以及实现思路简介

一、什么是OAuth？OAuth是一个授权规范，可以使A应用在受限的情况下访问B应用中用户的资源(前提是经过了该用户的授权，而A应用并不需要也无法知道用户在B应用中的账号和密码)，资源通常以REST API的方式暴露。二、什么是OAuth2.0?有2.0自然有1.0，相比1.0，2.0有如下不同：授权过程比1.0更简洁全程使用https，保证...

2020-01-10 11:05:00 860

原创理解CART决策树

CART算法原理CART全称为Classification and Regression Tree。回归树相比ID3，CART遍历所有的特征和特征值，然后使用二元切分法划分数据子集，也就是每个节点都只会分裂2个分支。接着计算数据子集的总方差来度量数据子集的混乱程度，总方差越小数据子集越纯，最后选择总方差最小的划分方式对应的特征和特征值，而二元切分的依据就是将小于等于这个特征值和大...

2020-01-07 17:19:00 332

原创理解ID3决策树

决策树是一个树形结构，类似下面这样：上图除了根节点外，有三个叶子节点和一个非叶子节点。在解决分类问题的决策树中，叶子节点就表示所有的分类，比如这里的分类就有3种：无聊时阅读的邮件、需及时处理的邮件、无需阅读的邮件。使用决策树来分类某个样本数据，就是利用根节点选取的特征，将当前输入样本划分到根节点下的某个子节点上，然后再利用子节点表示的特征来将当前样本划分到该子节点下的某个子节点上...

2020-01-07 12:20:00 367

原创信息熵为什么要定义成-Σp*log(p)？

信息熵为什么要定义成-Σp*log(p)？在解释信息熵之前，需要先来说说什么是信息量。信息量是对信息的度量，单位一般用bit。信息论之父克劳德·艾尔伍德·香农(Claude Elwood Shannon)对信息量的定义如下：在解释这个公式之前，先看看下面的例子。比如一个黑箱里有2个苹果，8个橙子我们把从黑箱里取苹果、橙子看成是一个随机过程，X={苹果,橙子}。当我们了解到...

2020-01-07 12:01:00 1377 1

原创用机器学习打造聊天机器人(七) 总结篇

本文是用机器学习打造聊天机器人系列的最后一篇啦，请耐心看完吧。本系列文章展示了一个聊天机器人的打造过程，现阶段更高级的聊天机器人会加入更多语料，更多意图模式，用更好的算法，以及其他更多的小技巧，比如：我们可以结合上一个系列《手把手教你做命名实体识别》中介绍的bert模型，来代替这里的词向量模型，让句向量更好的表示出原句子中各词汇之间的相关性，比如“我喜欢苹果”和"我喜欢苹果笔记...

2019-12-20 17:46:00 652

原创用机器学习打造聊天机器人(六) 原理篇

本文是用机器学习打造聊天机器人系列的第六篇，主要介绍代码中用到的相关算法的原理。了解算法原理，可以让我们知道程序背后都做了些什么，为什么有时候会出现错误以及什么场景下选择哪种算法会更合适。word2vec我们使用的词向量模型就是基于word2vec训练的，word2vec 是 Google 在 2013 年推出的一个 NLP 工具，它的特点是将所有的词向量化，这样词与词之间就...

2019-12-20 17:44:00 343

原创用机器学习打造聊天机器人(五) 接入篇

本文是用机器学习打造聊天机器人系列的第五篇，在特性介绍中提到过，我们采用非侵入式设计，通过几个简单的 API 就可以接入聊天机器人到其他项目中，下面来看看具体步骤。接入步骤提供符合要求的领域问答语料的 txt 文件，按照意图类型划分成不同的txt文件，替换本引擎自带的txt语料文件，txt语料文件示例如下：可以看到，闲聊的语料文件以QA_talk-开头，业务类的以QA_s...

2019-12-20 17:41:00 340

原创用机器学习打造聊天机器人(四) 代码篇

本文是用机器学习打造聊天机器人系列的第四篇，将先对主要模块的代码进行展示和解读，末尾会给出完整代码的地址。建议先看主要模块的代码解读，有助于理解核心代码的思路，然后浏览完整项目代码的README文档，将项目跑起来体验以下，再针对性的根据接口去阅读各模块代码的实现。主要模块代码构造特征向量特征向量的构造有两种思想，一种是one-hot，一种是Dristributed Repres...

2019-12-10 16:45:00 310

原创用机器学习打造聊天机器人(三) 设计篇

本文是用机器学习打造聊天机器人系列的第三篇，通过阅读本文你将对聊天机器人的实现有一个大致的思路。我们的聊天机器人将具备什么样的特性？用户可以使用人类自然语言的方式来表达自己的意图。可以依据用户的反馈进行在线增量学习，使用的越久，能回答得问题越多。采用非侵入式设计，通过几个简单的API就可以接入。语料数据使用简单的txt格式，只要更换txt，就可以服务于不同的知识领域。提...

2019-12-09 17:00:00 257

原创用机器学习打造聊天机器人(二) 概念篇

本文是用机器学习打造聊天机器人系列的第二篇，有助我们先了解下聊天机器人的相关概念。什么是聊天机器人？聊天机器人是一个程序，该程序会回应人类的话，其载体可以是一个网页、一个桌面应用、一个app。人类使用文字或者语音的方式和其交流，其同样以文字或者语音的方式反馈给人类。如果为这样的程序套上一个音箱外表，就是智能音箱；套上一个动物外表，就是机器宠物；套上一个高仿真妹子外表，就是机器...

2019-12-09 16:43:00 179

空空如也

空空如也