Blessed_Li-优快云博客

原创 DeepSeek-OCR深度解析：新一代开源OCR模型的技术突破与核心优势

DeepSeek-OCR开源模型震撼发布，以10倍压缩比实现97%识别精度。其创新双塔架构（80M参数SAM-base+300M参数CLIP-large）通过智能视觉压缩技术，在处理512×512分辨率时保持低内存占用。支持近百种语言识别，能解析化学公式、几何图形等复杂内容，学术论文公式识别准确率达89%。应用场景广泛，某投行使用后财报分析效率提升36倍。该模型以380M参数实现超越10B模型效果，重新定义OCR技术标准，预示AI效率革命到来。

2025-10-22 13:43:51 1270

原创 Qwen新开源tongyi-DeepResearch：核心优势

【AI研究能力迈入自主时代】阿里巴巴通义实验室开源的tongyi-DeepResearch模型突破传统AI局限，实现从"被动应答"到"主动研究"的范式跃迁。该模型采用30B总参数+33亿激活参数的轻量化设计，在8项权威评测中超越OpenAI等旗舰模型，支持128K长文本处理，能独立完成多源检索、交叉验证到报告生成的全流程研究任务。创新性地融合全合成数据训练、双模式推理及端到端算法优化，开源后大幅降低专业研究门槛，为学术、法律、商业分析等领域提供普惠型智能研究工具。

2025-09-22 10:27:49 1520

原创 Linux系统： docker安装RagFlow教程

本文提供了RAGFlow系统的安装配置指南，主要包括：1）硬件要求（4核CPU/16GB内存/50GB存储）；2）系统内核参数配置；3）Docker和Docker Compose的详细安装步骤；4）RAGFlow的两种部署方式（CPU/GPU版本）；5）服务验证方法和常见问题处理。部署过程包含国内镜像加速配置建议，并特别说明了Elasticsearch所需的内核参数设置。安装完成后，可通过8080端口访问Web界面，日志查看和容器状态检查确保服务正常运行。

2025-09-05 16:33:59 361

原创小参数量大模型高效优化：SFT微调价值与前置条件准备

摘要：小模型凭借轻量化、低延迟等优势在边缘计算、实时推理等场景中具有不可替代性，但其通用预训练后的垂直领域适配性不足。SFT（监督微调）技术通过少量领域数据的针对性训练，可显著提升小模型的专业性能，使其在特定任务中表现媲美甚至超越大模型。SFT微调在时间、成本和硬件资源上具有显著优势，支持快速迭代和低成本定制化，使小模型能够灵活响应业务变化，成为企业级AI落地的高效解决方案。实战步骤包括环境准备、依赖安装和全流程部署，确保开发者和企业能够快速实现模型优化与应用。

2025-09-04 16:37:15 1077

原创 Higress云原生API网关详解与 Linux版本安装指南

Higress是阿里开源的云原生API网关，基于Istio/Envoy内核，集流量网关、微服务网关、安全网关和AI网关于一体。具有生产级稳定性（支持数十万QPS）、灵活扩展（Wasm多语言插件）、安全合规（内置WAF和10+认证方式）等优势。提供两种部署方式：独立部署（Docker环境一键安装）和Kubernetes生产级部署（Helm安装）。支持AI服务代理、微服务治理等场景，通过可视化控制台简化配置，是替代Nginx Ingress的新一代云原生网关解决方案。

2025-09-02 13:08:49 969

原创全球首个 L4 级智能体 MasterAgent：AI 从工具到自主创造的革命

2025年被公认为"AIAgent元年"，深圳深元人工智能发布全球首个L4级智能体母体系统MasterAgent，标志着AI从"工具化"迈向"全自主化"新阶段。该系统采用双引擎架构（MasterBuilder和AgentGroup），可实现分钟级智能体集群生成和多智能体自主协作，在金融、医疗、工业等领域实现突破性应用。MasterAgent具有国产化自主可控特性，支持自然语言操作，能自动完成从需求输入到结果交付的全流程，显著提升工作效率。该技术突破

2025-08-04 13:13:21 2874 2

原创【dify+milvus避坑指南】将向量库milvus集成给dify作为知识库

本文介绍了在WSL Linux环境下部署Milvus单机版和Dify平台的完整流程。主要内容包括：1)通过Docker Compose安装Milvus 2.5.6单机版，并配置可视化工具Attu；2)修改Milvus配置开启身份认证；3)部署Dify 1.6.0，调整环境变量连接已安装的Milvus服务；4)验证Dify知识库功能是否成功在Milvus中自动创建集合。部署过程中需注意端口冲突、版本匹配和认证配置等问题，若失败可检查向量化模型调用或查看Docker日志排查原因。

2025-07-30 11:33:29 1210

原创 Linux系统部署KAG知识增强生成框架完整指南

本文介绍了在Linux系统上部署KAG知识增强生成框架的完整指南。KAG是蚂蚁集团推出的专业领域知识服务框架，相比传统RAG技术具有逻辑推理、知识准确性和多模态管理等优势。指南详细说明了硬件要求（推荐16核CPU、64GB内存）、软件环境（Ubuntu/CentOS）和必要的Docker安装配置步骤。部署过程包括创建工作目录、获取配置文件、启动服务及验证功能。同时提供了常见问题解决方案，如镜像拉取缓慢、端口冲突和内存不足等问题。最后推荐用户关注官方资源以深入学习KAG的知识建模和企业集成方案。

2025-07-17 08:38:29 1768

原创 Linux系统安装部署GraphRAG完全指南

GraphRAG是微软开源的基于知识图谱的检索增强生成技术，通过构建实体关系网络提升传统RAG系统的全局理解能力。本文详细介绍了GraphRAG的Linux部署指南，包括环境准备（Python 3.10+、16GB+内存）、依赖安装、虚拟环境配置、Ollama本地模型部署（推荐使用gemma2:9b或中文优化模型）、项目初始化与配置。重点讲解了settings.yaml核心参数的设置方法、文档索引构建过程以及三种查询模式（全局/本地/混合）的使用。同时提供了Docker部署方案、中文优化技巧和常见问题解决方

2025-07-16 09:25:28 1501

原创 Linux部署Milvus数据库及Attu UI工具完全指南

本文详细介绍了在Linux系统上使用Docker部署Milvus向量数据库及Attu可视化管理工具的完整流程。包括环境准备（Docker和Docker Compose安装）、Milvus部署（配置文件获取、服务启动验证）、Attu管理工具部署，以及基本的操作指南和常用命令。同时提供了注意事项（版本兼容性、防火墙设置等）和常见问题排查方法。该方案适合开发测试和中小型生产环境，为开发者提供了简单高效的Milvus部署方案。

2025-07-16 09:10:25 1840

原创【Linux系统】部署n8n工作流自动化工具的完整指南

本文提供了在Linux系统中部署n8n工作流自动化工具的完整指南。n8n是一款开源、可自托管的自动化工具，支持可视化流程构建和代码扩展，适合个人开发者和企业使用。指南详细介绍了三种部署方式：Docker（推荐生产环境）、npm（开发环境）和二进制安装，并包含系统要求、依赖检查等准备工作。重点讲解了生产环境的关键配置，包括数据库设置、HTTPS加密、防火墙规则，以及数据备份、性能监控等运维最佳实践。最后提供了常见问题解决方案和进阶学习资源，帮助用户快速搭建可靠的自动化平台。

2025-07-15 09:02:33 2457

原创通义千问HumanOmniV2：开启AI理解人类意图的新纪元

阿里巴巴通义实验室开源发布HumanOmniV2多模态大模型，聚焦"理解人类复杂意图"三大突破：1.强制上下文总结机制，结构化分析表情、语调等线索；2.四维奖励体系强化逻辑推理；3.GRPO算法优化长序列学习。在IntentBench测试中，意图理解准确率达69.33%，远超同类模型。该模型可应用于视频分析、智能客服、教育评估等领域，通过GitHub、HuggingFace等平台开源模型权重及训练工具，推动AI从"感知信息"向"理解意图"跨越，未来

2025-07-15 08:39:36 1032

原创马斯克发布Grok 4：重新定义AI边界，还是一场昂贵的技术狂欢？

Grok 4以其多智能体协作、推理能力和生态整合，重新定义了AI的技术边界。但3000美元的定价、伦理争议和与现实世界交互的不确定性，使其成为一把"双刃剑"。当AI能独立完成博士级研究、参与商业决策，我们或许正站在通用人工智能（AGI）的门槛前。但正如马斯克所言："现实才是最终的推理测试。"Grok 4的真正价值，将在技术突破与社会责任的平衡中得到检验。你如何看待Grok 4的技术突破与争议？欢迎在评论区分享观点。

2025-07-14 09:47:04 888

原创 Dify v1.6.0 双向MCP功能详解：开启AI应用互联新纪元

Dify v1.6.0发布重大升级，原生集成双向模型上下文协议(MCP)，开启AI应用标准化互联新时代。该版本实现两大核心功能：作为客户端直接调用8000+外部工具（如Zapier），同时可将Dify应用发布为标准化MCP服务供其他系统调用。通过"即插即用"的协议设计，开发者配置时间从小时级缩短至分钟级，响应速度提升40%。典型应用场景包括智能客服、工业预测维护和跨平台内容创作，企业案例显示故障预测准确率提升75%，客服响应时间缩短90%。此次升级标志着AI开发从孤岛式工具向互联生态的范

2025-07-14 09:37:08 1238

原创 Qwen3 Rerank模型：相较于其他rerank模型，特殊在哪？

阿里巴巴发布开源重排序模型Qwen3-Reranker，在性能、多语言支持和灵活性上实现突破。该模型提供0.6B至8B三种参数量级，支持119种语言，其中8B版本在MTEB-R评测中达77.45分，代码检索准确率超81分。采用创新的单塔交叉编码架构和长文本处理技术，特别优化专业领域应用。目前已完全开源，支持从边缘设备到云端的多样化部署，显著提升搜索、RAG系统等场景的准确性，电商搜索转化率提升22%。

2025-07-11 08:26:19 2411

原创 Qwen3 Embedding模型：到底强在哪里？

阿里巴巴达摩院发布的Qwen3-Embedding模型在多语言语义理解领域实现重大突破，以70.58分登顶MTEB全球榜单。该模型采用创新的三阶段训练架构，包括弱监督预训练、数据精炼和模型融合，支持119种语言和编程代码理解。提供0.6B至8B三种参数规模，满足从边缘设备到云端的不同需求，特别在32K长文本处理上表现优异。开源生态和灵活部署方案使其在电商推荐、智能客服等领域展现商业价值。Qwen3系列正推动AI语义理解从"通用泛化"迈向"精准专用"的新阶段。

2025-07-11 08:23:08 1125

原创 Text2SQL技术路线全景解析：从传统方法到LLM时代的演进与实践

Text2SQL技术实现了自然语言到SQL查询的自动转换，使非技术人员也能便捷访问数据库。其发展经历了从规则引擎到深度学习，再到当前大语言模型（LLM）驱动的范式转换。核心方法包括提示工程（如思维链、检索增强生成）和模型微调，在Spider等复杂数据集上执行准确率可达86%以上。该技术已在电商、金融、制造业等领域落地，显著提升数据查询效率。未来趋势将向多模态输入、智能体协作和自迭代学习方向发展，进一步推动数据民主化。主要挑战包括跨域泛化、幻觉抑制和成本优化等问题。

2025-07-10 09:44:18 926

原创提升 RAG 精度 --从何下手

本文系统探讨了提升RAG（检索增强生成）技术精度的关键方法。从数据处理环节的数据清洗与结构化处理，到检索阶段的向量数据库优化与查询策略改进，最后到生成环节的prompt工程和模型微调，全面分析了各环节的优化策略。通过多维度协同改进，可以有效提升RAG系统在知识问答、信息检索等场景中的准确性和可靠性，为构建高性能RAG系统提供实用指导。

2025-07-10 09:27:49 750

原创构建Keras模型的三种方法

它在可用性和灵活性之间找到了很好的平衡点，因此是构建模型最常用的。同时还有高级的工作流程：无论你的问题多么罕见、多么复杂，应该都有一条清晰的解决路径。假设你要构建一个系统，按优先级对客户支持工单进行排序，并将工单转给相应的部门。工单的优先级分数，它是介于 0 和 1 之间的标量（sigmoid 输出）其元数据）、多输出模型（预测数据的不同方面）或具有非线性拓扑结构的模型。任何一种工作流程的组件都可以用于其他工作流程，它们之间可以互相通信。常简单的工作流程，也有非常灵活的工作流程。

2024-08-14 18:56:57 625 2

原创 Python环境的克隆【包含指定路径手段】

并不能直接在后面加一个-p指定路径，是会报错的。导致克隆到的路径不是你的目标路径。这就是一个修改默认路径的方法。

2024-08-06 15:19:50 642 2

原创【scikit-learn】如何查看特征重要性

可以获取特征重要性然后结合pandas一些手段进行一些优化排序。有一个model..feature_importances_方法。非树模型没有feature_importances_方法。所以我们一般查看系数作为评判标准。

2024-07-09 20:51:47 499 3

原创【Flink 从 Kafka 读取数据报错】

Caused by: java.lang.NoSuchMethodError: org.apache.kafka.clients.admin.DescribeTopicsResult.allTopicNames()Lorg/apache/kafka/common/KafkaFuture;

2024-04-01 13:40:44 2257 1

原创【IDEA】适当个性化+功能拓展新手快速上手！

【个性化IDEA】,【汉化插件】,【背景图设置】,【进度条插件】,【代码以及注释的字体】【实用的快捷键】,【替换 replace Ctrl+R】,【大搜索框 Ctrl+Shift+A】,【向下复制本行内容 Ctrl+D】,【字符大小调整 Ctrl+滑轮】,【自定义快捷键】,【快速构造 ALt+insert】,【IDEA连接数据库】

2024-03-30 13:08:50 1974

原创【DataFrame,DataStream,RDD→导入MySQL】

将【Dataframe，Dstream，RDD】这些数据集存入MySQL中的众多方法的其中一种。

2024-03-29 11:50:10 341 1

原创 IDEA 代码字体大小及注释颜色样式设置

也在Editor里面能找到上面的就能看见这个 font 一样的可以直接通过搜索框搜索font进行设置。按照1 2 3 4 顺序找到注释的设置功能作用详情见下图↓（也可以通过搜索框搜索）单击进入 Settings。【代码字体大小设置】

2024-03-28 18:26:02 1982 2

elasticsearch 和 kibana windows资源

Elasticsearch 是一个基于 JSON 的分布式搜索和分析引擎。 Kibana Kibana 是一个可扩展的用户界面，您可以借助它对数据进行可视化分析。 Elastic有一条完整的产品线：Elasticsearch、Kibana、Logstash等，前面说的三个就是大家常说的ELK技术栈。什么是Kibana Kibana是操作ElasticSearch的图形化工具基于Node.js，可以通过web进行操作使用Kibana进行API操作时，有友好提示 Kibana工具可以生成各种图表功能：分布式的搜索引擎 - 百度、Google、站内搜索。全文检索 = 提供模糊搜索等自动度很高的查询方式，并进行相关性排名，高亮等功能。数据分析引擎（分组聚合）- 电商网站一周内手机销量 Top 10。对海量数据进行近乎实时处理 - 水平扩展，每秒钟可处理海量事件，同时能够自动管理索引和查询在集群中的分布方式，以实现极其流畅的操作。 Elastic Search 具备以下特点：高速、扩展性、最相关的搜索结果。分布式 - 节点对外表现对等，每个节点都可以作为入门，加入节

2024-03-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人