- 博客(25)
- 收藏
- 关注
原创 DeepSeek-OCR深度解析:新一代开源OCR模型的技术突破与核心优势
DeepSeek-OCR开源模型震撼发布,以10倍压缩比实现97%识别精度。其创新双塔架构(80M参数SAM-base+300M参数CLIP-large)通过智能视觉压缩技术,在处理512×512分辨率时保持低内存占用。支持近百种语言识别,能解析化学公式、几何图形等复杂内容,学术论文公式识别准确率达89%。应用场景广泛,某投行使用后财报分析效率提升36倍。该模型以380M参数实现超越10B模型效果,重新定义OCR技术标准,预示AI效率革命到来。
2025-10-22 13:43:51
1270
原创 Qwen新开源tongyi-DeepResearch:核心优势
【AI研究能力迈入自主时代】阿里巴巴通义实验室开源的tongyi-DeepResearch模型突破传统AI局限,实现从"被动应答"到"主动研究"的范式跃迁。该模型采用30B总参数+33亿激活参数的轻量化设计,在8项权威评测中超越OpenAI等旗舰模型,支持128K长文本处理,能独立完成多源检索、交叉验证到报告生成的全流程研究任务。创新性地融合全合成数据训练、双模式推理及端到端算法优化,开源后大幅降低专业研究门槛,为学术、法律、商业分析等领域提供普惠型智能研究工具。
2025-09-22 10:27:49
1520
原创 Linux系统: docker安装RagFlow教程
本文提供了RAGFlow系统的安装配置指南,主要包括:1)硬件要求(4核CPU/16GB内存/50GB存储);2)系统内核参数配置;3)Docker和Docker Compose的详细安装步骤;4)RAGFlow的两种部署方式(CPU/GPU版本);5)服务验证方法和常见问题处理。部署过程包含国内镜像加速配置建议,并特别说明了Elasticsearch所需的内核参数设置。安装完成后,可通过8080端口访问Web界面,日志查看和容器状态检查确保服务正常运行。
2025-09-05 16:33:59
361
原创 小参数量大模型高效优化:SFT微调价值与前置条件准备
摘要:小模型凭借轻量化、低延迟等优势在边缘计算、实时推理等场景中具有不可替代性,但其通用预训练后的垂直领域适配性不足。SFT(监督微调)技术通过少量领域数据的针对性训练,可显著提升小模型的专业性能,使其在特定任务中表现媲美甚至超越大模型。SFT微调在时间、成本和硬件资源上具有显著优势,支持快速迭代和低成本定制化,使小模型能够灵活响应业务变化,成为企业级AI落地的高效解决方案。实战步骤包括环境准备、依赖安装和全流程部署,确保开发者和企业能够快速实现模型优化与应用。
2025-09-04 16:37:15
1077
原创 Higress云原生API网关详解 与 Linux版本安装指南
Higress是阿里开源的云原生API网关,基于Istio/Envoy内核,集流量网关、微服务网关、安全网关和AI网关于一体。具有生产级稳定性(支持数十万QPS)、灵活扩展(Wasm多语言插件)、安全合规(内置WAF和10+认证方式)等优势。提供两种部署方式:独立部署(Docker环境一键安装)和Kubernetes生产级部署(Helm安装)。支持AI服务代理、微服务治理等场景,通过可视化控制台简化配置,是替代Nginx Ingress的新一代云原生网关解决方案。
2025-09-02 13:08:49
969
原创 全球首个 L4 级智能体 MasterAgent:AI 从工具到自主创造的革命
2025年被公认为"AIAgent元年",深圳深元人工智能发布全球首个L4级智能体母体系统MasterAgent,标志着AI从"工具化"迈向"全自主化"新阶段。该系统采用双引擎架构(MasterBuilder和AgentGroup),可实现分钟级智能体集群生成和多智能体自主协作,在金融、医疗、工业等领域实现突破性应用。MasterAgent具有国产化自主可控特性,支持自然语言操作,能自动完成从需求输入到结果交付的全流程,显著提升工作效率。该技术突破
2025-08-04 13:13:21
2874
2
原创 【dify+milvus避坑指南】将向量库milvus集成给dify作为知识库
本文介绍了在WSL Linux环境下部署Milvus单机版和Dify平台的完整流程。主要内容包括:1)通过Docker Compose安装Milvus 2.5.6单机版,并配置可视化工具Attu;2)修改Milvus配置开启身份认证;3)部署Dify 1.6.0,调整环境变量连接已安装的Milvus服务;4)验证Dify知识库功能是否成功在Milvus中自动创建集合。部署过程中需注意端口冲突、版本匹配和认证配置等问题,若失败可检查向量化模型调用或查看Docker日志排查原因。
2025-07-30 11:33:29
1210
原创 Linux系统部署KAG知识增强生成框架完整指南
本文介绍了在Linux系统上部署KAG知识增强生成框架的完整指南。KAG是蚂蚁集团推出的专业领域知识服务框架,相比传统RAG技术具有逻辑推理、知识准确性和多模态管理等优势。指南详细说明了硬件要求(推荐16核CPU、64GB内存)、软件环境(Ubuntu/CentOS)和必要的Docker安装配置步骤。部署过程包括创建工作目录、获取配置文件、启动服务及验证功能。同时提供了常见问题解决方案,如镜像拉取缓慢、端口冲突和内存不足等问题。最后推荐用户关注官方资源以深入学习KAG的知识建模和企业集成方案。
2025-07-17 08:38:29
1768
原创 Linux系统安装部署GraphRAG完全指南
GraphRAG是微软开源的基于知识图谱的检索增强生成技术,通过构建实体关系网络提升传统RAG系统的全局理解能力。本文详细介绍了GraphRAG的Linux部署指南,包括环境准备(Python 3.10+、16GB+内存)、依赖安装、虚拟环境配置、Ollama本地模型部署(推荐使用gemma2:9b或中文优化模型)、项目初始化与配置。重点讲解了settings.yaml核心参数的设置方法、文档索引构建过程以及三种查询模式(全局/本地/混合)的使用。同时提供了Docker部署方案、中文优化技巧和常见问题解决方
2025-07-16 09:25:28
1501
原创 Linux部署Milvus数据库及Attu UI工具完全指南
本文详细介绍了在Linux系统上使用Docker部署Milvus向量数据库及Attu可视化管理工具的完整流程。包括环境准备(Docker和Docker Compose安装)、Milvus部署(配置文件获取、服务启动验证)、Attu管理工具部署,以及基本的操作指南和常用命令。同时提供了注意事项(版本兼容性、防火墙设置等)和常见问题排查方法。该方案适合开发测试和中小型生产环境,为开发者提供了简单高效的Milvus部署方案。
2025-07-16 09:10:25
1840
原创 【Linux系统】部署n8n工作流自动化工具的完整指南
本文提供了在Linux系统中部署n8n工作流自动化工具的完整指南。n8n是一款开源、可自托管的自动化工具,支持可视化流程构建和代码扩展,适合个人开发者和企业使用。指南详细介绍了三种部署方式:Docker(推荐生产环境)、npm(开发环境)和二进制安装,并包含系统要求、依赖检查等准备工作。重点讲解了生产环境的关键配置,包括数据库设置、HTTPS加密、防火墙规则,以及数据备份、性能监控等运维最佳实践。最后提供了常见问题解决方案和进阶学习资源,帮助用户快速搭建可靠的自动化平台。
2025-07-15 09:02:33
2457
原创 通义千问HumanOmniV2:开启AI理解人类意图的新纪元
阿里巴巴通义实验室开源发布HumanOmniV2多模态大模型,聚焦"理解人类复杂意图"三大突破:1.强制上下文总结机制,结构化分析表情、语调等线索;2.四维奖励体系强化逻辑推理;3.GRPO算法优化长序列学习。在IntentBench测试中,意图理解准确率达69.33%,远超同类模型。该模型可应用于视频分析、智能客服、教育评估等领域,通过GitHub、HuggingFace等平台开源模型权重及训练工具,推动AI从"感知信息"向"理解意图"跨越,未来
2025-07-15 08:39:36
1032
原创 马斯克发布Grok 4:重新定义AI边界,还是一场昂贵的技术狂欢?
Grok 4以其多智能体协作、推理能力和生态整合,重新定义了AI的技术边界。但3000美元的定价、伦理争议和与现实世界交互的不确定性,使其成为一把"双刃剑"。当AI能独立完成博士级研究、参与商业决策,我们或许正站在通用人工智能(AGI)的门槛前。但正如马斯克所言:"现实才是最终的推理测试。"Grok 4的真正价值,将在技术突破与社会责任的平衡中得到检验。你如何看待Grok 4的技术突破与争议?欢迎在评论区分享观点。
2025-07-14 09:47:04
888
原创 Dify v1.6.0 双向MCP功能详解:开启AI应用互联新纪元
Dify v1.6.0发布重大升级,原生集成双向模型上下文协议(MCP),开启AI应用标准化互联新时代。该版本实现两大核心功能:作为客户端直接调用8000+外部工具(如Zapier),同时可将Dify应用发布为标准化MCP服务供其他系统调用。通过"即插即用"的协议设计,开发者配置时间从小时级缩短至分钟级,响应速度提升40%。典型应用场景包括智能客服、工业预测维护和跨平台内容创作,企业案例显示故障预测准确率提升75%,客服响应时间缩短90%。此次升级标志着AI开发从孤岛式工具向互联生态的范
2025-07-14 09:37:08
1238
原创 Qwen3 Rerank模型:相较于其他rerank模型,特殊在哪?
阿里巴巴发布开源重排序模型Qwen3-Reranker,在性能、多语言支持和灵活性上实现突破。该模型提供0.6B至8B三种参数量级,支持119种语言,其中8B版本在MTEB-R评测中达77.45分,代码检索准确率超81分。采用创新的单塔交叉编码架构和长文本处理技术,特别优化专业领域应用。目前已完全开源,支持从边缘设备到云端的多样化部署,显著提升搜索、RAG系统等场景的准确性,电商搜索转化率提升22%。
2025-07-11 08:26:19
2411
原创 Qwen3 Embedding模型:到底强在哪里?
阿里巴巴达摩院发布的Qwen3-Embedding模型在多语言语义理解领域实现重大突破,以70.58分登顶MTEB全球榜单。该模型采用创新的三阶段训练架构,包括弱监督预训练、数据精炼和模型融合,支持119种语言和编程代码理解。提供0.6B至8B三种参数规模,满足从边缘设备到云端的不同需求,特别在32K长文本处理上表现优异。开源生态和灵活部署方案使其在电商推荐、智能客服等领域展现商业价值。Qwen3系列正推动AI语义理解从"通用泛化"迈向"精准专用"的新阶段。
2025-07-11 08:23:08
1125
原创 Text2SQL技术路线全景解析:从传统方法到LLM时代的演进与实践
Text2SQL技术实现了自然语言到SQL查询的自动转换,使非技术人员也能便捷访问数据库。其发展经历了从规则引擎到深度学习,再到当前大语言模型(LLM)驱动的范式转换。核心方法包括提示工程(如思维链、检索增强生成)和模型微调,在Spider等复杂数据集上执行准确率可达86%以上。该技术已在电商、金融、制造业等领域落地,显著提升数据查询效率。未来趋势将向多模态输入、智能体协作和自迭代学习方向发展,进一步推动数据民主化。主要挑战包括跨域泛化、幻觉抑制和成本优化等问题。
2025-07-10 09:44:18
926
原创 提升 RAG 精度 --从何下手
本文系统探讨了提升RAG(检索增强生成)技术精度的关键方法。从数据处理环节的数据清洗与结构化处理,到检索阶段的向量数据库优化与查询策略改进,最后到生成环节的prompt工程和模型微调,全面分析了各环节的优化策略。通过多维度协同改进,可以有效提升RAG系统在知识问答、信息检索等场景中的准确性和可靠性,为构建高性能RAG系统提供实用指导。
2025-07-10 09:27:49
750
原创 构建Keras模型的三种方法
它在可用性和灵活性之间找 到了很好的平衡点,因此是构建模型最常用的。同时还有高级的工作流程:无论你的问题多么罕见、多么复杂,应该都有一条清晰的解决路径。假设你要构建一个系统,按优先级对客户支持工单进行排序,并将工单转给相应的部门。 工单的优先级分数,它是介于 0 和 1 之间的标量(sigmoid 输出)其元数据)、多输出模型(预测数据的不同方面)或具有非线性拓扑结构的模型。任何一种工 作流程的组件都可以用于其他工作流程,它们之间可以互相通信。常简单的工作流程,也有非常灵活的工作流程。
2024-08-14 18:56:57
625
2
原创 Python环境的克隆【包含指定路径手段】
并不能直接在后面加一个-p指定路径,是会报错的。导致克隆到的路径不是你的目标路径。这就是一个修改默认路径的方法。
2024-08-06 15:19:50
642
2
原创 【scikit-learn】如何查看特征重要性
可以获取特征重要性 然后结合pandas一些手段 进行一些优化排序。有一个model..feature_importances_方法。非树模型没有feature_importances_方法。所以我们一般查看系数作为评判标准。
2024-07-09 20:51:47
499
3
原创 【Flink 从 Kafka 读取数据报错】
Caused by: java.lang.NoSuchMethodError: org.apache.kafka.clients.admin.DescribeTopicsResult.allTopicNames()Lorg/apache/kafka/common/KafkaFuture;
2024-04-01 13:40:44
2257
1
原创 【IDEA】适当个性化+功能拓展 新手快速上手!
【个性化IDEA】,【汉化插件】,【背景图设置】,【进度条插件】,【代码以及注释的字体】【实用的快捷键】,【替换 replace Ctrl+R】,【大搜索框 Ctrl+Shift+A】,【向下复制本行内容 Ctrl+D】,【字符大小调整 Ctrl+滑轮】,【自定义快捷键】,【快速构造 ALt+insert】,【IDEA连接数据库】
2024-03-30 13:08:50
1974
原创 【DataFrame,DataStream,RDD→导入MySQL】
将 【Dataframe,Dstream,RDD】这些数据集 存入MySQL中的众多方法 的其中一种。
2024-03-29 11:50:10
341
1
原创 IDEA 代码字体大小 及 注释颜色 样式设置
也在Editor里面 能找到上面的 就能看见这个 font 一样的可以直接通过搜索框搜索font进行设置。按照1 2 3 4 顺序找到注释的设置 功能作用 详情见下图↓(也可以通过搜索框搜索 )单击进入 Settings。【代码字体大小设置】
2024-03-28 18:26:02
1982
2
elasticsearch 和 kibana windows资源
2024-03-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅