- 博客(424)
- 收藏
- 关注

原创 AGI|一篇小白都能看懂的RAG入门介绍!
随着近几年AIGC的发展,不仅是大模型自身在不断优化,相关支持应用也在不断涌现。本文的主角便是这些技术中较为引人注目的RAG(Retrieval-Augmented Generation)——检索增强生成技术。LLM虽然已经在通识领域展现出了惊人的能力,但要落实到真正具体的问题解决,特别是针对专业领域,企业领域的一些具体的,私人的数据生成解决方案,仅仅依靠LLM还是远远不够的。
2024-02-20 11:22:14
4463
2
原创 AGI|AI驱动的前端代码生成和代码推荐
AI驱动生成前端代码的优势提高效率:AI可以自动生成复杂的UI组件或模板代码,减少开发者手动编写的时间。通过自动化生成,开发者能够集中精力于更有创意和技术挑战性的部分。提升代码质量:AI驱动的代码生成工具通常会基于大量的开源代码库进行训练,因此能够遵循最佳实践,减少代码中的潜在漏洞或性能瓶颈。缩短开发周期:通过自动化生成和即时的代码补全,开发者可以在更短的时间内完成项目,从而更快地推向市场。
2025-03-31 10:40:40
624
原创 趋势洞察!IDC、Gartner、Forbes等权威机构解读2025年AI发展趋势
2025年,人工智能迈入深度应用和技术成熟的新阶段。以生成式AI、代理型AI、多模态模型为代表的技术,正从实验室走向实际应用,驱动产业变革与效率提升。AI技术不再仅仅是工具,而是行业创新、决策支持与生产力提升的核心引擎。科技大厂与创业者将在应用场景中竞相探索,以构建从技术到产品的完整闭环。尽管机遇与挑战并存,但我们需要以开放和负责任的态度拥抱AI技术。唯有深刻理解趋势、积极创新,企业才能在AI浪潮中占据主动,成为引领未来的重要力量。
2025-01-16 17:12:05
3324
原创 AGI|祖传代码遇上 AI 智能体:企业技术债务怎么解决?
困扰众多企业已久的“技术债务”,那些能够正常运行的“祖传代码”在AI 智能体时代迎来了新的解决办法
2025-01-16 17:01:24
648
原创 AGI|如何基于开源软件搭建属于你的私域知识库
本篇是基于AI的开源应用项目来对AIGC领域的技术做整体性的了解,包括业务、技术栈、技术名词等等。目的是快速学习相关的基本知识,为此找到一些可了解的开源应用,可以先本地部署跑起来理解大致的方向。
2025-01-09 11:14:49
725
原创 开放获取|2025年度800+页原创AI技术合集全新发布!
在年末之际,通明湖云和信创研究院-云基地第4本技术合集终于与大家见面了。正是你们的支持与鼓励,让我们在技术探索的道路上不断前行。如果各位读者觉得我们的持续编写与输出是有意义的,那么请将这些技术合集分享给更多有相同兴趣、积极向上的同事和朋友们。最后,新的一年希望能与大家继续携手前行,共同探索技术的无限可能。
2025-01-06 14:11:16
821
原创 技术合集|AI Agent 如何重塑工作的未来
本次技术合集凝聚了云基地成员们在过去一年的所思、所想、所为,精选了90+篇文章,内容涵盖人工智能理论研究、技术实战、数据库、云原生以及传统开发等多领域的研究与实践。
2024-12-25 10:55:57
1047
原创 《认知觉醒》|学会这三点,别让“伪自律”骗了你
明明知道,但是却做不到”“明明知道,如果这样做或者那样做了,事情会变得更好,但是却不愿意坚持下去”人生的道路上,许多人或许已经走在了通往终点的轨道上,但我们依然可以选择在任何时刻觉醒,开始改变。无论你是已步入职场、在社会中打拼的成年人,还是在学业中迷茫的年轻人;真正的成长始于自我觉察和行动。过去的困惑、过去的犹豫、过去的失败,都可以成为我们前进的动力。从现在开始,不再为自己设限,重新审视并选择那些符合自己真正目标的行为。或许,认知的觉醒并非一蹴而就,但只要行动起来,转变的力量将远远超过你想象。
2024-12-25 10:50:46
1061
原创 云原生|一文了解HAMi:云原生角度实现GPU颗粒度划分
例如:原生 libvgpu.so 在进行内存分配时,只有在 GPU 内存真的用完的时候才会提示 CUDA OOM,但是对于 HAMi 实现的 libvgpu.so 来说,检测到 Pod 中使用的内存超过了 Resource 中的申请量就直接返回 OOM,从而实现资源的一个限制。同时该 Pod 申请的部分资源也会标记为已使用,不会再分配给其他 Pod。于是,小A顺利的完成了客户的需求,2个模型分别占用了2张显卡,但是其中的一张显卡只占用了20G显存,客户要求充分利用资源,再部署一个模型,占满这张显卡。
2024-12-17 14:27:21
946
原创 如何设计一个好的微服务
微服务指的是一种应用架构,一系列独立的服务通过轻量级API来进行通信。单体应用中随着功能的增加,版本的迭代,代码库会越变越大。尽管工程师努力地想要模块化每个功能模块,以达成优雅的工程化,事实上模块之间的界限变得模糊不清,代码的维护和Bug的修复会变得相当复杂。微服务将一个巨大的单体应用拆分成若干个较小的服务,它们之间通过某种通信协议交互,最终组成整个系统服务。比较理想的情况下,微服务通过分布式部署,这意味着开发人员可以并行开发多个微服务,进而压缩开发所需时间。
2024-12-11 14:07:04
613
1
原创 AGI|在测试活动中如何利用AI寻找测试点?
随着人工智能技术的迅猛发展,AI在软件测试领域的应用也越来越广泛。特别是在生成测试点方面,AI可以帮助测试工程师更高效地发现潜在问题,提高测试覆盖率和质量。本文将从提示词的角度出发,详细介绍如何利用AI生成高效、全面的测试点。
2024-12-09 10:21:10
1053
原创 云原生|一键解锁! Kubernetes中如何实现GPU管理
2022年5月13日,英伟达发布了Linux开源GPU内核模块,支持数据中心所用的GPU和消费级显卡,这意味着开发者可以通过代码而观察到内核驱动是如何工作的,同时还可以将NVIDIA驱动直接安装在企业内部的服务器上。处于AI浪潮的大背景下,背后的推手不言而喻,长期以来 NVIDIA 一直以高性能 GPU 和闭源驱动程序而闻名。闭源一直是 Linux 社区和其他开源社区所厌恶的,这场由 Linus 与 NVIDIA 长达十年的冲突在开源内核模块后似乎画上了句号。
2024-11-27 11:38:52
914
原创 云原生|探秘开源分布式框架 Ceph,对比云原生存储
存储一直是系统中最重要的部分,在云计算推动的当下,一方面平台需要用户创造的数字资产作为信息壁垒,另一方面平台也有责任和义务保全用户托管的信息。随着平台的用户数激增,对存储系统的要求也越来越高。一个高扩展,高性能,高可用的分布式存储系统是系统稳定的重要基石,存储系统中大致可分为三部分:块存储,对象存储,文件存储。在主流的分布式存储中 HDFS 可以作为文件存储的代表;Swift 作为对象存储的代表;Ceph 同时提供了块,文件,对象三种存储方式,于是被称为统一存储。二、Ceph。
2024-11-20 11:20:11
740
原创 AGI|使用神州问学-多云版,轻松创建你的第一个工作流!
一个编排并运行成功的工作流并不意味着结束,想要这个工作流能够在AI应用中被调用,还需要做好工作流的配置,配置用于机器识别/模型理解的API调用名称和描述,选定入参方式补充入参描述后方可完成。支持对编排完成后的工作流进行运行调试,输入“开始”节点配置的入参,可对工作流全流程进行运行,逐步追踪每个节点的运行状态、输入/输出和数据信息,具备全链路的数据跟踪,让你轻松定位节点异常,用于反复调试工作流节点中的配置信息。节点是工作流中的关键构成,通过不同功能的节点,可以执行工作流的一系列操作。下面就来依次了解一下吧!
2024-11-13 10:44:48
940
原创 数据库|开源向量数据库性能对比: Milvus, Chroma, Qdrant
为应对公司在大规模文本、图像等非结构化数据处理上的业务增长需求,笔者着手调研当前流行的开源向量数据库。
2024-11-06 09:57:52
1847
原创 AGI|探索跨模态大模型:桥接视觉与语言的前沿技术
首先,在包含脏数据的数据集(网上爬取的数据+人工标注的数据)上进行预训练,然后在ITC和ITM任务、LM任务上分别微调,分别得到1个图文匹配的检测模型,1个caption的生成模型。当我们谈到“跨模态大模型”时,例如视觉-语言大模型,指的是那些可以同时处理和理解图片(视觉)和文字(语言)信息的模型。有兴趣的伙伴可以挑选感兴趣的模型对应的文献进行深入学习,这里值得一提的是,阿里的Qwen-VL是一个多语言的跨模态大模型,支持中文和英文,并且在训练的时候允许输入多个图像,提高其理解视觉上下文的能力。
2024-11-06 09:54:10
822
原创 AGI|智能体大比拼,BFCL检测工具调用能力——
而GLM-4-9B-Chat就更有意思了,一方面是生成了错误的工具名称,错误类型为simple_function_checker:wrong_func_name,检查原因发现,在绝大多数情况下模型生成的工具名称,与原工具名称仅有一个字符之差,例如对本该调用的math.factorial工具,响应成了math_factorial,这表明模型的指令遵循能力有待提升,与Qwen2-7B-Instruct形成了鲜明的对比。工具调用指的是智能体通过运用外部工具和资源,增强自身处理问题的能力,从而实现更为复杂的任务。
2024-10-30 14:11:55
835
原创 AGI|浅尝多Agent协作框架CrewAI,打造一个智能旅行助手
直白点说,一个大的任务,可以根据步骤拆分为许多小的步骤,每个小步骤可以给多个Agent去协作完成,每个Agent可以选择适合的大模型和工具。CrewAI 中的工具是一种技能,代理可以使用它来执行任务,目前这些工具可以是crewAI Toolkit和LangChain Toolkit的工具,这些基本上是代理可用于各种操作的功能,从简单的搜索到复杂的交互外部系统。总的来说,CrewAI框架易于使用,用户只需关心我们需要做什么,将其拆分成子任务,定义好对应角色的Agent, 其他的丢给Crew团队去执行。
2024-10-18 15:20:24
1128
原创 云原生|Istio是什么?快速了解服务网格实践方案
在计算机技术不断进步中,为了追寻更好的性能,可用性,稳定性。从单体架构到分布式架构再到微服务,随着系统规模不断扩大,技术门槛也在不断提高,服务注册,服务发现,负载均衡,熔断,限流等技术词汇的出现都是解决某一问题的副产物。在 istio 最新的版本中可以在没有 sidecar 的情况下运行,sidecar 提供了服务网格的最初模式,在过去十几年的云原生发展中取得巨大成功,但不可避免的是:sidecar 在集群环境中被滥用,并且带来开销,当集群规模较大时,这些 sidecar 将不可忽视地算在成本的一部分。
2024-10-16 14:25:45
1240
原创 AGI|Vanna.AI :基于RAG的TextToSql工具
然而,SQL的复杂性往往成为非技术用户难以跨越的障碍,为了解决这一问题,Text2SQL技术应运而生,它允许用户通过自然语言与数据库交互,大幅降低了数据分析的门槛。在模型训练阶段,需准备充足的 SQL、DDL 以及文档数据,这些数据应能准确描述表结构、字段含义、表与表之间的关联字段,以及特殊字段和业务术语的解释。在图2中,更改提问内容后,通过将 DDL、文档数据(doc)和 SQL 作为提示词输入到大模型,模型成功生成了正确的三表关联 SQL 查询,并对输出字段进行了准确的调整,最终生成了符合要求的结果。
2024-10-12 11:38:54
1220
原创 AGI|如何构建一个RAG应用?入门新手攻略!
优质的内容和训练参数的数量级都会影响模型的能力和输出质量,但知识库的构建会基于某个时间点的数据,模型的训练也可能在之后的时间完成,这带来不可避免的滞后性和时效性。一个常见的场景是用户输入一个指向性十分具体的问题,比如查询某年月日发生的事件的内容,这种情况下不需要任何生成的“创新”,使用传统检索的方式可能会更好,但如果依然使用向量检索,在向量数据库中本身就存有大量关联性的数据,在这种关联数据过于紧密的情况下反而会分散LLM的注意力,导致输出结果并不理想。切的太小也会造成输出质量的下降——相关性内容会丢失。
2024-10-09 11:05:06
1181
原创 云原生|浅谈云原生中的对象存储之MinIO 的使用
S3 协议全称 Amazon Simple Storage Service(Amazon S3),最初是亚马逊提供的简单存储服务,它为应用程序的开发者提供了通过一系列 API 来控制数据的方式,经过多年的发展这些方法逐渐演变为 S3 协议,国内外很多云厂商提供的云存储服务都是在此协议上做了一部分演变,但都保留了通用的 S3 接口。当然,想在一篇文章中详尽展示对象存储的各个方面是不现实的,本篇更多的还是聚焦于存储层的具体实现,对于数学领域逆矩阵的概念感兴趣的读者可以自行了解。
2024-09-23 10:36:39
1453
原创 数据开发|如何使用Apache Airflow进行任务调度?干货分享!
执行器将任务实际执行在相应的工作节点上,并将执行结果返回。负责根据定义的 DAG(Directed Acyclic Graph,有向无环图)图,计划和触发任务的执行。元数据库存储了 Airflow 的元数据,包括 DAG 的定义、任务实例的状态、任务执行日志等。这允许用户在不同的任务和工作流之间共享信息,并支持任务的重试、回溯和监控。,用于监控和管理工作的状态、任务的执行情况、查看日志以及触发任务的手动运行等。Airflow 提供实时的任务监控和日志记录功能,使用户能够方便地跟踪任务的执行情况并解决问题。
2024-09-23 09:49:26
1416
原创 云原生|浅谈Kubernetes 安全防护问题,构建安全容器化应用
在过去,安全性总是由单独的安全团队在开发周期快要结束时才参与进来,随着产品快速迭代,安全团队无法确保每个发布都是安全的,正是因为这种脱节才衍生出 DevSecOps 的概念。少部分受访者的安全防护和 DevOps 是分开的;使用 DevOps 平台配合另外一些安全扫描的工具也是一个不错的选择,这不仅解决了镜像的管理和构建,同时也解决了部署的问题。使用 Kubernetes 的网络策略也可以是一个选择,允许容器与容器之间的通信,实施零信任策略后可以确保单个容器受损后不影响其他容器,而造成应用的大面积宕机。
2024-09-09 13:47:26
1471
原创 微服务|一文带你了解无感知部署方案实战
蓝绿部署是一种零停机时间的部署策略,它通过同时维护两个生产环境(一个是当前活跃的“Blue”环境,另一个是待部署的“Green”环境)来实现。在程序开发和运维过程中,会频繁地部署服务,并且每个服务的正常运行都依赖于其他服务,所以能够在不停服的情况下部署新版本服务来保持应用的整体稳定性可用性十分重要。Nacos接收到这个心跳包,首先检查当前服务在不在注册列表中,如果不在按新服务的业务进行注册,如果在,表示当前这个服务是健康状态。Nacos的服务管理有上下线服务的功能,且有open-api可直接调用触发。
2024-08-28 15:33:42
923
原创 AGI|前端页面如何支持多模态大模型的流式返回?一文弄懂!
通过流式传输,使模型在token可用时立即开始返回, 而不是等待整个token序列生成完毕。虽然这并不会改变获取所有token所需的时间,但它减少了获取第一个token的时间,对于希望显示部分进展或可能会中途停止生成的应用程序来说,这是一个更好的用户体验。
2024-08-23 10:36:09
1801
原创 数据库|TiDB告警推送-企业微信机器人
企业微信机器人是企业微信提供的一种机器人接口,通过该接口可以实现向企业微信群发送文本、图片、链接等消息,从而实现各种应用场景下的消息推送功能。企业微信机器人采用简单的 HTTP 请求接口,使用方便灵活,可以轻松集成到各种应用中。利用企业微信机器人实现 TiDB 的告警推送功能,提供了一种简单、高效的告警通知方式。这种方案不仅能够及时发现和解决 TiDB 集群中的问题,还能够提高团队的工作效率和响应速度,从而提升系统的稳定性和可靠性。
2024-08-21 14:40:15
759
原创 最前端|Git如此重要的6条高效命令,你不会还没学会吧?
本文分享我在Git开发工作中实践过的6大高效命令,这些都能够大大提高工作效率,还能解决不少疑难场景
2024-08-20 14:24:44
1207
原创 数据库|TiDB Vector抢先体验之用TiDB实现以图搜图
在以往,想在关系型数据库中对非结构化数据实现搜索是一件不敢想象的事,哪怕是号称无所不能的 PostgreSQL 在向量插件的加持下也没有获得太多关注,这其中有场景、性能、生态等各方面的因素制约。前有专门的向量数据库阻击,后有各种传统数据库追赶,这注定是一个惨烈的赛道,希望 TiDB 能深度打磨产品,突围成功。这里的distance就是两个向量之间的相似度,这个相似度是用vec_cosine_distance函数计算出来的,意味着两个向量之间的夹角越小相似性越高,夹角大小用余弦值来衡量。
2024-08-08 13:40:25
1088
原创 AGI|如何用Open WebUI和Ollama在本地运行大型语言模型?
除此之外,在Workspace页,可以添加提示词(Prompt),在聊天界面通过@,#等命令引用对应的文档,提示词,让用户可以更高效的和大模型沟通。再看应用程序对应的文件,相应目录下确实存在webiu.db文件,存的是交互的数据,包含聊天记录,授权信息等,前面演示聊天上传的文件也在另外一个目录下。启动成功,浏览器访问 http://localhost:3000/,首次注册的用户为系统管理员,登录之后页面如下图,开始聊天之前选择想要的模型,就可以开始和大模型对话了。数据都存储在本地,也不用担心安全问题。
2024-07-31 10:08:47
1143
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人