越哥聊AI
互联网技术专家,阿里云MVP,任职淘宝、美团,著有《分布式技术原理与实战》,拉勾网、InfoQ讲师、人人都是产品经理专栏作者,分享互联网架构,关注认知升级
展开
-
AI大模型下传统 Spring Java工程开发的演进和变化方向
传统的Spring Java工程正经历从“业务逻辑+数据库”向“业务逻辑+AI推理+数据智能”的演进。原创 2025-03-31 09:54:40 · 482 阅读 · 0 评论 -
Stanford CS230 Deep Learning 课程内容
斯坦福大学 CS230 课程是 Andrew Ng 主讲的深度学习课程,专注于神经网络、优化技术及其在计算机视觉、自然语言处理等领域的应用。原创 2025-03-31 09:27:44 · 433 阅读 · 0 评论 -
AI Agent 人工智能相关公开比赛汇总
参与 AI 相关比赛是提升技术能力、接触前沿算法、积累项目经验的绝佳方式。以下是全球知名的比赛,以及适合不同水平选手的竞赛分类。NeurIPS/CVPR/ICML 竞赛、Facebook FAIR、NASA Space Apps。Kaggle 初级比赛、Google Kick Start、AI4Good Hackathon。Devpost Hackathons、Tianchi 天池、Baidu AI 竞赛。ACM-ICPC、Google Code Jam、Kaggle 竞赛。你对哪些比赛最感兴趣?原创 2025-03-30 20:59:09 · 952 阅读 · 0 评论 -
机器学习与AI大模型必备数学知识
机器学习与AI大模型必备数学知识原创 2025-03-30 23:34:53 · 735 阅读 · 0 评论 -
人工智能、机器学习经典计算机课程
以下是人工智能(AI)、机器学习(ML)和 AI 大模型相关的经典计算机课程,从入门编程、数学基础到深度学习、强化学习、自然语言处理(NLP)及 AI 领域实践等,适合不同阶段的学习者原创 2025-03-31 09:36:55 · 911 阅读 · 0 评论 -
BabyAGI 快速上手应用
BabyAGI 是一个轻量级、自我迭代的任务管理 AI Agent,基于 OpenAI API 和 Pinecone 向量数据库构建。原创 2025-03-31 14:22:05 · 192 阅读 · 0 评论 -
使用 Spring AI 和 LangChain4j 实现聊天机器人对比分析
使用 Spring AI 和 LangChain4j 实现聊天机器人对比分析原创 2025-03-31 10:00:59 · 951 阅读 · 0 评论 -
使用FastAPI-MCP,让 FastAPI 应用秒变 MCP 服务器
FastAPI-MCP 是一款零配置工具,可让 FastAPI 应用自动暴露所有端点,并兼容 Model Context Protocol (MCP)。原创 2025-03-30 17:49:40 · 135 阅读 · 0 评论 -
什么是向量数据库
嵌入模型会将各种数据 (例如文本、图像、图表和视频) 转换为数值向量,以便捕捉其在多维向量空间中的含义和细微差别。嵌入技术的选择取决于应用需求,同时要兼顾语义深度、计算效率、要编码的数据的类型、维度等因素。baeldung通过将向量映射到多维空间,可以对向量的语义相似性进行细致的分析,从而显著提高搜索和数据分类的准确性。在使用AI 聊天机器人大语言模型 (LLM)检索增强生成 (RAG)和向量数据库的 AI 应用中以及在搜索引擎和许多其他用例中,嵌入模型发挥着至关重要的作用。原创 2025-03-30 16:13:45 · 170 阅读 · 0 评论 -
解读 LangChain 及其应用
LangChain 是一个开源框架,用于构建基于大型语言模型(LLM)的应用程序。原创 2025-03-30 16:43:29 · 306 阅读 · 0 评论 -
AI大模型、机器学习以及AI Agent开源社区和博客
• 内容: Transformers库、开源模型(如BERT、T5)、社区贡献的预训练模型和数据集。• 内容: GPT系列模型文档、研究论文、API使用指南(如GPT-4、ChatGPT)。• 内容: LLaMA系列大模型、多模态研究(如ImageBind)。• 内容: 多模态模型(如MUM、CLIP)、视觉-语言对齐技术。• 内容: 大模型技术细节(如Transformer、BERT)。• 内容: 多模态大模型(如CM3)、AI Agent研究。• 内容: 多模态模型、大模型优化技术(如稀疏注意力)。原创 2025-03-29 23:30:11 · 1020 阅读 · 0 评论 -
Stanford CS224N 公开课解读
Stanford CS224N 公开课解读:自然语言处理的前沿技术原创 2025-03-30 15:07:30 · 467 阅读 · 0 评论 -
FastAPI 在 AI 大模型开发中的应用
FastAPI 介绍、原理及其在 AI 大模型开发中的应用原创 2025-03-30 17:42:12 · 287 阅读 · 0 评论 -
AI Agent 中的 MCP 模型上下文协议详解
MCP(Model Context Protocol,模型上下文协议)是一种专门用于 AI Agent 之间共享上下文信息的通信协议。原创 2025-03-30 15:57:13 · 260 阅读 · 0 评论 -
向量数据库介绍及应用
向量数据库介绍及应用原创 2025-03-30 16:13:12 · 291 阅读 · 0 评论 -
LangChain 应用解析
以上示例展示了如何使用 LangChain 快速封装 OpenAI API,并实现一个简单的问答应用。:支持 OpenAI、Anthropic、Hugging Face 等主流大模型。:允许将多个 LLM 调用、数据处理步骤串联。:集成搜索引擎、API 访问、代码执行等功能。:提供短期/长期记忆机制,优化对话状态管理。:能够自主决策调用不同工具完成任务。原创 2025-03-30 16:39:16 · 96 阅读 · 0 评论 -
20篇AI大模型与Agent开发必读论文
证明模型参数与训练数据的均衡缩放法则(70B参数+1.4T tokens最优)。:提出推理(Reasoning)与行动(Action)协同的Agent架构。:学习数据缩放定律(Scaling Laws)与Prompt工程基础。:验证大规模预训练模型(175B参数)的上下文学习能力。:学习具身智能(Embodied AI)的实现路径。:在《我的世界》中实现终身学习的自主探索Agent。:提出混合专家模型(MoE)实现万亿参数级别扩展。:基于人类反馈的强化学习(RLHF)实现模型对齐。原创 2025-03-28 18:21:34 · 471 阅读 · 0 评论 -
实现 Transformer:从原理到代码实现
本文介绍了 Transformer 的基本原理,并基于 PyTorch 实现了完整的 Transformer 结构,包括编码器、解码器和多头注意力机制。Transformer 作为当前 NLP 领域的核心技术,在机器翻译、文本摘要、对话生成等任务中广泛应用,理解其实现有助于深入掌握深度学习的前沿技术。原创 2025-03-29 22:14:11 · 381 阅读 · 0 评论 -
从ChatGPT到AutoGPT——AI Agent的范式迁移
AutoGPT 代表了 AI Agent 的最新发展趋势,极大地提升了 AI 在自主任务执行方面的能力。然而,技术成熟度、伦理问题和商业化落地仍然是当前需要解决的关键挑战。未来,随着 AutoGPT 和其他 AI Agent 的不断演进,我们有望见证 AI 在生产力提升和企业运营中的更大突破。原创 2025-03-29 22:22:06 · 575 阅读 · 0 评论 -
理解思维链(Chain of Thought, CoT)技术
是一种通过显式生成中间推理步骤(类似于人类逐步思考过程)来提升大模型复杂任务性能的技术。将问题拆解为多步逻辑推导,能帮助模型更准确地逼近正确答案。•技术起源:最早由Google Research在2022年论文《》中提出。•关键思想:通过提示(Prompt)引导模型生成“思考过程”,而非直接输出答案。问题:小明有5个苹果,吃了2个,又买了3个,现在有多少个?模型输出(传统方式):答案:6模型输出(CoT):小明一开始有5个苹果,吃了2个后剩下3个,再买3个,总共6个。答案:6。原创 2025-03-29 15:16:29 · 551 阅读 · 0 评论 -
Java工程师如何用3个月转型AI技术专家
3个月后,你应能独立开发基于LLM的电商AI Agent,并理解大模型在工程链路的部署逻辑。原创 2025-03-28 18:04:43 · 361 阅读 · 0 评论 -
RAG(Retrieval Augmented Generation)检索增强生成详解
RAG(Retrieval Augmented Generation,检索增强生成)是一种结合信息检索(Retrieval)和文本生成(Generation)的 AI 技术框架,旨在提升大模型(如 LLM)的知识能力和准确性。与纯粹的生成式模型(如 GPT-4)不同,RAG 通过实时检索外部知识库的信息,增强模型的回答能力,减少幻觉(Hallucination)问题。原创 2025-03-29 17:25:50 · 571 阅读 · 0 评论 -
大模型技术在商品归一和商品预测中的应用
通过引入。原创 2025-03-24 23:31:59 · 644 阅读 · 0 评论 -
深入浅出 Embedding
Embedding(嵌入)是一种将高维数据映射到低维连续空间的技术,用于表达数据的语义关系。简单来说,它是一种向量化表示,将文本、图像、用户行为等信息转换为数值向量,使得相似的数据在向量空间中距离更近。原创 2025-03-29 21:17:44 · 558 阅读 · 0 评论 -
最流行的开源 LLM (大语言模型)整理
Large Language Model (LLM) 即大规模语言模型,是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。原创 2023-05-19 16:41:18 · 5944 阅读 · 0 评论 -
互联网时代的信息差、混乱与机会
信息差=钱,大部分交易本质上都是在为信息付费,让信息流通,就是一种价值。原创 2024-10-12 22:57:29 · 307 阅读 · 0 评论 -
科幻照进现实,云端情人上线,OpenAI发布GPT-4o
Sam Altman发推文,引用了电影《Her》,我们正在经历一个与电影中类似的阶段,即人类与智能系统之间的交互越来越深入,情感联系也日益紧密。原创 2024-05-14 23:01:29 · 1316 阅读 · 1 评论 -
微软中国 AI 团队搬至美国?可解决家属签证
有微软员工表示情况属实,这是5月14日刚出的消息,C+AI 团队做 AI platform 的 Azure ML 团队将集体打包去美国,另外也有一些组去澳洲的,“大家都很懵”,此前并没有感受到任何预兆。特别是在微软亚洲研究院,中国研究者被禁止提前使用GPT-4测试版和接触核心技术,这与微软在温哥华分部的策略形成鲜明对比,那里的研究者可以自由地接触包括OpenAI系统在内的关键技术,并拥有从事尖端研究所需的计算能力。在中美科技竞争的大背景下,微软不仅需要考虑如何保持技术领先,还要应对地缘政治带来的复杂影响。原创 2024-05-16 13:20:00 · 622 阅读 · 0 评论 -
腾讯发布财报,视频号用户时长涨了80%
可以预见,随着视频号、小程序用户时长和市占率的进一步提升,通过拓展商品品类和激励更多内容创作者参与直播带货,这块业务会持续带来利润增长。第一季度来自视频号的直播收入、广告、商家技术服务费增长,对腾讯网络广告业务、企业服务、增值服务中的社交网络收入均有正向影响。其中,非游戏类小程序的日均使用次数同比实现双位数百分比增长,小游戏流水同比增长30%。微信及WeChat合并月活账户数13.59亿,同比增长3%视频付费会员数量达1.16亿,同比增长8%国际市场游戏收入136亿元,同比增长3%原创 2024-05-15 23:33:13 · 319 阅读 · 0 评论 -
哪些工作不会被AI替代:人类能力地形图
在国内,AI开始被用来筛选简历,而在国外,亚马逊正在用算法跟踪仓库工人的生产率,顺道还会给生产率低的工人自动生成解雇文件。白领跟骑手并没有什么不同,越来越聪明的AI,正在管理更聪明的人。对白领和蓝领来说,被AI领导已经是个悲伤的故事了,但对艺术家和科学家来说,他们也同样都是“AIGC的养料”。机器人专家汉斯·莫拉维克曾提出“人类能力地形图”,他觉得艺术和科学位于人类能力的巅峰,最难被AI取代。这一轮AI的可靠性,是之前任何一代所谓的人工智能都不能比的。这张图代表的,是人类职业被机器人替代的顺序。原创 2024-04-11 18:51:48 · 459 阅读 · 0 评论 -
2024年3月更新,10个AI绘画工具推荐
本文整理了10个热门的AI绘图在线生成器,为设计师们和创意工作者提供一份全面的参考,帮助大家在创作过程中更上一层楼!原创 2024-03-25 12:53:18 · 1668 阅读 · 1 评论 -
AI可以生成手语视频了!SignLLM通过文字描述即可完成
近日,一项名为 SignLLM 的新型 AI 技术取得了突破性进展,或将彻底改变听障人士的沟通方式。作为全球首个多语种手语生成模型,SignLLM 能够将输入的文本或语音指令,实时转化为对应的手语手势视频,为打破语言障碍、促进信息无障碍传播带来了革命性希望。原创 2024-05-29 20:50:14 · 697 阅读 · 0 评论 -
业绩井喷,英伟达单日市值暴涨近2万亿,创地球单日增长之最
在这种情况下,NVIDIA作为人工智能硬件和技术的领导者,将有机会受益于这一趋势。这可能会推动其在科技股市场上达到新的高度。原创 2024-02-27 21:41:26 · 448 阅读 · 1 评论 -
黄仁勋首提主权 AI,或带来国家级 AI 基础设施需求;OpenAI 官网列出 AI 威胁参与者
对于任何国家或组织来说,抢占AI主权战略的制高点都至关重要,这也反映了当前人工智能领域的竞争态势和紧迫性原创 2024-02-27 21:40:45 · 655 阅读 · 0 评论 -
OpenAI Sora视频生成机制:时空补丁
AI如何将静态图像转化为动态、逼真的视频?OpenAI 的 Sora 通过时空补丁(spacetime patches)的创新使用给出了答案。原创 2024-02-18 14:02:57 · 1430 阅读 · 1 评论 -
OpenAI Sora文本生成视频注册教程
使用Sora需要确保已经注册了OpenAI账户并升级到ChatGPT Plus,Sora目前仍处于早期访问或测试阶段,还没有进入公测阶段,请耐心关注和等待。据官方透露的消息,。所以,请务必提前准备好Chatgpt Plus。原创 2024-02-21 20:36:00 · 888 阅读 · 0 评论 -
Sora、Pika文生视频模型对比
OpenAI 重磅发布文生视频模型 Sora,Sora在视频时长与视觉效果等方面相较于 Pika、Runway 等主流文生视频工具有了极大幅度的提升。原创 2024-02-18 16:36:35 · 1052 阅读 · 0 评论 -
20个AI 智能电商工具,助你抢占市场爆款
现在AIGC技术将为电商产业的智能化改革带来更大的想象空间,有望助力优化选品决策、智能客服工作、广告智能投放等环节的超智能化升级。原创 2023-09-26 23:45:44 · 1022 阅读 · 0 评论 -
ChatGPT生成式算法及发展历程
GPT(Generative Pre-Trained Transformer)系列是OpenAI开发的一系列以Transformer为基础的生成式预训练模型,目前包括文本预训练模型GPT-1,GPT-2,GPT-3,InstructGPT、ChatGPT,图像预训练iGPT,GPT-4。原创 2023-04-26 10:52:02 · 5485 阅读 · 0 评论 -
人人都是ChatGPT prompt 工程师
Prompt是研究者们为了下游任务设计出来的一种输入形式或模板,它能够帮助PLM“回忆”起自己在预训练时“学习”到的东西,慢慢地被叫做Prompt。原创 2023-04-12 18:44:33 · 2383 阅读 · 0 评论