自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(880)
  • 收藏
  • 关注

原创 100道高频大模型面试题,看我是如何手撕面试官 脚踢hr

提供一百道面试题并保证每一道题目的详细解答达到一千字是不太现实的,因为这将会是一个非常庞大的文档。不过,我可以为你提供一系列精心挑选的大模型相关面试题目,并简要说明每个问题的重点和考察方向,这样可以帮助你准备面试。大模型面试题集总结以上这些面试题目涵盖了从基础概念到高级技术的各个方面,对于准备大模型相关职位的面试非常有帮助。建议在准备过程中,不仅要熟悉这些问题的答案,还要尝试自己动手实践,这样才能真正掌握所学知识。希望这份面试题集能帮助你在面试中脱颖而出!

2024-08-16 16:06:29 1540

原创 跨越边界:我在转型AI产品经理的一年里所积累的成长与感悟

不知不觉,已经挂着AI产品经理的title过了一年多,盘点后竟然发现,这一年中居然从0到1做了4款AI应用产品,涉及内容、营销销售、私域运营等方向,忙碌而充实。今天就结合自己这一年多的AI转型实践,和大家分享下我关于AI产品经理的一些总结和思考。在这一年多的转型旅程中,我从一名传统产品经理成长为AI产品经理,这个过程充满了挑战与收获:知识体系的重构我系统地学习了机器学习、深度学习、自然语言处理等AI基础课程,弥补了技术知识的空白。

2024-08-02 18:07:37 2116

原创 深入探究文档解析技术,助力大模型训练与应用的创新发展

探索文档解析技术是推动大模型训练与应用的重要一环。随着信息的爆炸式增长,文档数据成为了重要的数据来源之一,这些数据以多种形式存在,包括结构化数据、非结构化文本和图像等。因此,有效地解析和理解这些文档数据对于提升大模型性能与拓展大模型应用至关重要。在此背景下,大模型训练与应用需要依赖先进的文档解析技术来处理复杂的文档数据。

2024-07-19 11:41:07 1986

原创 初识LangChain的快速入门指南

LangServe可以帮助开发人员将LangChain应用程序部署为REST API。使用LangChain时不是必定使用LangServe。安装langserve。

2024-06-29 20:56:14 1683

原创 从零开始认识大模型,入行必读!

大模型,顾名思义,就是具有庞大参数和复杂结构的机器学习模型。它能够处理海量的数据,从中提取出有价值的信息,为我们提供决策支持。与传统的机器学习模型相比,大模型具有更高的准确性、更强的泛化能力和更广泛的应用场景。

2024-06-24 13:47:24 2125

原创 普通产品经理的转型攻略:转行AI产品经理,存一下吧很难找全的!

我认为的Ai产品经理,其实它是在通用产品经理的基础上,增加了一个显著能力,就是如何运用现有的AI技术去帮助客户解决问题,并在原有工作效率,或用户体验上起到增强的效果。

2025-04-02 22:45:32 932

原创 大模型面试终极指南,好家伙,被腾讯大模型面试官拷打,差点hold不住了!

通过上述的面试经验分享,希望能够帮助大家更好地准备大模型领域的面试。记住,成功的面试不仅仅是技术能力的展示,更是个人态度和沟通能力的体现。希望每位求职者都能顺利通过面试,找到满意的工作!通过以上面试经验分享,相信您已经对大模型岗位的面试有了较为全面的认识。接下来,您可以根据自己实际情况制定相应的复习计划,并积极准备即将到来的面试。祝您面试顺利!

2025-04-02 22:43:33 749

原创 挖掘了170家公司,AI Agents市场全解析

在本文中我们通过挖掘CB Insights数据库,绘制了包含170多家AI agent初创公司的市场图谱,覆盖26个类别。本文还提供了关于AI agent的发展前景、局限性和未来方向的展望。

2025-04-02 22:38:53 688

原创 FinMamba:用于股票趋势预测的市场感知增强型多层次 Mamba 模型

结合股票特征与股票间相关性已成为有效的股票走势预测方法,但金融数据面临低信噪比和市场动态复杂性挑战。现有模型未能适应市场条件下股票间关系的动态变化,且难以从长历史数据中提取有益模式,效率和内存消耗问题突出。本文提出FinMamba框架,基于Mamba-GNN,进行市场感知和多层次混合股票走势预测。通过动态图学习股票间关系的变化,结合市场趋势的修剪模块,提升模型适应性。多层次Mamba机制选择性丢弃无关信息,重置状态以高效回忆多时间尺度的历史模式,优化预测。

2025-04-02 22:37:13 540

原创 伯克利大学深度综述:揭秘多智能体LLM系统失败的原因!

今天给家人们分享一篇UC伯克利的论文 《Why Do Multi-Agent LLM Systems Fail?》 为什么多智能体系统会失败?尽管多智能体系统(MAS)备受关注,多个大模型智能体通过协作完成任务的方式引起了广泛兴趣,但在各种流行基准测试中,其性能提升相比单智能体框架仍然微不足道。这一差距凸显了分析影响MAS有效性挑战的必要性。本文提供了首个关于MAS挑战的综合研究。我们分析了五个流行的MAS框架在超过150个任务中的表现,并邀请六位专家标注员参与研究。

2025-04-02 22:31:58 789

原创 2025-04-01 AGI大模型学习路线,非常详细收藏我这一篇就够了

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;如果要深入学习,建议再按以下步骤,从更基础的GPT和BERT学起,因为底层是相通的,而且实际落地到一个系统中,应该也是大模型结合小模型(大模型在做判别性的任务上,比BERT优势不是特别大)以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-04-01 17:53:26 1156

原创 多语种语音识别新突破:使用Transformers微调Whisper模型,实现精准识别!

本文提供了一个使用 Hugging Face 🤗 Transformers 在任意多语种语音识别 (ASR) 数据集上微调 Whisper 的分步指南。同时,我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识,并提供了数据准备和微调的相关代码。Whisper 是一系列用于自动语音识别 (automatic speech recognition,ASR) 的预训练模型,它由来自于 OpenAI 的 Alec Radford 等人于2022 年 9 月发布。与。

2025-04-01 17:51:11 841

原创 【AI大模型部署】终极指南:从零基础到专家级,一步到位部署Ollma和Qwen大模型!

我们平时使用的ChatGPT、kimi、豆包等Ai对话工具,其服务器都是部署在各家公司的机房里,如果我们有一些隐私数据发到对话中,很难保证信息是否安全等问题,如何在保证数据安全的情况下,又可以使用大语言模型,Ollma(哦拉玛)可以告诉你答案!这是一个保姆级的教程,从下载到成功运行Qwen2.5大模型,更适合没有玩过Ollma的小白宝宝哦~image.png为了帮助更多热爱技术、渴望成长的朋友,我特别整理了一份涵盖大模型领域的宝贵资料集。

2025-04-01 17:49:25 887

原创 LangManus评测:Manus未定,但LangManus表现惊人!

Manus 作为一款智能体产品,被设计为能够自主完成复杂任务的 AI 系统。但是到目前为止也没有听说谁真正用过 Manus。不过近日 LangChain 官方推荐了一个开源项目,LangManus:从其 GitHub 官网来看,LangManus 是一个社区驱动的 AI 自动化框架,它建立在开源社区的卓越工作基础之上。我们的目标是将语言模型与专业工具(如网络搜索、爬虫和 Python 代码执行)相结合,同时回馈让这一切成为可能的社区。

2025-04-01 17:46:32 946

原创 Qwen2.5-Omni 7B多模态全能王:音频、视频、图片、文字、TTS,一网打尽!

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。

2025-04-01 17:40:14 568

原创 【转行大模型】从大数据到AI,我为何选择大模型领域!非常详细收藏我这一篇就够了

作为一名大数据开发工程师,我看到大模型技术正在重塑我们的行业。这次转型不仅是顺应技术潮流的选择,更是基于个人技能、市场需求和职业发展的综合考量。我相信,凭借我们在数据处理和分布式系统方面的专长,再辅以新的学习,我们完全有能力在大模型应用开发这个新领域大展身手。这次转型的思考是一个契机,后续还须更多步骤才能转型成功。我也会持续更新这一系列自己的心路历程,希望能为同样考虑转型的同行们提供一些参考和启发。让我们一起在这个AI驱动的新时代中,开创属于我们的新天地!

2025-03-31 21:34:52 1111

原创 AI产品经理逆袭指南:从零基础到精通,非常详细收藏我这一篇就好了

又到了一年一度的复盘时刻,回首2024,我给自己的关键词是:艰难转型、边界认知、抓住新机会。

2025-03-31 21:31:03 916

原创 AI+Agent:现状与未来发展趋势全面解读(36页深度报告)

在科幻电影的经典场景中,智能代理(Agent)总能以超乎想象的方式解决复杂问题,与人类并肩作战,甚至引领未来。如今,这一幕正逐步走出银幕,成为现实。随着AI技术的飞速发展,AI+Agent的结合正以前所未有的速度改变着我们的世界。那么,AI+Agent的现状如何?未来又将走向何方?今天,我们就来一场深度剖析,一起探索这份36页的《AI+Agent现状与发展趋势报告》,揭秘AI+Agent的无限可能!报告详细阐述了AI技术与Agent技术的深度融合,展示了AI+Agent在各个领域中的创新应用。

2025-03-31 21:28:52 778

原创 大模型AI Agents优化综述:8大类100+技术全解析!

LLM优化技术在许多通用任务中提升了模型性能,但缺乏针对AI Agents关键功能(如长期规划、动态环境交互和复杂决策)的专门优化。为此,华东师大等提供了对LLM的AI Agents优化方法的全面回顾,将其分为参数驱动和非参数驱动。15类AI Agents优化方法。参数驱动优化:涵盖基于微调的优化、基于强化学习的优化以及混合策略,非参数驱动策略:提示工程和外部知识检索。一、参数驱动AI Agents优化。

2025-03-31 21:26:26 801

原创 MCP(模型上下文协议)深度解析:一篇文章彻底理解

MCP Server(服务器)负责提供多种外部工具和服务,如数据库查询、API调用、数据抓取等多种外部工具和服务。MCP支持动态工具发现机制,使Agent能够在运行时灵活获取可用的工具列表。通过为Agent提供统一的接口标准,MCP使得Agent能够根据任务需求,轻松调用不同的工具和服务,从而实现与外部工具和服务的无缝集成。当Agent需要执行特定任务时,它只需通过MCP协议向MCP Server发送请求,即可调用相应的工具或服务来完成任务。

2025-03-31 21:24:34 970

原创 未出版已爆红!《从零构建大型语言模型》神书问世,40.2K标星,免费PDF下载!

Raschka曾担任威斯康星大学麦迪逊分校统计学助理教授(2018 年至 2025 年终身教授)。于 2022 年 1 月加入到 Lightning AI 初创公司。此外,还撰写了畅销书《Machine Learning with PyTorch and Scikit-Learn》、《Python Machine Learning》等著作。2024年9月,经过一年半的努力,《Build a Large Language Model (From Scratch)》出版,即从零构建一个大模型书籍。

2025-03-30 20:31:39 843

原创 深度学习入门必读:训练与推理(Training vs Inference)全解析!

如何评估模型性能?模型评估(Evaluation)是指对训练完成的模型进行性能分析和测试的过程,以确定模型在新数据上的表现如何。分类任务常见的评估指标包括准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1分数(F1 Score)等。

2025-03-30 20:29:28 742

原创 大模型学习路径,熬夜爆肝整理,存下吧很难找全的

在人工智能飞速发展的当下,大模型已然成为技术领域的焦点。本文将为你详细阐述涵盖原理理解、接入开发、场景应用三大方向的大模型学习路径,助力你实现技术进阶。

2025-03-30 20:26:30 717

原创 揭秘Embedding模型选型:如何用向量技术突破知识库的智能天花板?

随着 Embedding 技术的持续进化,我们正站在知识管理范式转换的关键节点。选择合适的 Embedding 模型,就如同为智能系统装上了理解人类语义的"大脑皮层"。无论是构建新一代知识库,还是优化 RAG 系统,对向量技术的深刻理解与合理运用,都将成为突破 AI 应用天花板的关键所在。

2025-03-30 20:24:37 1091

原创 4 个牛逼 AI 股票量化交易工具,开源

微软开源:量化投资神器 Qlib微软开源 AI 量化投资神器 Qlib,这是一个专为 AI 量化投资设计的工具包,由微软亚洲研究院开发。目前在 GitHub 上已经获得了 17.5K 的 Star。不仅融合了前沿的机器学习技术,还覆盖了从数据挖掘到策略落地的全流程,堪称金融科技领域的“瑞士军刀”。① 高效的数据管理与处理:Qlib 提供了统一的数据接口,能够轻松地加载各种金融数据(如股票、期货、外汇等)。数据可以进行灵活的清洗、转换和特征工程,以便进行进一步的模型训练。

2025-03-30 20:23:09 798

原创 2025年大模型学习路线图:神仙级教程分享,从入门到精通!_大模型学习路线分享

大模型学习路线图第一阶段:基础知识准备在这个阶段,您需要打下坚实的数学基础和编程基础,这是学习任何机器学习和深度学习技术所必需的。1. 数学基础学习资料2. 编程基础学习资料第二阶段:机器学习基础这一阶段主要涉及经典机器学习算法的学习,以及如何使用它们解决实际问题。1. 机器学习理论学习资料第三阶段:深度学习入门在这个阶段,您将学习深度学习的基本概念和框架。1. 深度学习基础学习资料2. 深度学习框架学习资料第四阶段:自然语言处理基础本阶段将介绍自然语言处理的基本概念和技术。

2025-03-29 20:18:21 666

原创 笔记本电脑上跑起来:本地知识库与大模型RAG技术的实现与增强

现在,我们可以引入,管理本地知识库,并和Ollama结合起来,实现的智能问答。AnythingLLM是采用MIT许可证的开源框架,支持快速在本地部署基于检索增强生成(RAG)的大模型应用。在不调用外部接口、不发送本地数据的情况下,确保用户数据的安全。最近 AnythingLLM推出了桌面应用,可以在自己的笔记本电脑上下载使用,目前支持的操作系统包括MacOS,Windows和Linux。下载地址:https://useanything.com/download。

2025-03-29 20:15:50 292

原创 最近,大模型岗位彻底爆了……

2025开年,AI技术打得火热,正在改变程序员的职业命运:阿里云核心业务全部接入Agent体系;字节跳动30%后端岗位要求大模型开发能力;腾讯、京东、百度开放招聘技术岗,80%与AI相关……大模型正在重构技术开发范式,最残忍的是,业务面临转型,领导要求用RAG优化知识库检索,你不会;带AI团队,微调大模型要准备多少数据,你不懂;想转型大模型应用开发工程师等相关岗,没项目实操经验……曾经热门的开发框架、大数据工具等,已不再是就业的金钥匙。如果认为如今技术圈降薪裁员频频爆发,传统岗位大批缩水,相反。

2025-03-29 20:11:17 573

原创 LLMs Multi-agent 概述

多智能体LLMs是协同工作和解决复杂任务的语言模型,每个智能体都扮演着自己擅长的独特角色。它们比传统的单代理模型做得更好,尤其是在复杂的任务和实际用途中。让他们脱颖而出的是他们的团队合作,汇集了不同专业经纪人的优势。这些代理可以作为一个团队或独立工作,具体取决于任务,从而顺利地协同工作。尽管他们大部分时间都独立运营,但他们仍然需要人工来监督他们的决策并审查他们的工作。对于他们的任务,代理使用各种工具来执行搜索 Web 或处理文档等作,所有这些都由它们所基于的强大语言模型提供支持。

2025-03-29 20:09:39 336

原创 一图胜千言:12张图清晰解析MCP、RAG、Agent架构设计之间的关系!

MCP、RAG、Agent 这些概念最近热度飙升,成了 AI 领域的热门话题。然而,我发现身边不少朋友对这些概念还是一知半解。为了帮助大家更好地理解,精心绘制了 12 张简单易懂的架构图解。这些架构图解涵盖了从 MCP 的提示混合机制,到 RAG 的知识检索增强,再到 Agent 的自主决策框架等多个方面。第一、核心概念1、RAG(检索增强生成)定义:RAG 将信息检索与文本生成相结合,创造更准确、信息更充分的回应。功能:从知识库中检索相关文档,并用它们增强生成过程。

2025-03-29 20:08:37 754

原创 AI大模型学习路线:从理论到实践,一篇文章提升你的核心竞争力!

大模型,通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑,这些大脑通过阅读大量的文本、图片、声音等信息,学习到了世界的知识。这些大脑(模型)非常大,有的甚至有几千亿个参数,这些参数就像是大脑中的神经元,它们通过复杂的计算来理解和生成语言、图片等。举个例子,你可能听说过GPT-3,它就是一个非常著名的大模型。GPT-3可以通过理解你提出的问题,然后给出回答,或者根据你给它的提示,生成一篇文章、一个故事,甚至是一段代码。

2025-03-28 19:44:01 1126

原创 DeepSeek-R1满血版:五大平台免费使用攻略大揭秘!

因为访问量过大以及遭受网络攻击,DeepSeek官网和APP这几天时好时坏,API也没法用。此前我们已分享了本地部署DeepSeek-R1的方法,但普通用户限于硬件配置,连70b模型也很难跑起来,更别说671b的全量模型了。幸好各大平台都接入了DeepSeek-R1,大家可以尝试作为平替。

2025-03-28 19:42:19 899

原创 前所未有!AI+医疗的深度融合:6大方向、42个场景,全面赋能医疗价值链

人工智能(AI)正以前所未有的态势深度融入医疗领域,特别是随着Deepseek的强势崛起,AI+医疗如同一场轰轰烈烈的革命,正在医疗服务的各个环节掀起波澜,为医疗行业带来诸多变革与新的可能。从医疗服务使用方到提供方,从监管方到药物研发、器械研发,再到医疗数据管理与服务,AI 的身影无处不在。

2025-03-28 19:39:39 956

原创 阿里深夜开源Qwen2.5-Omni,7B参数完成看、听、说、写

3 月 27 日凌晨,阿里通义千问团队发布 Qwen2.5-Omni。这是 Qwen 系列中全新的旗舰级多模态大模型,专为全面的多模式感知设计,可以无缝处理包括文本、图像、音频和视频的各种输入,同时支持流式的文本生成和自然语音合成输出。从此以后,你可以像打电话或进行视频通话一样与 Qwen 聊天!可以说是「语音聊天 + 视频聊天」都实现了。体验地址:https://chat.qwen.ai/

2025-03-28 19:37:18 1031

原创 AI大模型教程来了(大模型从入门到实战)_我还是第一次见这么全的大模型教程

AI大模型,正在构建的颠覆力,为了更好的入局AI大模型,,包含🔻 压缩技术中,为什么量化要优于剪枝、蒸馏?🔻 如何搜索裁剪阈值用于裁剪outlier?🔻 包含有异常值outlier的特征如何量化?🔻 模型剪枝的技术背景🔻 模型剪枝具体方法🔻 模型剪枝前沿方法🔻 语言模型剪枝实例🔻 AI作画–以文生图🔻 扩散模型是什么🔻 扩散模型工作拓展🔻 扩散模型带来的机遇🔻 RLHF的优点和挑战🔻 RLHF如何改善大模型性能🔻 RLHF的实际应用案例🔻 RLHF在大模型的未来趋势🔻 01

2025-03-27 17:22:00 954

原创 AI浪潮中的普通人入局指南:抓住机遇,开启AI之旅!

随着生成式AI的迅速普及,不仅科技巨头们纷纷投入重金布局,招聘市场也随之发生了显著变化。对于程序员而言,掌握AI技术已成为提升个人竞争力的关键。然而,面对复杂的理论和技术栈,很多人仍然感到迷茫,不知从哪里开始入手。

2025-03-27 17:19:28 889

原创 拼多多 多模态大模型算法工程师 面试

搜索分类推广-视觉语言大模型-visual grounding,商品分类,以图/文搜图/文二面和hr面结束之后再额外加了笔试,最逆天的一集。

2025-03-27 17:17:57 392

原创 盘点一下!大模型Agent 在各个行业领域的 “花式玩法”,涉及特别广泛~~

该框架借鉴了人类调试技巧,通过专业化代理协同、关键变量追踪和程序上下文理解等设计,提高了调试的准确性和效率。面对这个问题,华为&&中科大等提出了一个新的框架 CodeR,专注GitHub问题解答,具体来说它采用了多智能体(Multi-Agent)和预先定义的任务图(Task Graph)来自动解决 GitHub 的 issues:1. 修复和解决 issue 中报告的错误(fix bug),2. 根据issue描述在代码仓库中添加新功能特性(add new feature)。

2025-03-27 17:15:59 831

原创 Agent驱动产品研发管理:从此多了个AI产研助手,效率杠杠的!

这个结合大模型技术的产品研发管理系统,展示了AI如何真正赋能企业核心业务流程。它不仅是一个工具,更是产品团队的智能助手和决策支持系统。在当前AI技术快速发展的背景下,我们有理由相信,未来的产品研发将更加智能化、高效化。通过将大模型技术与特定业务场景深度结合,我们可以释放AI的真正价值,帮助企业在激烈的市场竞争中脱颖而出。如果你是产品经理、研发团队负责人,或者对AI赋能企业感兴趣,不妨尝试构建类似的系统,探索AI在你的业务场景中的应用可能。

2025-03-27 17:14:31 990

原创 那些自学【AI大模型】的,能骂醒一个算一个!

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-03-26 18:16:11 1113

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除