自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(829)
  • 收藏
  • 关注

原创 如何从传统产品经理转行成为顶尖的AI产品经理?终于有人一次性说清楚了!

我们先来看看大模型对于AI产品经理的定义:通过这个定义,我们可以发现,AI产品经理相较于传统产品经理而言,主要的差异其实就是在对AI技术的理解与应用上。大部分传统产品经理并没有硬性的要求一定要懂技术,主要工作的重点更加偏向于需求分析、业务理解、用户体验、产品设计、策略等方面,懂技术只是一个加分项。但对于AI产品经理,了解诸如大模型、机器学习、深度学习、自然语言处理、计算机视觉等AI相关的技术,则是一项必要条件,因为只有懂AI,才能利用AI满足需求,设计出AI产品的解决方案。

2024-09-19 11:07:30 1590

原创 花3000元自学AI大模型后,她薪水涨了20%

我看到了一个充满无限可能的新世界”,在面试完AI产品经理这一岗位后,陈漫在社交平台上如此描述自己的感受。AGI大模型浪潮席卷全球,技术革新越是凶猛,人们的失业焦虑便越加强烈。为了应对AI带来的冲击,有些人决定“打不过就加入”,转身投向这个风口行业。陈漫便是转行潮中的一员。如今在社交媒体搜索“转行AI”“AGI”等关键词,就会涌现大量转行经验的帖子。不少博主呼吁大家抓紧时间转行进入AI领域,“真心建议大家冲一冲AI赛道”“抓住AI红利”,此类标题反复出现。

2024-08-08 10:48:25 1719

原创 字节大厂大模型面经,看完手撕面试官,非常详细收藏我这一篇就够了

以下是一些大模型大厂的面经,供参考:谷歌(Google):面试形式:电话面试、在线编程测试、现场面试。面试内容:数据结构和算法、机器学习、深度学习、NLP、项目经验。面试难度:较高,注重基础知识和实际应用能力。亚马逊(Amazon):面试形式:电话面试、在线编程测试、现场面试。面试内容:数据结构和算法、机器学习、深度学习、NLP、项目经验。面试难度:较高,注重基础知识和实际应用能力。微软(Microsoft):面试形式:电话面试、在线编程测试、现场面试。

2024-07-31 16:35:33 1494

原创 全方位大模型教程:从基础入门到实战应用

2023年大西洋彼岸的OpenAi公司,AI大模型,正在构建的颠覆力,为了更好的入局AI大模型,,包含🔻 压缩技术中,为什么量化要优于剪枝、蒸馏?🔻 如何搜索裁剪阈值用于裁剪outlier?🔻 包含有异常值outlier的特征如何量化?🔻 模型剪枝的技术背景🔻 模型剪枝具体方法🔻 模型剪枝前沿方法🔻 语言模型剪枝实例🔻 AI作画–以文生图🔻 扩散模型是什么🔻 扩散模型工作拓展🔻 扩散模型带来的机遇🔻 RLHF的优点和挑战🔻 RLHF如何改善大模型性能🔻 RLHF的实际应用案例。

2024-07-28 09:00:00 1977

原创 AI 大模型之美 | 更新完结

AI 大模型的美感不仅体现在其高科技的外表和复杂的内在结构上,更体现在它们带来的科技进步和社会变革中。它们是人类智慧和技术创新的结晶,不断推动着人类社会走向更加智能化和可持续的未来。如何学习AI大模型?我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

2024-06-26 11:19:45 4111

原创 大模型学习路线全攻略:零基础入门到精通,一篇文章收藏全部知识!收藏一下吧很难找全的!

如果读者朋友不想深入学习大模型,则了解提示词的使用原则也可以了。要是既不想深入学习,又要做大模型相关的项目,则对于工程同学来说,学习RAG也能把大模型玩转起来。下面的步骤写给想系统性学习大模型的朋友们。先来一张整体结构图,越是下面部分,越是基础:需要了解深度学习的基本原理和常见术语,如神经网络、梯度下降、反向传播、监督学习、无监督学习、分类、回归、聚类等。这些概念是理解和应用大模型的基础。掌握Python语言以及相关的库和框架,如NumPy、Pandas、PyTorch或TensorFlow等。

2025-04-01 17:31:04 879

原创 DeepSeek R1+Dify+SearXNG本地部署指南:打造联网智能体,实现AI新高度!

使用Deepseek总是服务繁忙,其他第三方平台又虽然也部署了满血版本。但是对于不想把自己的资料喂给第三方的同学,那就不得不部署本地版本的啦我的配置:6G显存,32G内存,运行DeepSeek-r1:14B用得非常舒服,同时发现其实14b的也不差,甚至觉得比第三方平台要更好用。为了帮助更多热爱技术、渴望成长的朋友,我特别整理了一份涵盖大模型领域的宝贵资料集。这些资料不仅是我多年积累的心血结晶,也是我在行业一线实战经验的总结。

2025-04-01 17:28:50 592

原创 2025年AI大模型学习路线图+全套资料:普通人入门AI的最佳指南,新手小白也能轻松掌握!

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-04-01 17:26:51 416

原创 【开源神器】Dify+RAGFlow联合:知识库精准度飙升,PDF表格秒变结构化数据

整合优势1. 深度网页解析能力RAGFlow可解析PDF、扫描件、表格等复杂格式,自动识别布局并提取结构化数据,弥补Dify原生解析短板。2. 检索质量飞跃通过多路召回、重排序优化策略,RAGFlow显著提升答案准确性。例如,扫描版PDF表格的解析完整度提升40%以上。3. 混合检索模式Dify支持向量检索、全文检索、混合检索(推荐),结合RAGFlow的API调用,实现“非结构化数据+语义匹配”的双重优势。配置步骤(简化版)1. 部署RAGFlow。

2025-04-01 17:24:54 504

原创 AI Agent框架大比拼:10个最强框架,谁将脱颖而出?

选AI Agent框架,就像选队友,选错了,不仅费钱费力,最后还可能啥都没干成。

2025-04-01 17:23:04 369

原创 大语言模型 (LLM)入门必读:一篇搞懂大语言模型!

不过,想成为AI界的佼佼者?②虚假信息:大语言模型可能会生产一些具有极强迷惑性的信息,甚至可能被用于传播虚假信息或进行舆论操纵:当前社交机器人更多停留在一级传播,如果大语言模型和社交机器人相结合,就可能会形成类人的交流能力,带来社交机器人的多级传播,从而强化社交机器人传播虚假信息的负面影响。该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

2025-03-31 21:14:39 739

原创 程序员转行大模型全指南:五大热门岗位,抓住IT行业最后的风口!

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-03-31 21:12:25 961

原创 零门槛AIGC应用实战报告:Serverless+AI 轻松玩转高频AIGC场景|附287页文件下载

本书旨在整理和介绍函数计算如何构建各类AI应用,以及如何基于函数计算结合其他云产品来部署各种AI大模型。主要内容包括:【构建个人专属AI助手】【AI生图】、【AI内容创作】、【打造多形态全天候AI客服】、【使用AI快速完成文本信息处理】、【使用AI快速完成图像信息处理】六大章节,20余篇AI技术解决方案。通过这些内容,希望能够帮助您全面理解并掌握AI与函数计算结合的最佳实践。......文│阿里云。

2025-03-31 21:09:07 669

原创 全自动零代码LLM智能体框架AutoAgent

欢迎来到 AutoAgent!AutoAgent 是一个全自动且高度自发展的框架,用户仅通过自然语言即可创建和部署LLM智能体。AutoAgent 是一个“全自动、零代码”的 LLM Agent 框架,能让你通过日常语言(比如“帮我写个总结”)告诉系统你想要什么,然后它自动帮你生成一个智能助手(AI Agent)。这些助手是用像 GPT-4 或 Claude 这样的大模型驱动的,但你不需要懂技术也能用。

2025-03-31 21:02:21 703

原创 学妹突然问我:“大模型一个 token 能代表几个单词和汉字?”

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。所以中文如何高效的编码,也应该是一个研究课题,我甚至感觉中文这种二维的文字,应该和图像的 tokenizer 有某种联系,比如在训练的时候,除了 id embedding,还有这个字对应的图片信息的 embedding。网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

2025-03-31 21:01:01 426

原创 大模型免费PDF下载!《从零构建大型语言模型》书籍推荐!

构建一个大型语言模型,了解如何创建、训练和调整大型语言模型 (LLMs)!

2025-03-30 20:18:42 841

原创 DeepSeek大突破!普通人3小时从0训练大模型全攻略!

MiniMind 降低了 AI 开发的门槛,让更多人能够参与到大语言模型的探索中来。无论你是:想入门 AI 的开发者需要定制化 AI 助手的企业对语言模型感兴趣的研究者。

2025-03-30 20:15:41 646

原创 谷歌DeepMind震撼发布TxGemma:高效药物研发大模型智能体!

摘要治疗开发是一项成本高昂且风险较高的事业,常常受到高失败率的困扰。为解决这一问题,我们推出了TxGemma,一套高效、全能型的大型语言模型(LLMs),能够进行治疗属性预测以及交互式推理和可解释性分析。与特定任务模型不同,TxGemma从多种来源综合信息,使其能够在整个治疗开发流程中得到广泛应用。该套件包括从Gemma-2在综合数据集(包含小分子、蛋白质、核酸、疾病和细胞系)上微调得到的2B、9B和27B参数模型。

2025-03-30 20:13:24 628

原创 【综述】医学大模型幻觉问题及应对策略的研究与实践

大语言模型的发展速度令人瞩目。在过去几年里,大模型领域取得了难以置信的进展和突破。不断推出的新模型架构和训练方法使得大模型在自然语言处理和理解方面实现了质的飞跃[1-2]。大模型不仅改变了人们上网寻找信息的交互方式,而且在医学领域也展现出了巨大的应用潜力[3-4]。随着大模型的性能和普及程度的不断提高,人们对其在医学领域的表现寄予了更高的期望[5]。然而,尽管医学大模型前景广阔,但当下仍存在一些挑战。

2025-03-30 20:10:55 562

原创 智能体(Agent)三大表现类型揭秘:聊天助手、工作流与对话流!

这种是最常见的智能体形态,腾讯混元、通义千问、DeepSeek 的网页聊天窗口其实就是智能体,也是普通用户使用大模型使用的入口,越来越多的功能挂载到这个入口,这个网页聊天窗口已经从最简单的聊天对话助手,变成了一个整合多模态能力的超级智能体。所以说,Dify产品虽然非常优秀,但是在我这种喜欢扣字眼的产品经理眼里,Dify对产品的功能组件的定义显得太过随意,大部分人只是时间长了,用习惯了,自然而然的接受了,但是对于初学智能体开发的人来说,理解这些功能将会非常痛苦。另外Dify中的工具和插件的区别是什么?

2025-03-30 20:09:13 413

原创 2025大模型学习路线全攻略:零基础到精通,一篇文章助你2025年惊艳众人!收藏等于你学会了

通过以上七个阶段的学习,您将能够建立起对大规模预训练模型的深刻理解,并掌握其在实际应用中的技巧。记得在学习过程中保持好奇心和探索精神,积极尝试新技术并参与社区讨论。希望这份学习路线图能帮助您成功踏上大规模模型的学习之旅!如果您对某个特定阶段或主题有更详细的问题,欢迎随时提问!

2025-03-29 20:03:08 895

原创 2024年十大开源大模型RAG框架盘点!

检索增强生成(RAG)已成为增强大型语言模型能力的一项强大技术。RAG框架结合了基于检索系统的优点与生成模型的优势,能够提供更准确、更具上下文感知能力以及更及时的响应。随着对复杂AI解决方案的需求增长,许多开源的RAG框架在GitHub上涌现,每个框架都提供了独特的功能和能力。检索增强生成(RAG)是一种人工智能框架,通过整合外部知识源来增强大型语言模型(LLM)的能力。RAG通过从知识库中检索相关信息并利用这些信息来增强LLM的输入,从而使得模型能够生成更准确、更及时且更符合上下文的相关响应。

2025-03-29 20:00:42 557

原创 DeepSeek+提示词设计、幻觉避免与应用|附56页文件下载

本文主要介绍了人工智能通识教育改革,以及AI AgentDeepSeek和Manus智能体的相关内容。作者程希冀是软件和人工智能专家,设计了DeepSeek提示词,用于向AI提问。文章讨论了AI的幻觉问题,并提出了解决方法,如限定知识来源、时间范围,明确标注不确定内容等。此外,还介绍了如何通过开发方法解决幻觉问题,如RAG增强框架和精细化训练与评估。文章最后提到了AI通用智能体Manus,以及C哥的AI成长圈,为普通人提供AI商业落地机会和关键实操。......文│大数据百家讲坛 程希冀。

2025-03-29 19:58:20 597

原创 阿里再开源多模态大模型Qwen2.5-Omni

多模态模型成为了研究与应用的热门领域。其中,阿里巴巴团队研发的 Qwen2.5-Omni 脱颖而出,以其创新的架构设计、卓越的性能表现以及丰富的应用场景,为多模态交互带来了全新的解决方案,引领着人工智能迈向更加智能、自然的交互时代。

2025-03-29 19:56:57 916

原创 大模型本地部署神器:llama.cpp使用介绍

本节主要介绍什么是llama.cpp,以及llama.cpp、llama、ollama的区别。同时说明一下GGUF这种模型文件格式。llama.cpp是一个由Georgi Gerganov开发的高性能C++库,主要目标是在各种硬件上(本地和云端)以最少的设置和最先进的性能实现大型语言模型推理。主要特点:纯C/C++实现,没有任何依赖对Apple Silicon(如M1/M2/M3芯片)提供一流支持 - 通过ARM NEON、Accelerate和Metal框架优化。

2025-03-29 19:54:45 741

原创 AI产品经理面试_ai产品经理面经,非常详细收藏我这一篇就够了

引入项目背景:首先简要介绍所在公司或团队的背景和所负责的产品或领域,以便面试官了解项目的背景信息。项目概述:明确说明你在该项目中的角色和职责,并简要描述该项目的目标和挑战。突出强调该项目对业务的重要性和价值。方法和过程:阐述你采取的方法和过程,包括数据收集与分析、用户研究、需求分析、解决方案设计等。强调你的分析能力和逻辑思维,并说明你如何应用产品知识和技术来解决问题。项目成果:提供具体的数据和指标支持,展示项目的成果和影响。例如,用户留存模型的项目中,可以提及留存率的改善情况、用户行为的变化等。

2025-03-28 18:02:45 991

原创 AI大模型学习路线图:小白也能轻松上手,附赠全套学习资源!

AI大模型,即大规模预训练模型,是指拥有数亿乃至数百亿参数的深度学习模型,如BERT、GPT-3等。这些模型通过在互联网规模的数据集上进行自我学习,能捕捉到语言、图像、声音等多模态数据的复杂特征,展现出了强大的语言理解、图像识别、创造性生成等能力。它们的创新之处在于跨任务的泛化能力和通过少量示例即可适应新任务的微调能力。

2025-03-28 18:00:44 816

原创 Langchain核心概念解析:大白话带你轻松理解!

想象一下,如果你能让聊天机器人不仅仅回答通用问题,还能从你自己的数据库或文件中提取信息,并根据这些信息执行具体操作,比如发邮件,那会是什么情况?Langchain 正是为了实现这一目标而诞生的。Langchain 是一个开源框架,它允许开发人员将像 GPT-4 这样的大型语言模型与外部的计算和数据源结合起来。目前,它提供了 Python 和 JavaScript(确切地说是 TypeScript)的软件包。上图展示了Langchain的工作原理,这是一个用于提升大型语言模型(LLMs)功能的框架。

2025-03-28 17:59:30 904

原创 阿里重磅开源Qwen2.5-Omni:全模态大模型颠覆人机交互,手机也能跑

【本篇导读】阿里云推出Qwen2.5-Omni模型,具备图像、音频和视频的综合处理能力,能生成文本和自然语音。2025年3月27日,阿里巴巴通义千问团队正式发布新一代端到端全模态大模型Qwen2.5-Omni。这款以7B参数实现“看、听、说、写”全感官交互的开源模型,不仅刷新多模态任务性能纪录,更让普通用户通过手机即可体验实时音视频AI交互。无需复杂硬件,人人都能拥有“会读情绪的AI助理”。一、全模态交互革命:像人类一样感知世界。

2025-03-28 17:56:48 807

原创 GPT-4o引发P图热潮,GPU负载极限,官方紧急限流!

OpenAI 曾报告说,GPT-4o 生图能力的大幅提升源自于一系列技术改进,在执行生成任务的过程中,AI 会对人类提出的 Prompt 进行细化,编写出一个更加详细的英文版提示词。比如奥特曼的推文下有人就在质疑:我试图生成辛普森一家风格的图片,ChatGPT 算完了才回复我「受到版权限制无法生成」,为什么不在生成图片之前就限制呢?由此生成的图片可以轻松获得人们构想的效果,具备完美的风格一致性,一举让此前还属于玩具的图像生成工具成为了兼具准确性与实用性的强大工具。用 GPT-4o 生成的图片。

2025-03-28 17:54:44 776

原创 Qwen 发布 Qwen2.5-VL-32B 模型:更智能、更轻便​

近期Qwen 团队重磅推出了 Qwen2.5-VL-32B 模型,这一全新模型凭借其在智能程度与模型体量上的卓越表现,迅速吸引了全球 AI 研究者、开发者以及相关行业的广泛关注。它不仅代表着 Qwen 系列模型的重大突破,更为多模态人工智能的发展开辟了新的路径。一、Qwen 系列模型发展历程回顾Qwen 系列模型自诞生起,便在人工智能领域崭露头角。其前身 Qwen2.5 VL 于 2024 年 1 月发布,当时推出了 3B、7B 和 72B 三种尺寸的模型版本。

2025-03-28 17:51:48 756

原创 AI大模型入门宝典:零基础小白也能精通_大模型零基础教程,收藏等于学会了!

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。

2025-03-27 17:10:50 862

原创 AI浪潮冲击就业市场:机遇与挑战并存!大模型就业市场原来这么大!

近年来,人工智能技术在多个领域呈现出迅猛的发展态势,不仅推动了相关产业的进步,也带来了更多的就业机遇。

2025-03-27 17:08:41 663

原创 LLM-SFT-trick,终于有人一次性把大模型微调说清楚了!

以上的只是个人的一些炼丹经验,并没有实际的理论依据,希望大模型基础理论可以快速发展起来。如果有问题欢迎指正。更新一下最新的一些实验结果:1、在目前开源的大模型里面有三个基座模型表现非常好通义千问1.5-72B-Chat目前发现通义千问1.5-72B-Chat效果非常好,通过continue-pre-train之后的效果也非常好。

2025-03-27 17:06:08 1122

原创 AI赋能,普通员工向“超级个体”进化的路径

在信息和技术爆炸的时代,普通员工和个人面临着海量信息超载的压力,如何快速有效的获取、理解和应用信息成为提升个人效能的关键瓶颈。AI技术的快速发展,以及它所展现出的巨大潜能为赋能组织员工和个人提供了前所未有的机会。AI技术发展至今,它已不再仅仅是替代重复性劳动的工具,更是组织和个人能力的放大器和创新加速器,可以帮助我们突破自身能力边界、实现质的飞跃。

2025-03-27 17:03:45 887

原创 DeepSeek V3使用场景介绍(网页,散文,图片,游戏等等),实测版附提示词!

提示词1:帮我写一个个人网站的原型demo,要求有个人介绍、产品介绍、社交媒体联系方式等 提示词2:做一个html页面,介绍AI神器推荐的首页。深色模式,简洁但要未来科技感。

2025-03-27 17:01:39 920

原创 2025大模型学习秘籍:从零基础到精通,一篇文章助你2025年惊艳全场!

通过以上七个阶段的学习,您将能够建立起对大规模预训练模型的深刻理解,并掌握其在实际应用中的技巧。记得在学习过程中保持好奇心和探索精神,积极尝试新技术并参与社区讨论。希望这份学习路线图能帮助您成功踏上大规模模型的学习之旅!如果您对某个特定阶段或主题有更详细的问题,欢迎随时提问!

2025-03-26 17:40:57 1160

原创 向量数据库入门指南:结合大模型Agent,体验前所未有的便捷!

向量数据库的核心是把文本转换为向量,然后存储在向量数据库中,并提供向量相似性检索当用户输入问题时,将问题也转化为向量,在向量数据库中查找最相似的上下文向量,最后将文本返回给用户。当有一份文档需要 GPT 处理时,假设这份文档是客服培训资料或操作手册,可先将这份文档的所有内容转化为向量,并存储到向量数据库中。然后当用户提出相关问题时,把用户的搜索内容转换为向量,在向量数据库中搜索最相似的上下文向量,再返回给 GPT。

2025-03-26 17:38:37 543

原创 DeepSeek大模型+RAG赋能智慧农业:知识库与专家平台新高度!

源代码这个开源系统已经完整,能运行,基于这个开源,可以开发更多更高级的DeepSeek真是国运奇迹,开源免费,全球大量用户,极大提高生产效率。DeepSeek,能够赋能农业,这个开源:基于deepseek大模型农业专家系统farm-rag这个开源系统已经完整,能运行,基于这个开源,可以开发更多更高级的畅想一下,基于DeepSeek的农业专家系统的未来DeepSeek确实是一款具有开创性的开源语言模型,其开源免费的特性为全球用户提供了强大的技术支持,极大地促进了生产效率的提升。

2025-03-26 17:36:46 877

原创 Qwen2.5-Max魅力难挡:DeepSeek V3可能因此失色

在对 Qwen2.5-Max 深度评测后,我想到了一句话——有人逐日,有人摘星。DeepSeek V3 的发布和爆火,让我们看到了 MoE 模型的潜力,让世界看到中国 AI 的锋芒。探索 AGI 的路上并不孤单,DeepSeek 和 Qwen 都是中国 AI 大模型的代表力量,当然还有很多优秀国产代表。说个冷知识,DeepSeek 将 R1 蒸馏出的 6 个小尺寸模型,有 4 个用的是 Qwen 开源模型,李飞飞最新发布的 S1,也是用 Qwen2.5-32B 作为基座模型。

2025-03-26 17:35:13 949

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除