自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Datawhale

一个专注于AI领域的开源组织,汇聚了众多顶尖院校和知名企业的优秀学习者,聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner,和学习者一起成长。

  • 博客(2521)
  • 资源 (5)
  • 收藏
  • 关注

原创 Datawhale团队第三期录取名单!

Datawhale团队公示:Datawhale 组织成员Datawhale已经成立一年半了,从一开始的12个人,学习互助,到提议建立开源组织,做更多开源的事情,帮助更多学习者,也促进...

2020-09-23 21:17:58 2575

转载 DeepSeek联合清华公布推理时Scaling新论文!R2要来了?

通过更大规模的采样,DeepSeek-GRM 可以更准确地判断具有更高多样性的原则,并以更细的粒度输出奖励,从而解决挑战。本周五提交的一项工作中,来自 DeepSeek、清华大学的研究人员探索了奖励模型(RM)的不同方法,发现逐点生成奖励模型(GRM)可以统一纯语言表示中单个、成对和多个响应的评分,从而克服了挑战。受到初步实验结果的启发,研究者提出了一种用于逐点通用奖励模型的新方法,能够学习生成具有适应性和高质量的原则,以有效引导批评内容的生成,该方法被称为自我原则批评调整(SPCT)。

2025-04-04 21:52:55 26

转载 LLM 工程师工具箱:120+大模型库全攻略!

这个由 KalyanKS-NLP 创建的仓库,精心整理了超过 120 个 LLM 相关的库,并按照类别进行了分类。无论是训练、推理、应用开发,还是数据提取、安全评估,你都能在这里找到对应的工具。:Retrieval-Augmented Generation(检索增强生成)相关的库,提升模型的知识检索能力。在大语言模型(LLM)迅速发展的今天,开发者们面临着海量的资源和工具选择。:专注于 LLM 训练和微调的工具,帮助你更快、更高效地优化模型。:推理加速和优化工具,让模型运行更流畅。Datawhale推荐。

2025-04-03 21:34:35 37

转载 用 MCP 让大模型自动批量解读文献,保姆级教程来了!

MCP 就负责把 AI 模型需要的所有信息(比如要查的资料、要用的工具、之前的聊天记录等等)都准备好,打包成一个大礼包(上下文),交给 AI 模型。这样,AI 模型就不用学那么多外语了,只需要跟 MCP 说就行。MCP 作为「模型上下文协议」,可以看成专门为 AI 模型设计生态系统服务,它通过一个标准化的协议来管理和交换 AI 模型所需的各种信息,从而实现与各种外部服务和数据源的无缝集成。要加新的功能,比如查天气、订机票、下载文献等,只需要让 MCP 学会跟新的外部世界打交道就行,不用改 AI 模型本身。

2025-04-02 22:32:57 47

转载 稚晖君刚挖来的90后机器人大牛:逆袭履历堪比爽文男主

在采访中,罗剑岚坦承自己因为在科研项目中关注到UC伯克利分校卡泽洛尼教授领衔的实验,其后有缘又在天津举办的机器人研究国际会议上,获得了直接向卡泽洛尼教授发问的机会,并进一步在会后递上了自己的简历,向教授明确表达:“我想读您的研究生!而且也是在这次会议上,罗剑岚的半年苦功也换来了回报,他获得提问机会,把几个月来的思考化成几个刁钻的问题抛给了教授,卡泽洛尼会后再次找到他给出认可:“小伙子,不出意外,我想,我要把你带到伯克利。他查到卡泽洛尼教授将赴韩国参加一场有关机器人的国际会议,随即办好签证就追了过去。

2025-04-02 21:59:56 18

转载 一个LangChain与MCP结合使用的案例!

Anthropic 的 Model Context Protocol(MCP)是一个开源协议,用于将 LLM 连接到上下文、工具和提示词。LLM 应用的一个核心关注点是数据传输,即如何将数据提供给 LLM 进行推理。开发者可以使用 MCP 构建可复用、模块化的连接器,并利用针对主流平台的预构建服务器,从而打造一个由社区驱动的生态系统。如果你和我一样,那么无论原型多么简单,能够让它运行起来都会带来极大的清晰感和理解力——至少在我的思维方式里是这样的。在终端窗口中,创建两个选项卡。

2025-04-02 12:10:07 51

原创 dify v0.15.3外挂ragflow知识库,保姆级教程来了!

我们可以看到这里有非常多的模型配置选择,在ragflow中有embedding模型和rerank模型,不过它们都没有发布为api,无法调用。在探索页面有非常多的应用开发模板提供,按照自己的应用场景选择合适的即可,比如我想要一个社会学领域知识深度搜索的应用,就选择DeepResearch模板。为什么要和dify结合呢,是因为dify的智能体功能非常强大,ragflow中虽然有类似的功能,但是并没有dify那么强大;但是ragflow可以。对应的,ragflow的资源消耗比较大,大家可以注意一下!

2025-04-01 22:48:20 702

转载 奥特曼官宣开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”

在发布之前,OpenAI 将根据自己的安全准备框架(Preparedness Framework)评估这个模型,就像对任何其他模型所做的那样。同时,这个模型也允许大公司商用,奥特曼阴阳怪气 Llama 开源的用户规模限制规定:产品或服务月活超 7 亿,就要向 Meta 申请特殊许可。开放权重意味着语言模型的训练参数或权重是公开访问的,开发者可以使用它来分析和微调模型以执行特定任务,而无需原始训练数据。三箭齐发,发展为“巨无霸”的 OpenAI 再次 Open,ChatGPT 也重回最初的巅峰。

2025-04-01 12:20:04 39

原创 喂饭级教程!AI一键试衣,不用PS也能学会

如果有一个虚拟试衣镜,直接在线生成一个符合自己身材的数字人,我们把衣服商品图和尺码给到AI,它直接生成衣服的上身效果。再以同样的方式搭全套。但如果你只想看看衣服穿到自己身上是什么效果,只想“拖拉拽”就完成操作,那么也有现成的AI工具供你选择,下面推荐两个我认为做得不错的。首先需要知道我们的身材数据,然后找到想试穿的衣服的商品图。使用GPT-4o帮我们搭衣服,显而易见的优点是自由度很高,关于服装设计的所有问题都能问GPT老师。可以直观看到试穿效果,如果喜欢,点击对应的商品图就跳转到了商品页面,可以直接下单。

2025-03-31 21:51:07 893

转载 字节 DAPO 技术报告有感!大模型 RL 细节为王

在dapo中,一个核心是dynamic-sampling,简单来说,根据当前模型在prompt的bon,动态决定采样budget,难prompt采样更多的sample,简单prompt则采样更少的prompt,以及过滤模型解决不了的hard-prompt或者easy-prompt。前期loss过大,优化过于激进。这里,第一行是 大batch的loss计算,第二行是ga=2的loss计算,显然,主流框架实现的为第二行的loss计算,天然会比大batch计算的loss更大,对于长文本训练会产生不利的影响。

2025-03-31 20:52:31 15

转载 北大人工智能研究院朱松纯:“中国的AI叙事” 存在认知偏差

是通过模拟与建模,让文明、社会、经济与政策等可以进入可验证的科学范畴,而非止步于图像、语音和对话的优化。的话题被广泛炒作,形成全球范围的焦虑。我特别重视与行业、媒体的交流和沟通,原因在于我深知行业的“叙事逻辑”,对于社会认知的重要性。当下,政府机构、公众、甚至媒体,对人工智能的理解严重不足,跟着西方叙事亦步亦趋,最后只能得出。未来最难解决的问题,恰恰在于文科所关心的社会复杂系统,比如人口、政策、文明演化、价值体系。第五层,工程与部署:把模型落地到硬件、平台,优化存储、计算,形成可用的产品和系统。

2025-03-31 14:33:43 114

原创 RAG篇「数据集构建」保姆级教程来了!

直接以“问题-答案”形式存储知识,检索时相似度计算更聚焦于“问题与问题”的匹配(Question-Question Similarity),而非“问题与段落”的匹配。这是本系列的第二篇,中间还有很多需要完善的地方,我们非常期待各位小伙伴的宝贵建议和指正,让我们共同进步,一起在AI学习的道路上探索更多乐趣!:若检索到的是长文本段落,生成模型(如GPT)需要从段落中提取关键信息并重组答案,可能导致信息冗余或遗漏。答案部分已是对问题的直接回应,生成模型只需“改写”或“补充”答案,而非从头生成,降低幻觉风险。

2025-03-30 22:08:26 814

转载 GPT-4o图像生成的秘密,OpenAI 没说,网友已经拼出真相?

不过,值得一提的是,香港中文大学博士生刘杰(Jie Liu)在研究 GPT-4o 的前端时发现,用户在生成图像时看到的逐行生成图像的效果其实只是浏览器上的前端动画效果,并不能准确真实地反映其图像生成的具体过程。图像生成还具备背景移除功能,从目前的情况来说,最初 GPT-4o 生成图片会呈现一个假的棋盘格背景,直到最后才移除实际背景,这会略微降低图像质量。也因此,它们具有更好的泛化能力,能够使用多条消息进行上下文学习,通过特定的编辑输出相同(或非常接近)的结果,并且具有广义的空间和场景感。

2025-03-29 23:35:32 50

转载 GPT-4o「吉卜力风」一夜爆火,奥特曼连夜换头像!宫崎骏痛批AI侮辱生命

有人透露,他正在Midjourney的账号上表示:GPT-4o的图像生成速度慢、效果差,OpenAI只是为了筹集资金,而且是在以有害的方式参与竞争。2016年,在观看了一场关于AI创作动画的内部演示后,他严肃地表示,「如果你们想做这种令人作呕的东西,这是你们的自由,但我绝不会和它扯上任何关系」。很快,好莱坞在预算时将不再考虑手工劳动的小时数,而是考虑运行和推理的计算小时数。可以确定的是,吉卜力工作室,这个因《千与千寻》和《龙猫》等经典动画电影而享誉全球的名字,早已在全球范围内拥有一批忠实的粉丝。

2025-03-28 22:02:50 185

转载 AI Agent 的未来是事件驱动的

此外,由于 LLM(大语言模型)主要基于公开数据训练,它们无法直接访问专有的行业数据,因此在回答需要具体上下文的信息时往往显得力不从心。AI 的未来不仅仅是构建更智能的 Agent——更重要的是创建能够随着技术进步而进化和扩展的系统。与第一波 AI 受限于单一领域不同,生成式模型是在海量、多样化的数据集上进行训练的,因此具备了跨不同场景泛化的能力。它们可以生成文本、图像,甚至视频,为 AI 的应用开辟了全新的可能性。代理的输出可以无缝集成到 CRM、CDP、分析工具等中,创建一个统一的、可适应的生态系统。

2025-03-28 14:10:39 24

原创 微调篇「数据集构建」保姆级教程来了!

第三步:开展人工终审,通过随机抽查的方式,对经过前两级处理的数据进行最终审核,确保数据的完整性和可靠性。这是本系列的第一篇,中间还有很多需要完善的地方,我们非常期待各位小伙伴的宝贵建议和指正,让我们共同进步,一起在AI学习的道路上探索更多乐趣!此处数据集构建的时候也需要考虑到所构建的模型是哪家的~比如,通义千问系列的模型更适合找通义千文帮忙构建数据集,会更有利于模型微调训练哦~:在一些特定的任务中,如图像生成或语音识别,添加噪声数据可以帮助模型学习到更复杂的模式和特征,从而提升模型在实际应用中的表现。

2025-03-27 23:43:51 1333

转载 AI Agents全栈技术框架综述与未来!

主管管理Agent之间的通信,并可以为专业化的代理分配特定的任务。这个过程在 ReAct 中缺失,而 Reflexion 正是填补这一空白的地方, 利用verbal reinforcement 帮助代理从之前的失败中学习的技术。工具使用是一种强大的技术,可以增强 LLM 的能力并弥补它们的不足。在训练 LLM 时,可以给它足够数量包含类似思维的例子的数据集,或者 LLM 可以发现自己的思考过程。实现短期记忆最直接的方法是使用模型的上下文窗口,这本质上是 LLM 可以处理的 token 数量。

2025-03-26 23:31:57 59

转载 Datawhale 入驻 GitCode:以开源力量推动 AI 教育公平与创新

此次入驻 GitCode,Datawhale 将借助开源协作模式,进一步扩大公益教育的影响力,助力教育公平。立即加入 Datawhale 在 GitCode 的开源项目,与全球开发者、教育工作者和学习者一起,用代码传递温暖,用科技守护生命,共同开启 AI 教育的新篇章!作为覆盖全球 3000 + 高校、培养超百万 AI 人才的创新社区,Datawhale 将通过开源协作模式,为人工智能教育公平注入新动能,用代码传递知识,以科技赋能未来。的使命,致力于推动 AI 教育的普及与创新。

2025-03-26 22:12:46 47

转载 GPT-4o原生图像生成上线,P图、生图也就一句话的事!

模型之所以精准完成这样复杂的要求,是因为它是用非自回归的方式训练的,因此它能够理解上下文中的文本和多张图片,以非常和谐的方式在纪念币上呈现出来。要知道,大多数生图模型被要求渲染多个项目时,往往就会混淆颜色和形状,但新模型却能正确绑定15到20个对象的属性,还能成功理解各自的复杂需求。然后,他们给了模型一张卡片,希望生成同样风格的图像,但要求主角不再是卡片中的巨猫国王,而是某位研究者的狗狗。结合积极的后训练优化,最终的模型展现出惊人的视觉表现力,能够生成实用、一致且具有上下文感知能力的图像。

2025-03-26 12:04:58 98

转载 昨夜DeepSeek,今夜谷歌,Gemini 2.5 Pro深夜来袭!

在下面这个demo中,仅仅根据下面这行prompt,它就生成了一段p5js的交互式动画,展示了「宇宙鱼」的场景,并且还显示了鱼们都在想什么。而且,在不使用任何外部工具的条件下,它就在挑战人类知识和推理能力的极限前沿「人类最后的考试」中取得了18.8%的准确率,达到业界领先。谷歌称,它是世界上最强大的模型,具备统一的推理能力,以及用户所喜爱的Gemini的所有功能(长上下文、工具等)。而今天,通过Gemini 2.5,他们结合了显著增强的基础模型和改进的后期训练,让模型达到了新的性能水平。

2025-03-26 12:04:58 91

转载 DeepSeek 悄悄更新!重点编程能力大幅提升

他表示,DeepSeek-V3-0324 大约可以实现 o1-pro70% 的性能,但它免费并且 API 价格比后者便宜了至少 50 倍。Hugging Face 地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main。另一位网友也让 DeepSeek-V3-0324 创建网站,只见该模型一口气写了 800 多行代码,中途一次都没卡壳,生成的网站布局也非常完美。不过,DeepSeek-V3-0324 没有公布详细的模型卡。

2025-03-25 12:17:14 57

转载 单卡3090纯视觉玩转MineCraft,发ICLR 2025 Oral!

对于滑动边界框所在的每个位置,我们从原始图像开始裁剪出 16 张图像,以缩小视野来聚焦于边界框所在的区域,并调整回原始图像的大小,得到连续的 16 帧图像用于模拟智能体向边界框所示区域移动时的视觉变化。在此架构基础上,智能体与环境交互并收集新数据,得到对应于短期状态转换的相邻时间步长的样本对,并根据功用性图建模出对应于长期状态转移的跨越较长时间间隔的样本对。此外,鉴于我们的方法依赖功用性图来识别高价值的探索区域,从而实现长期状态跳跃,有人可能会认为,如果目标被遮挡或不可见,我们的方法将失效。

2025-03-24 22:01:15 39

转载 PPO & GRPO原理,小学生也能看懂!

进了高分段,比如 95 或 100 分,爸爸会给我极高奖励,导致我在下一次考试前可能“走火入魔”,去尝试各种极端学习方法,成绩忽高忽低,奖励也随之剧烈波动。我为了冲刺高分,可能会采取极端学习策略(比如疯狂刷题、考前通宵),偶尔考到 95 分,偶尔只有 60 分,成绩大起大落,导致奖励信号也忽上忽下。如此一来,弟弟、我,甚至更多同学都可以用“自己多次模拟考试”的均值来做分数线,不需要依赖一个外部(爸爸)不断微调的“价值网络”。真正考试时,如果你比这个平均分高,就说明你表现超出你自己的期望,我就给奖励;

2025-03-24 10:47:00 33

原创 杭州六小龙最新开源「空间理解模型」,保姆级教程来了!

点云编码器将点云信息编码为紧凑的特征表示,随后由大语言模型(LLM)生成描述场景的场景代码(scene codes),这些场景代码可以被进一步转换为三维结构布局。SpatialLM 是一款专门为三维空间理解设计的大语言模型,通过三维点云数据,生成结构化的三维场景理解输出,包括墙壁、门、窗等建筑元素,以及带有语义类别的定向物体边界框。点云数据(Point Cloud)是一种由大量空间点组成的数据集合,每个点记录了其在三维空间中的位置坐标,通常还包含颜色或反射强度信息,可用于精确描述三维物体或场景的空间结构。

2025-03-23 22:59:02 738

转载 真正的LLM Agent

游戏领域的强化学习也碰到了类似的问题,这也是为什么现在最先进的方法(比如 Pufferlib)会把环境重新封装成「对模型而言看起来像雅达利游戏的样子」,其实本质没变,只不过模型能看到的数据是高度标准化的、经过优化的。如果多次碰壁,就回头再试试」。在强化学习正式训练之前,先用一些轻量的有监督微调(SFT)给模型「预热」一下(类似 DeepSeek 的 SFT-RL-SFT-RL 这种训练路线),用的可能是一些已经有的搜索模式数据,目的是让模型提前熟悉搜索思考的逻辑和输出格式,从而加速后面的 RL 训练。

2025-03-23 13:35:49 34

转载 打王者荣耀,发NeurIPS!

通过这些图表,研究者可以直观地比较不同数据集的难度差异,以及算法在面对不同任务时的表现,从而为离线强化学习算法的性能评估提供了重要的参考。该算法结合了多智能体强化学习中的QMIX算法和保守Q学习(CQL),通过将动作空间中的每个头部视为一个独立的智能体,并在QMIX的局部Q函数中引入CQL的正则化项,从而有效地处理了复杂的动作空间结构。该数据集涵盖了单智能体(1v1)和多智能体(3v3)场景,能够模拟真实世界的复杂决策环境,填补了现有离线 RL 数据集在复杂任务和多智能体场景中的空白。

2025-03-22 22:56:48 66

转载 13年后,AlexNet源代码终于公开!带注释的原版

谷歌很高兴将具有开创性意义的 AlexNet 项目的源代码贡献给计算机历史博物馆,」Jeff Dean 说,「这段代码是 Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 撰写的标志性论文《ImageNet Classification with Deep Convolutional Neural Networks》的基础,该论文革新了计算机视觉领域,是有史以来被引用次数最多的论文之一。在计算机历史上,AlexNet 的出现有着划时代的意义。

2025-03-21 17:00:00 60

转载 最近爆火的MCP(Model Context Protocol),读这一篇就够了

我们在构造 prompt 时,希望能提供一些更 specific 的信息(比如本地文件,数据库,一些网络实时信息等)给模型,这样模型更容易理解真实场景中的问题。在阅读这篇文章前,我也简单地浏览了现有介绍 MCP 的文章。可以看出,MCP 就是以更标准的方式让 LLM Chat 使用不同工具,更简单的可视化如下图所示,这样你应该更容易理解“中间协议层”的概念了。当然,这主要是因为我的需求足够简单,当你需要实现一个复杂的 MCP Server 时,你可能需要多步的引导和 Debug 才能得到最终的代码。

2025-03-21 14:30:48 341

原创 10篇R1相关的研究全面汇总,万字思考!

Datawhale干货 作者:长琴,Datawhale成员本文通过10篇R1相关的研究,介绍R1后LLM的新范式。其核心就是如何进一步增强LLM的能力。本文中的相关阅读,可以在主页找到对应文章:主页地址:https://yam.gift/首先是整体的框架,如下所示。• Base+SFT• R1冷启动• LIMO (817 Data Selection)• s1 (1000)• Base+RL• GRPO: R1-Zero• GRPO: oat-zero (Base can Aha、RL enhance)•

2025-03-20 23:23:01 715

转载 从宇树机器人开始,全世界的机器人都在侧空翻了[特殊字符]!

波士顿动力表示,Atlas 演示的是「使用动作捕捉服开发的强化学习策略」。而该策略是波士顿动力与 RAI Institute 一起合作开发的,而后者的「使命是解决 AI 和机器人领域最重要和基本的难题」。可以看到,波士顿动力 Altas 在执行侧空翻动作时同样使用了双手撑地这个动作(严格意义上这已经不能算是「空翻」,只能算是侧手翻),而 G1 则完全是凌空侧空翻。而就在这段视频发出后不到 12 小时,波士顿动力也发布了一段视频,其中不仅同样演示了机器人侧空翻这一动作,还表演了其它看起来非常近似人类的动作。

2025-03-20 16:52:00 58

转载 从宇树机器人开始,全世界的机器人都在侧空翻了[特殊字符]!

波士顿动力表示,Atlas 演示的是「使用动作捕捉服开发的强化学习策略」。而该策略是波士顿动力与 RAI Institute 一起合作开发的,而后者的「使命是解决 AI 和机器人领域最重要和基本的难题」。可以看到,波士顿动力 Altas 在执行侧空翻动作时同样使用了双手撑地这个动作(严格意义上这已经不能算是「空翻」,只能算是侧手翻),而 G1 则完全是凌空侧空翻。而就在这段视频发出后不到 12 小时,波士顿动力也发布了一段视频,其中不仅同样演示了机器人侧空翻这一动作,还表演了其它看起来非常近似人类的动作。

2025-03-20 16:52:00 30

转载 从宇树机器人开始,全世界的机器人都在侧空翻了[特殊字符]!

波士顿动力表示,Atlas 演示的是「使用动作捕捉服开发的强化学习策略」。而该策略是波士顿动力与 RAI Institute 一起合作开发的,而后者的「使命是解决 AI 和机器人领域最重要和基本的难题」。可以看到,波士顿动力 Altas 在执行侧空翻动作时同样使用了双手撑地这个动作(严格意义上这已经不能算是「空翻」,只能算是侧手翻),而 G1 则完全是凌空侧空翻。而就在这段视频发出后不到 12 小时,波士顿动力也发布了一段视频,其中不仅同样演示了机器人侧空翻这一动作,还表演了其它看起来非常近似人类的动作。

2025-03-20 16:52:00 21

转载 全球首份全AI报纸问世!AI新闻摘要即将上线

Il Foglio》的编辑Claudio Cerasa称,这次发行AI报纸,是一项为期一个月的新闻实验的重要部分,旨在全方位展示AI技术对工作方式以及日常生活的影响。Cerasa表示,这将是全球第一份完全由AI打造的日报,写作、标题、引言,甚至连字里行间的讽刺意味,都是AI的「手笔」。当前,全球的新闻机构都在绞尽脑汁,思索如何合理运用AI,而《Il Foglio》的这次实验,正好赶上了这股热潮。《独立报》即将推出一项全新的新闻服务,该服务将借助谷歌的AI工具生成文章摘要,全程由该报记者把关。

2025-03-20 11:56:44 57

原创 AI for Science!100万奖金的顶级大赛来了!

第三届世界科学智能大赛希望通过定义核心研究方向与问题,展现科学智能先进思路,吸引全球人才共同探索科学智能领域的新课题、新方法,构建科学智能新生态。,基于物理机理约束的强化学习算法,实现分子微观结构与宏观性能的关联建模,助力重塑材料研发范式,推动固态电池电解质、生物可降解塑料等战略材料的产业化进程。次大赛由上海市科学技术委员会、上海市发展和改革委员会、上海市经济和信息化委员会、上海市教育委员会等联合指导,上海科学智能研究院和复旦大学联合主办。航空安全、材料设计、合成生物、创新药、新能源。

2025-03-19 21:50:35 265

转载 黄仁勋携GB300震撼登场!DeepSeek推理暴涨40倍打破世界纪录

老黄展示这张图中,x轴代表了生成的token,y轴代表着每秒token吞吐效率,理想情况下,图中黄色曲线应该是一个方形,即在工厂能力极限之内,非常快速生成token。但老黄认为,技术进步太快,工作负载又重,像AI工厂这样的大型项目,最好投资在最新版本的技术上,比如Blackwell,这样才能跟上潮流,避免落后。而如果降到10万token/秒,那也就是250美元。相比之下,新的Blackwell架构比Hopper强多了,尤其在能耗固定的情况下,性能提升了25倍,甚至在推理模型上直接比Hopper高40倍。

2025-03-19 20:33:53 68

原创 重磅!Datawhale在浙大发布

通过智能编码助手与AI开源教育的结合,我们正在打破技术壁垒,让更多青年能够以低成本、高效率的方式拥抱AI,释放创造力,实现从“学习者”到“创造者”的蜕变。我们相信,AI不仅是工具,更是连接梦想与现实的桥梁。以《AI 时代,编程能力 ≠ 开发门槛》为题,分享了大模型引领的编程革命,AI 时代编程门槛大幅降低,介绍通义灵码 2.0 的进化,以及大模型时代开发者成长策略;,将积极参与其中,三方共建 “OPEN 1+X AI通识课”中 AI 编程方向的内容,后续也将合力精进打磨的课程,开。

2025-03-18 22:26:40 837

转载 米哈游蔡浩宇AI游戏曝光:玩家自定义开放剧情!

从已有信息来看,Stella的实时互动需要多模态AI、智能体等技术支持,画面是100%实时演算,但视频画面不是AI生成。米哈游人不只是蔡浩宇盯上了虚拟陪伴向的AI游戏,前不久,原米哈游逆熵团队成员创办的半图科技完成数千万元天使轮融资。官网放出的岗位都是AI相关,包括预训练、后训练、Agent、视频生成等。Anuttacon的目标是用AI为游戏玩家带来前所未有的体验,突破互动娱乐的界限。Stella的对话是AI实时生成,根据玩家输入的对话,她的回答、情绪和动作都。可以提供开放式、个性化、身临其境的体验。

2025-03-18 12:37:54 38

原创 AI知识库爆火!多模态能力应用,保姆级教程来了!

同时,知识问答默认选择“文档聚合排序”,查看召回详情时,无法手动按照“召回分数”进行排序,希望后续能够优化这一问题。整个测试完,方舟知识库展现了强大的复杂文档处理能力与技术优势,还有图片 OCR、表格解析这些隐藏技能,十分强悍。在遇到专业问题时,它会先翻自己的“小抄本”(知识库),回答更靠谱。方舟知识库是一款基于大模型技术的智能知识库服务,旨在帮助用户快速构建和部署知识库,实现文档内容的智能问答。在个人日常使用的场景下,构建个人知识库这事,不太需要从零开始造轮子,使用像方舟知识库这样的在线应用会比较方便。

2025-03-17 21:51:13 850

转载 行业落地分享:Dify在顺丰内部AI Agent落地

在Dify的配置文件中,我们新增了MySQL的配置选项,允许用户指定MySQL数据库的连接信息,包括主机地址、端口、用户名、密码以及数据库名称。Dify 是一个开源的大语言模型(LLM)应用开发平台,融合了后端即服务(Backend as a Service, BaaS)和 LLMOps 的理念,旨在帮助开发者快速构建和部署生成式 AI 应用。Dify作为一个强大的AI开发平台,不仅在开发效率上表现出色,更在数据处理、智能问答、业务流程自动化以及SQL生成等场景中展现了强大的能力。

2025-03-15 23:12:55 144

原创 吴恩达的翻译Agent项目,复现教程来了!

函数接收source_lang、target_lang、source_text、translation_1、reflection作为输入,构造一个system_message 来设定 LLM 的角色为翻译专家,然后创建一个详细的prompt ,要求 LLM 根据专家建议对翻译进行编辑,确保翻译的准确性、流畅性、风格和术语使用等方面得到优化。来描述翻译工作流中传递的信息结构,包括源语言、目标语言、源文本、国家/地区(可选)、初始翻译结果(可选)、反思建议(可选)和改进后的翻译结果(可选)。

2025-03-14 23:30:42 904

用Python解决数据结构与算法问题

一本关于python版本极佳的数据结构和算法相关教材 而掌握算法和数据结构是拿到好offer必备的核心技能!

2018-08-22

机器学习_数学基础_精选教材(概率,线代,微积分)

普林斯顿微积分读本高清中文版 概率论与数理统计 - 陈希孺 MIT线性代数导论_Introduction to Linear Algebra, 4th 每一本都是经典之作,和国内同济版相比,通俗易懂,易于自学。 奠定机器学习数学基础,三本教材就够了!!!

2018-08-09

Airbnb 新用户的民宿预定预测-数据集

Airbnb 新用户的民宿预定预测 kaggle比赛完整数据集 主要包含5个csv文件

2018-06-20

Python数据分析与挖掘实战(高清带标签+源代码)

10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。 基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。 实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。

2018-06-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除