Datawhale

一个专注于AI领域的开源组织，汇聚了众多顶尖院校和知名企业的优秀学习者，聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner，和学习者一起成长。

原创 Datawhale团队第三期录取名单！

Datawhale团队公示：Datawhale 组织成员Datawhale已经成立一年半了，从一开始的12个人，学习互助，到提议建立开源组织，做更多开源的事情，帮助更多学习者，也促进...

2020-09-23 21:17:58 2739

Datawhale用六年时间完成了从社区到生态引擎的蜕变，其"社区第一、以学习者为中心、成就贡献者"的价值观，正成为推动AI开源生态发展的重要力量。Datawhale以其独特的社区活力和创新实践，证明了社区力量在AI生态构建中的不可或缺性，为中国AI产业发展提供了新的思路和范式。‘魔搭社区’（杭州）开发者中心成为开源创新的灯塔、全国人才成长的基地，推动更多开源社区的创业火花。AI开源生态大会的成功举办，标志着中国AI开源领域进入生态协同发展的新阶段。“管道比知识本身更重要，人跟知识的链接比知识本身要重要。

2025-11-25 22:27:00 3

转载历史级对话：2025.11月马斯克对话黄仁勋最新实录

11月19日，在沙特-美国投资论坛上，马斯克与黄仁勋罕见同台，一位拥有全球最多的财富，一位拥有全球最大的公司。这场对话超越了常规的商业互捧，直抵“智能经济”的物理底座：从摩尔定律的终结，到人形机器人如何改写GDP，再到为何AI最终必须“上天”。有趣的是，在那本书的设定里，金钱已经不存在了。当你使用 Grok（xAI的模型）时，它给你的每一个回答，都是基于你的上下文、你的身份、当下的语境实时算出来的。这意味着，如果你我问同样的问题，或者你在不同时间问，得到的结果都是独一无二的。这将是一场巨大的革命。

2025-11-23 22:23:45 46

转载比Gemini 3早发布的这篇Google论文更有意思！

这让智能体得以持续进化，在 WebArena-Admin 子集上获得比“无记忆”基线更高的累积成功率。图 7：加入失败轨迹后，仅 ReasoningBank 能继续提升（49.7↑from 46.5），其余方法原地踏步甚至掉分。图 6：同一条记忆从“点按钮”→“自检元素”→“交叉验证”逐步长复杂，像 RL 的策略演化。测试时把算力花在深度探索单任务，生成多样经验反哺记忆，形成“越用越聪明”闭环。LLM-as-a-Judge 先判 success/failure，再蒸馏成。七、记忆也会“进化”！

2025-11-22 23:19:45 42

转载 2025年中国科学院、中国工程院院士增选名单公布！

中国科学院、中国工程院11月21日公布2025年院士增选名单。中国科学院、中国工程院院士完整名单，值得注意的是AI领域大牛，公布：中国科学院、中国工程院院士增选名单。2025年新当选中国科学院院士名单。2025年当选中国工程院院士名单。Datawhale分享。中国工程院院士71人。中国科学院院士73人。

2025-11-21 10:33:47 32

转载专访“不要葱姜蒜”：测绘工程专业跨行AI领域，打开了一扇新世界的大门！

当时实验室提供了一些算力资源，在完成本职工作后，我想着“既然有算力，不如多尝试几个模型”，于是就开始整理 ChatGLM、千问等当时热门模型的训练脚本和 Web Demo，后来越来越多人来询问这些脚本资源，我意识到这可能是个普遍需求。Self-LLM 最初的受众以研究生群体居多，因为当时大家都在尝试模型训练，而随时间不断发展，可以看到目前大模型面向的群体开始越来越庞大，更多的大学生、在职党也加入了进来。我们的项目就像个“时光胶囊”，记录了大模型发展的各个阶段——最新模型放在最上面，早期模型放在下面。

2025-11-20 22:17:24 33

原创新增Gemini 3，北京、杭州、深圳、广州、武汉、天津、大连、昆山八城同步报名！

聚了知名院士、浙江省市领导、头部科技企业、国内头部开源社区等。没有任何编程基础也能参加的Vibe Coding线下实践活动，让人人都能做出自己的应用，并提供站上舞台的机会。北京、杭州、广州、深圳、大连、武汉、天津、昆山八个城市联动 AI Creators Day。除了杭州外，我们也获得了许多本地伙伴的支持：武汉的华科育新×鄂港澳青创园、Kiro、MiniMax、秒哒、扣子、响指等AI Coding工具，城市：北京｜杭州｜广州｜深圳｜大连｜武汉｜天津｜昆山。博辰、王淇、晓东、小熊、小雯、秀韬、子育。

2025-11-19 21:31:13 302

原创 11.22日杭州见！AI开源社区最具影响力的聚会

—AI Creators Day（带上电脑），没有任何编程基础也能参加的Vibe Coding线下实践活动，让人人都能做出自己的应用，并提供站上舞台的机会。围绕“AI开源驱动创新”、“AI+科研”、“AIGC”、“AI+数字世界”、“AI创新创业与投资”等主题，带来。聚知名院士、浙江省市领导、阿里等头部科技企业、国内头部开源社区等。州AI开源生态大会 · 魔搭社区三周年聚会来了！，Datawhale联合魔搭社区，在主会场搭建了一个。这场大会，让人人都能成为创造者。聚会：杭州AI开源生态大会，

2025-11-18 23:10:02 435

原创从0到1开发一个Agent（智能体）框架

首先是兼容性的保证，当你掌握了HelloAgents的使用方法后，迁移到其他框架或将其集成到现有项目中时，底层的API调用逻辑是完全一致的。其次是学习成本的降低。我们将会把每一章的学习代码，保存为一个可以pip下载的历史版本，因此无需担心代码的使用成本，因为每一个核心的功能都将会是你自己编写的。基于以上的设计和实现经验，我们可以总结出工具系统开发的核心理念：在设计层面，每个工具都应该遵循单一职责原则，专注于特定功能的同时保持接口的统一性，并将完善的异常处理和安全优先的输入验证作为基本要求。

2025-11-17 22:08:12 420

原创大模型推理必看！2025最值得读的14篇论文和2篇博客

各类系统本身也缺乏深入的对比与评估。同时，本文揭示了高效推理技术的一些未来发展的方向，包括：低比特模型量化、推理时计算、去中心化推理、软硬件协同优化、开源且易用性高的推理引擎、多 LLM 协同与依赖调度、长上下文优化、解耦式推理架构、多模态协同推理与高效视觉语言模型（VLMs）、以及面向具身智能的高效视觉语言动作模型（VLAs）等。它全景覆盖了从算法优化（模型量化、稀疏化、解码加速）、系统调度（动态批处理、缓存管理、并行推理）到硬件协同（FPGA、内存内处理、边缘设备推理）的完整技术栈。

2025-11-16 22:29:44 634

原创 Datawhale贡献可视化平台发布！看见「微小努力」

这里没有「默默无闻」的付出：你的代码提交会被统计，你的研究方向会被展示，你的每一次活跃都会成为社区生态的一部分。我们希望通过数据的透明化，激发更多人参与开源的热情，让贡献者获得应有的认可，也让非组织成员能快速触摸到社区的脉搏。无论是Datawhale的成员，还是关注开源的你，都欢迎加入我们——因为开源的本质，就是「众人拾柴火焰高」。3. 参与互动：如果觉得平台有价值，不妨给项目点个Star（右上角「Star」按钮），或在GitHub Issues中提出你的建议——你的反馈，也是一种重要贡献。

2025-11-15 22:53:19 856

原创对话VideoTutor创始人赵凯：大三Agent教育创业，拿到赵长鹏1100万美金投资

Datawhale、浙江大学启真交叉学科创新创业实验室、Delta X，将在明晚 19:00 对谈 VideoTutor 创始人 Kai Zhao 和 CTO James Zhan，本轮融资由 YZi Labs 领投，百度风投、锦秋基金、Amino Capital、BridgeOne Capital 以及多位知名投资人联合参投。，主打“一句话即可生成个人专属教学 / 讲解视频”的核心功能，聚焦于。在硅谷学生创业圈中，这笔融资创下了目前学生创业项目的最高纪录。VideoTutor创始人，主持人：余奕，

2025-11-15 22:53:19 331

转载李飞飞教授最新长文火爆硅谷

随着其感知精度与计算效率的提高，世界模型生成的输出将迅速缩小模拟与现实之间的差距，从而让机器人能在数不清的状态、互动与环境中学习。随着媒介与娱乐的界限模糊化，我们正接近一种全新的互动体验形态——融合艺术、模拟与游戏的个性化世界，让任何人（而不仅仅是大型工作室）都能创造并进入自己的故事。World Labs的Marble平台将前所未有的空间表达能力与编辑控制权交到电影人、游戏设计师、建筑师及各类讲述者手中，让他们无需传统3D设计软件的繁复流程，就能快速创造、迭代、探索完整的三维世界。

2025-11-14 22:08:26 107

原创关于智能体（AI Agent）最常用框架，做了超详细的总结！

AutoGen 和 CAMEL 更多地依赖于定义智能体的“角色”和“目标”，让复杂的协作行为从简单的对话规则中“涌现”出来，这种方式更贴近人类的交互模式，但有时难以预测和调试。该框架以其消息驱动的架构为核心，将复杂的游戏流程优雅地映射为一系列并发、异步的消息传递事件，从而避免了传统状态机的僵硬与复杂。它将所有智能体共有的、重复性的工作（如主循环、状态管理、工具调用、日志记录等）进行抽象和封装，让我们在构建新的智能体时，能够专注于其独特的业务逻辑，而非通用的底层实现。这是一种明确的、顺序化的对话协调机制。

2025-11-13 22:18:18 869

原创豆包编程模型评测！花了9.9元体验Agentic Coding。

原系统需要先打开网页随便选一个小宇宙的播客链接，输入进 HearSight 的输入框，然后提交到后端，我们可以看到前端这边开始的时候是只能支持 bilibili 的视频链接进行导入，我们没法输出小宇宙播客链接的内容提交到后端里面。不过我觉得可以先不用让 Doubao-Seed-Code 读取前端的内容，虽然Doubao-Seed-Code 具有256k的上下文，对比其他的128k上下文的模型已经多出了一倍，但是过于多的相关信息，会导致信息密度降低，从而导致系统的重构出现意外。

2025-11-12 20:44:54 693

原创 20万奖金，豆包AI应用生成大赛来了！

“让创意 Real”、“让愿望 Real”、“让美好 Real”。对于任何心怀创意却苦于技术壁垒的个人而言，这是一个不容错过的，将想法直接推向现实的绝佳机会。优胜选手将受邀参加「一点都不技术」创作派对与顶尖创作者、AI 专家、投资人、媒体交流。无需编程基础、不写一行代码，只要有想法与创意，就能玩转AI，参与比赛。参赛方式：使用豆包-应用创作功能制作网页、游戏、工具等应用参赛。报名时间：2025年11月10日-2025年12月8日。同时，参赛投稿还能有机会获得神秘盲盒，创意的落地性、实用性，以及社会价值。

2025-11-11 22:33:35 227

原创关于智能体（AI Agent）搭建，Dify、n8n、Coze 超详细的总结！

这也为什么Dify可以成目前最成功的智能体平台之一，因为模型是都可以接入的，提示词、编排是可以复制的，但是工具插件的有无，是否丰富就直接决定了你的智能体能否做出更好的效果或者意想不到的强大功能。模型决定了智能体的下限，但是扣子资源库给了你智能体的能力的无穷上限，让你能够按照自己的想法，开发想象力和脑洞进行智能体的开发。它将复杂的逻辑抽象为直观的可视化工作流，无论是邮件的接收、AI 的决策，还是工具的调用和最终的回复，整个数据流和处理链路都在画布上一目了然。这对于生产环境的应用是致命的。

2025-11-10 23:01:07 1082

原创面向本科生、研究生的 AI秋季训练营来了！

特别推荐人工智能、计算机、智能科学与技术、软件工程、大数据、网络工程、自动化、通信、电子信息、数字媒体技术、电子信息工程、数据科学、统计、数学、物理、信管、金融科技、生。旨在联合高校、企业资源和开源社区力量，为学习者提供项目实践和学习机会，提升他们的专业能力和就业竞争力。AI秋训营是Datawhale在秋季发起的大规模AI学习活动，“至小有内，至大无外”的通用目的技术，其教育实践的发展轨迹。，高校和企业始终作为关键力量深度参与其中。只要你对AI方向感兴趣，有热情。AMD、浪潮信息，上智院等。

2025-11-09 22:08:21 251

原创玩转本地大模型，Ollama官方唯一指定学习教程发布！

为此，我们推出了《Handy-Ollama》这一开源教程，致力于通过系统化的内容与实战导向的指引，帮助每一位对 AI 感兴趣的人轻松在本地部署属于自己的大模型，进而探索应用开发的可能性，真正实现大模型技术的普惠与赋能，助力AI走入千行百业、千家万户。Ollama 应运而生，作为一个轻量级的大模型本地部署工具，它仅凭 CPU 即可流畅运行各类主流模型，极大地降低了技术使用的门槛。随着大模型技术浪潮的席卷，越来越多的开源模型不断涌现，但高昂的 GPU 资源门槛却将许多学习者与开发者拒之门外。

2025-11-08 22:23:30 389

转载 25万奖金+阿里云校招机会，面向大学生的顶级大赛来了！

比赛依托阿里云云原生数据库PolarDB，聚焦AI技术与数据库的创新融合，赛题方向设置为向量计算任务，希望通过参赛者的创新优化方法，充分挖掘数据库系统Data+AI潜力，推动数据库向智能化时代跃迁！本届PolarDB数据库创新设计赛的赛题源自阿里云真实业务场景，聚焦PolarDB在AI时代的架构挑战与优化空间，帮助学生在实战中提升系统能力、工程思维与创新能力。》赛项，属大学生A类竞赛，纳入全国高校学科竞赛排行榜，获奖成绩受广泛认可。承办：浙江大学、阿里云、AMD，提供面试速通机会。面向大学生，扫码报名。

2025-11-06 21:25:55 95

原创首次Hello-Agents开课了！11月最丰富组队学习来了[特殊字符]（多达18个课程）

我们相信，最好的学习方式就是动手实践。此外，项目补充了深入的算法原理讲解、详细的复现教程、前沿的优化技术分析，以及丰富的可视化交互。本项目是一个面向大模型应用开发者的RAG（检索增强生成）技术全栈教程，旨在通过体系化的学习路径和动手实践项目，帮助开发者掌握基于大语言模型的RAG应用开发技能，构建生产级的智能问答和知识检索系统。适合人群：具备Python编程基础，对RAG技术感兴趣的开发者，希望系统学习RAG技术的AI工程师，想要构建智能问答系统的产品开发者，对检索增强生成技术有学习需求的研究人员。

2025-11-05 22:29:32 904

转载校企共建AI通识实践课！AI+X人才培养成果：154名硕博研究生，16个团队获奖！

该应用通过一体化、数据驱动的AI智能评估，能够为毕业生与职场新人提供精准、高效的就业辅助。应用通过多模型协作的工作流设计，实现了对伤心、焦虑、压力等多维情绪的精准识别与实时分析，并基于音乐心理学原理，动态生成融合节奏、和声与风格的音乐推荐方案，并通过情感对话、场景化音乐描述与7×24小时在线陪伴，构建了沉浸式的情感疗愈支持体验。最终，一批涵盖AI+育人、心理&健康、科研、文娱、职业发展、旅行等多个方向的优秀作品，凭借突出的创新性、扎实的技术实现与明确的应用潜力脱颖而出，至此为期三周的实训营圆满收官。

2025-11-04 22:34:24 86

原创《Hello-Agents》完整PDF首发，智能体教程免费下载！

如果说 2024 年是"百模大战"的元年，那么 2025 年无疑开启了"Agent 元年"。技术的焦点正从训练更大的基础模型，转向构建更聪明的智能体应用。然而，当前系统性、重实践的教程却极度匮乏。终于，在昨天正式完成第16章节后，我们第一时间进行审校、排版优化，同时把所有正文的问题都review了一边。开源仅一周，《Hello-agents》从零开始的智能体原理与实践教程 GitHub Star 数量已经突破2.2k，🔍 深入理解智能体的概念、历史与经典范式。成为智能体学习圈的“顶流教程”！

2025-11-03 22:36:26 480

转载斯坦福大学教授李飞飞团队：2025年人工智能发展报告总结！

2023 年全球统计数据显示，中国以 27.63 万台（原文 276,300 台）的工业机器人安装量稳居全球首位，规模优势显著：分别是日本（4.61 万台，原文 46,100 台）的 6 倍、美国（3.76 万台，原文 37,600 台）的 7.3 倍，且中国单国安装量已占 2023 年全球总量（54.1 万台）的 51.1%，成为推动全球制造业自动化转型的核心力量。同时，认为人工智能驱动的产品与服务利大于弊的人群比例，从 2022 年的 52% 小幅升至 2024 年的 55%。

2025-11-02 22:26:03 189

原创 Google推出首个AI研究基础课，Gemini掌门人亲授！

深入了解 Transformer 模型的结构，它是现代大型语言模型的基础，并将其与 N-gram 模型进行比较，理解其在理解语言上下文方面的优势。课程鼓励批判性思考数据准备中的决策，分析数据中可能引入的偏见，并教授使用“数据卡片”流程来设计合乎伦理、透明且负责任的数据集。《星际争霸 II》顶级玩家。——本模块介绍语言模型的核心概念，包括它们如何通过预测下一个词来工作，以及概率在建模语言模式中的基础作用。学习完整的机器学习开发流程，从数据准备到实际训练一个小型语言模型（SLM），并掌握评估模型性能的方法。

2025-11-01 22:07:19 937

原创 214页内部秘籍《Smol训练手册：构建世界级LLMs的秘诀》

但是，这些报告只呈现了成功的部分，还带有一丝“事后诸葛亮”式的美化——它们无法体现凌晨两点还在调试数据加载器的煎熬、训练损失突然飙升的崩溃，或是某个隐蔽的张量并行 bug 悄然拖垮整个训练过程的无奈。已发表的研究一般特别顺理成章：合理的架构设计、精心筛选的数据集，再加上充足的算力，就能取得理想结果。：用大规模的“蒸馏推理数据”喂一遍，让模型先把推理范式学扎实，再进入指令对齐。在低学习率阶段，模型对新信息的吸收更稳、更持久，高质量样本能在不破坏早期已学能力的前提下，最大程度地塑形模型的最终行为。

2025-10-31 22:59:14 766

转载一份白皮书带你理解AI时代开发者

在10 月 24 日「程序员节」，魔搭社区联合知乎发布首份聚焦AI时代开发者的重磅报告——《THE NEXT WAVE：AI时代开发者生态白皮书》。报告告诉我们：AI 把“会写代码”的门槛拉低，却把一个更稀缺的角色推上前台——能定义问题、选技术、闭环商业的「超级个体」开发者。入行动机：63.55% 是对前沿技术的热情，59.11% 想抓时代机遇，25.62% 才是高收入。组织：大厂 24.27%，50 人以下小团队 20.74%，独立开发者 13.7%。一句话：他们把 AI 当杠杆，而非对手。

2025-10-31 12:49:11 51

原创 3万字长文！通俗解析大语言模型LLM原理

Datawhale干货作者：陈思州，Datawhale成员为了便于大家更系统的入门和学习，最近，我们会为大家分享关于AI智能体的系列内容：《Hello-Agents》项目正式发布，一起从零学习智能体。第一篇：关于智能体（AI Agent）入门，一篇超详细的总结，第二篇：AI 智能体简史本文将完全聚焦于大语言模型本身解答一个关键问题：现代智能体是如何工作的？我们将从语言模型的基本定义出发，通过对这些原理的学习，为理解LLM如何获得强大的知识储备与推理能力打下坚实的基础。一、语言模型与 Transformer

2025-10-30 22:45:35 1031

原创 AI 智能体简史（万字总结）

魏泽鲍姆的设计思想并非要创造一个真正能够“理解”人类情感的智能体，恰恰相反，他想证明的是，通过一些简单的句式转换技巧，机器可以在完全不理解对话内容的情况下，营造出一种“智能”和“共情”的假象。然而，出乎他意料的是，许多与ELIZA交互过的人（包括他的秘书）都对其产生了情感上的依赖，深信它能够理解自己。至此，智能体发展的历史长河中，几大关键的技术拼图已经悉数登场：符号主义提供了逻辑推理的框架，联结主义和强化学习提供了学习与决策的能力，而大型语言模型则提供了前所未有的、通过预训练获得的世界知识和通用推理能力。

2025-10-29 22:21:44 1025

转载李沐：年度演讲谈智能体！

“没问题，John。如果最好的闭源模型（比如OpenAI）的API得分是90，但在你的应用中，通用能力测试得分必须是85。我们现在做的是Al电话销售员（Al telemarketer），也就是说，语音智能体扮演的是“电话推销员”的角色。我们学到的一个重要经验是，即使是游戏这种听起来很简单领域，也涉及大量遵循指令（instruction following）的问题。例如，这个游戏是科幻题材，时间设定在两千年后，而你的对话是随机的？“如果你的牙齿出现（具体）问题，（赔付是多少）” 这样的回答才是准确的。

2025-10-28 21:42:58 142

原创蚂蚁百万多模态AI数据集解读来了！

但与此同时，一个现实的问题也摆在了我们面前，AI 生成的内容越来越逼真，虽然带来了一定的技术便利性，比如社交媒体上，大家可以很轻松地给视频添加特效，也可以很方便地使用类似即梦这样的软件生成图片或者视频，但是技术的进步同时也会带来一些恶意行为，技术本身是无罪的，但是有的人使用AI去生成逼真的图片，或者视频，如何分辨真假，保证信息安全，成了一个重要的挑战。有的应用场景比较单一；但Sora 2生成的视频里，投失的篮球会真实地从篮板上弹开，说明它不再仅仅是画面的拼接，而是在一定程度上模拟了物理世界的基本规律。

2025-10-27 22:02:35 1082

转载报名开启｜Google活动来杭州了

是由Google发起、全球各地GDG（Google Developer Groups，谷歌开发者社区）举办的一年一度的开发者盛会，专为互联网技术从业者举办的年度大型面基会、技术交流碰撞会、前沿新技术学习。等为一体，让开发者了解最新谷歌技术、体验前沿谷歌产品，更有丰富的社区学习板块、AI产品体验板块让你打开视野，全方位沉浸到AI的技术世界。时间：2025年11月1日（星期六）09:00-18:00。作为全球GDG的主要成员，杭州谷歌开发者社区将于。举办 DevFest 活动，本次活动集。

2025-10-27 22:02:35 76

转载报名！2025年“大运河杯”数据开发应用创新大赛火热开赛中！

赛题基于反洗钱监管评估要求，鼓励选手基于反洗钱监管目标，深度剖析反洗钱履职机构的数据特点，采用“AI+方案”设计理念，设计出一套标准且具备科学合理性的反洗钱评价标准，在此基础上，运用AI技术构建智能评价模型，对履职机构的待评数据进行自动化分析并生成监管结果评分。为核心，采用“部门出题+选手答题”的形式开展，围绕部门实际业务场景需求设计具体赛题，通过“以赛促用”方式，设置智慧政务、应急管理、智慧金融三个赛道，面向全社会公开征集具有先进性、创新性和适用性的人工智能大模型应用方案。

2025-10-26 22:01:45 97

转载 20万奖金，阿里大模型应用赛事来了！

当前，我国社会发展面临诸多结构性挑战：乡村教育中40%的小学缺乏专职音体美教师，92%的乡村学校没有专职美术教师；综合运用多模态AI生成技术，辅助孤独症儿童看护者与特教工作者，满足个性化绘本内容，提升干预效果与陪伴质量，并为本次LORA模型训练挑战奠定具体应用场景。结合多种模型能力，设计真正融入生活的AI解决方案或辅助工具，让AI成为无障碍的自然延伸，帮助需要的群体跨越被忽视的微小障碍。跳出传统"养老"思维，设计辅助型AI解决方案或通过轻量AI工具，帮助老年人保持独立、融入社会，

2025-10-26 22:01:45 33

转载关于智能体（AI Agent）入门，一篇超详细的总结！

他不是通过学习“猫有四条腿、毛茸茸、会喵喵叫”这样的规则来认识猫的，而是在看过成千上万张猫的图片后，大脑中的神经网络能辨识出“猫”这个概念的视觉模式。然而，当它工作时，它会生成一系列结构化的中间步骤，如思想、计划或API调用，这些都是明确的、可操作的符号。当前，实现这种自主协作的思路百花齐放，涌现了大量优秀的框架和产品，从早期的 BabyAGI、AutoGPT，到如今更为成熟的 CrewAI、AutoGen、MetaGPT、LangGraph 等优秀框架，共同推动着这一领域的高速发展。

2025-10-25 22:59:32 310

转载 YOLO Vision 2025 深圳站日程出炉！与我们一起探索视觉算法的无限可能

我们的使命是以不懈的行动推动人工智能的进步，开创世界一流的开源解决方案。我们希望通过便捷、前沿的技术为个人与企业赋能，让AI改变生活，让价值触手可及。我们将在这里与全球的研究者、工程师和 AI 爱好者共同探索计算机视觉的前沿进展。Ultralytics YOLO和CV类模型在E300 SOC上的部署实践分享。本次深圳站将带来满满一天的技术分享、实战演示与社区交流。PaddleOCR：提取 PDF和图片中的结构化数据。ics YOLO：端侧与物理世界中的 AI 实践。

2025-10-25 20:30:20 170

原创《Hello-Agents》项目正式发布，一起从零学习智能体！

你将把所学融会贯通，亲手打造智能旅行助手、自动化深度研究智能体，乃至一个模拟社会动态的赛博小镇，在真实有趣的项目中淬炼你的构建能力。，在旅程的终点，你将迎来一个毕业设计，构建一个完整的、属于你自己的多智能体应用，全面检验你的学习成果。，我们将从智能体的定义、类型与发展历史讲起，为你梳理"智能体"这一概念的来龙去脉。随后，我们会快速巩固大语言模型的核心知识，为你的实践之旅打下坚实的理论地基。希望这本教程能成为你探索智能体世界的起点，能够从一名大语言模型的"使用者"，蜕变为一名智能体系统的"构建者"。

2025-10-24 21:33:36 778

转载累计学习量超20万！数据要素流通技术学习来了

数据要素的高效流通与价值释放已成为驱动数字经济发展的核心引擎。国家正加速构建数据要素统一大市场，对掌握数据流通关键技术的复合型人才需求日益迫切。政策与合规、可信数据空间、隐私保护计算、数据元件、区块链、数联网、数网、数据要素实践。从国家数据基础设施统筹布局政策的推出，到可信数据空间相关建设指南的发布。课程在CCF数据治理与发展委员会的指导下，联合了40余位来自。本次升级是国内首个系统化覆盖数据要素流通全技术栈的课程，国内首个覆盖数据要素流通全技术栈的体系化课程。“数据要素流通技术MOOC第三期”

2025-10-23 22:01:34 73

转载田渊栋：博士五年的总结

Datawhale干货作者：田渊栋，卡耐基梅隆大学，编辑：Datawhale据 Axios 报道，Meta 的人工智能部门已经进行了 600 人大裁员。这次裁员主要集中在 FAIR、AI 产品及基础设施团队。而由今年 6 月新任首席 AI 官 Alexandr Wang 领导的 TBD 实验室，被精确地避开。挺夸张的，这次裁员竟然包含了华人 AI 科学家田渊栋。他在 X 上发帖称，“今天，我和我的几位团队成员都受到了此次裁员的影响。欢迎联系我们 :）”田渊栋毕业于上海交通大学计算机系（本科及硕士），之后在

2025-10-23 14:03:37 105

转载 ICCV 2025最佳论文出炉！何恺明的十年经典之作夺奖

今年获奖的论文有两篇，分别是2015年何恺明、张祥雨、任少卿和孙剑发表的「Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification」，以及Ross Girshick发表的「Fast R-CNN」。在训练VGG16这一深度网络时，Fast R-CNN的速度是R-CNN的9倍，测试速度则快213倍，并在PASCAL VOC 2012数据集上取得了更高的平均精度均值（mAP）。

2025-10-22 21:46:02 111

Airbnb 新用户的民宿预定预测-数据集

Airbnb 新用户的民宿预定预测 kaggle比赛完整数据集主要包含5个csv文件

2018-06-20

Python数据分析与挖掘实战(高清带标签+源代码)

10余位数据挖掘领域资深专家和科研人员，10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发，以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线，深入浅出介绍Python数据挖掘建模过程，实践性极强。本书共15章，分两个部分：基础篇、实战篇。基础篇介绍了数据挖掘的基本原理，实战篇介绍了一个个真实案例，通过对案例深入浅出的剖析，使读者在不知不觉中通过案例实践获得数据挖掘项目经验，同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中，应充分利用随书配套的案例建模数据，借助相关的数据挖掘建模工具，通过上机实验，以快速理解相关知识与理论。基础篇（第1～5章），第1章的主要内容是数据挖掘概述；第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明；第3章、第4章、第5章对数据挖掘的建模过程，包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。实战篇（第6～15章），重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上，本书是按照先介绍案例背景与挖掘目标，再阐述分析方法与过程，最后完成模型构建的顺序进行的，在建模过程的关键环节，穿插程序实现代码。最后通过上机实践，加深读者对数据挖掘技术在案例应用中的理解。

2018-06-20

机器学习_数学基础_精选教材(概率，线代，微积分)

普林斯顿微积分读本高清中文版概率论与数理统计 - 陈希孺 MIT线性代数导论_Introduction to Linear Algebra, 4th 每一本都是经典之作，和国内同济版相比，通俗易懂，易于自学。奠定机器学习数学基础，三本教材就够了！！！

2018-08-09

用Python解决数据结构与算法问题

一本关于python版本极佳的数据结构和算法相关教材而掌握算法和数据结构是拿到好offer必备的核心技能！

2018-08-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人