
方法论
文章平均质量分 93
认知计算 茂森
大家好!我是个喜欢琢磨“美是怎么炼成的”博士生。简单来说,我的工作就像在给大脑和AI装双摄镜头——左手研究人类看到画作、听到音乐时,大脑里噼里啪啦闪动的火花(这叫神经美学);右手教人工智能学习梵高画星空时的狂野笔触,或者周杰伦写旋律时的小心思。
展开
-
DeepSeek V3 低成本的秘密:轻量级 MoE 架构是核心
MoE#FP8#MLA#蒸馏#BF16#MFU#模型成本#计算效率。原创 2025-01-06 16:23:16 · 191 阅读 · 0 评论 -
深度模型成本为何骤降?——从分层激活到混合精度的核心原理
CPI 用于评估 CPU 的指令效率;MFU 用于评估 GPU/TPU 浮点效率。两者都衡量“算力是否被完全使用”。Amdahl 定律 vs. 加速比公式Amdahl 定律描述并行化极限加速比;混合精度加速公式反映精度压缩后的潜力。二者都指出“越靠近理想值,越难获得额外提升”。香农信息公式 vs. 激活大小香农信息衡量不确定性,激活大小衡量网络处理的“信息规模”。本质都在描述资源(比特或显存)与信息/表示的关系。激活裁剪(MoE 等)能大幅减少内存与算力需求。fp8/bf16。原创 2025-01-06 11:09:16 · 1006 阅读 · 0 评论 -
【通俗理解】AI的两次寒冬:从感知机困局到深度学习前夜
两次AI寒冬第一次因感知机的局限性使得线性模型萎靡不振;第二次因专家系统瓶颈**、硬件落后与投资潮水褪去,AI再度进入沉寂。然而,这些“寒冬”也为后续的深度学习、硬件革新与数据驱动模式提供了养分。如今,AI在大规模算力与数据的支撑下,开启了第三波浪潮**,也正因此,我们更应当记住历史教训,让技术发展更加稳健与长远。原创 2025-01-06 00:04:12 · 1602 阅读 · 0 评论 -
【沉默的羔羊心理学】汉尼拔的“移情”游戏:操纵与理解的艺术,精神分析学视角下的角色互动
弗洛伊德的精神分析学是心理学的一个重要分支,主要关注人类行为背后的无意识动机和冲突。意识与潜意识:人的心理活动分为意识、前意识和潜意识三个层面。意识是当前感知到的心理活动,前意识是可以被唤回意识的潜在记忆,而潜意识则包含被压抑的欲望和冲突。本我、自我与超我:人格由三个部分组成:本我(追求即时满足的本能)、自我(负责现实调节)和超我(道德规范和社会约束)。性欲与死亡驱力:人的基本动力来自两种本能:性欲(libido)和死亡驱力(thanatos)。梦的工作:梦是愿望的达成,通过象征和变形。原创 2025-01-04 11:38:38 · 1682 阅读 · 0 评论 -
【有作图代码】洛特卡定律:科学文献中的“努力分配器”——少数作者生产了大量文献,多数作者仅贡献少量
洛特卡定律就像是科学文献领域中的“努力分配器”,它揭示了这样一个现象:在科学研究的广阔天地里,少数作者如同勤劳的蜜蜂,生产了大量的文献,而大多数作者则像偶尔采蜜的蝴蝶,只贡献了少量的作品。这个定律不仅描述了科学文献中作者生产率的分布,也反映了科研工作中努力与成果的不均衡性。洛特卡定律在科研工作中扮演着“揭示器”的角色,它让我们看到了科研领域中努力与成果的不均衡分布,就像是在观察一个繁忙的蜂巢,少数蜜蜂忙碌地采集花蜜,而大多数则只是偶尔参与。洛特卡定律通常没有严格的数学公式,但可以通过统计和概率分布来描述。假原创 2024-12-23 10:12:30 · 790 阅读 · 0 评论 -
【(初级)自由能系列】所有系统都倾向于最小化其自由能(或意外),这一原则在不同领域中的表现形式虽有差异,但本质上都遵循着同样的优化逻辑
自由能原理作为一个统一的理论框架,成功地将多个看似不相关的领域(如神经科学、物理学、经济学、信息论、控制论、认知科学和生物学进化)联系在一起。通过自由能原理,我们可以更深刻地理解不同系统如何在给定条件下实现最优行为或状态。#自由能原理 #跨领域统一框架 #优化逻辑 #参数调节 #贝叶斯大脑 #预测编码 #最优控制 #注意力机制 #自然选择 #机器学习。:自由能原理、跨领域统一框架、优化逻辑、参数调节、贝叶斯大脑、预测编码、最优控制、注意力机制、自然选择、机器学习。原创 2024-08-27 15:17:04 · 6014 阅读 · 0 评论 -
【顶刊解读】动物行为学习机制——天生程序与快速学习
天生程序的核心概念天生程序的应用天生程序的优势天生程序与快速学习的类比假设动物的行为是其天生程序和快速学习的函数,我们可以尝试构建一个简化的模型来描述这一过程:Behavior=InnatePrograms+RapidLearning×Experience \text{Behavior} = \text{InnatePrograms} + \text{RapidLearning} \times \text{Experience} Behavior=InnatePrograms+RapidLearning×E原创 2024-08-11 19:24:42 · 890 阅读 · 0 评论 -
【通俗理解】实证先验的更新机制——层级信念的动态调整
实证先验的核心概念实证先验的应用实证先验的优势实证先验与层级信念系统的类比假设实证先验的更新可以简化为一个加权平均过程,其中旧先验和新数据根据各自的可靠性(或权重)进行组合:Priornew=α⋅Priorold+(1−α)⋅DataPrior \text{Prior}_{\text{new}} = \alpha \cdot \text{Prior}_{\text{old}} + (1 - \alpha) \cdot \text{DataPrior} Priornew=α⋅Priorold+(1−α)⋅原创 2024-08-09 12:57:57 · 732 阅读 · 0 评论 -
【李沐的想法】随机梯度下降优化人生——从目标到实现的策略最大化
其基本关联可通过以下“人生优化”公式体现:人生进步目标设定t1∑T步长t⋅梯度方向t具体来说::人生进步目标设定∑t1T步长t⋅梯度方向t::#随机梯度下降#人生优化#目标设定#步长#梯度方向#人生策略。原创 2024-08-03 11:17:23 · 1094 阅读 · 0 评论 -
【自由能系列(初级)】自由能与自由意志的桥梁——从物理到哲学的跨越
其基本关联可通过以下公式体现(虽然并非严格数学公式,但用于示意):自由意志∝可用自由能其中,∝表示与...成正比”具体来说:::#自由能#自由意志#物理学#哲学#个体行为#社会环境。原创 2024-07-31 01:01:28 · 1056 阅读 · 0 评论 -
分析哲学中的逻辑公式探索
分析哲学强调对语言、意义和逻辑关系的精确分析,逻辑公式在此扮演着核心角色。它们用于表达命题之间的关系,构建论证,以及分析概念间的逻辑结构。综上所述,逻辑蕴含在分析哲学中是一个基础而重要的概念,它用于表达命题之间的条件关系,是构建和分析论证的基石。原创 2024-07-25 17:22:47 · 1250 阅读 · 0 评论 -
【思维导图】什么是核密度估计?知乎大神的回答整合
核密度估计(kernel density estimation)定义 是在概率论中用来估计未知的密度函数,属于非参数检验方法之一 非参数检验方法 核密度估计其实是对直方图的一个自然拓展。 直观理解 核密度估计=用固定积木照样本生凑一个分布 平滑密度函数 不知道你有没有画过颜色带透明度的散点图比如 aes_colour_fill_alpha. ggplot2 2.1.0 的 h + geom_point(alpha = 1/10)颜色越深密度越大恩,这就是...原创 2021-02-02 11:29:01 · 11566 阅读 · 0 评论 -
【通俗理解】计算思维解构——问题解决的四阶段模型
计算思维 #解构 #抽象化 #范式识别 #设计算法 #问题分解 #合成方法 #计算机科学 #问题解决技巧。原创 2020-04-02 00:48:24 · 906 阅读 · 1 评论 -
实验证明:越刷手机越无聊
很多时候,我们感到无聊就去刷手机。但好像刷了过后这种无聊没有缓解,反而更加无聊?一项研究要求83名参与者在三个工作日中的每小时都对自己的疲劳和无聊程度进行汇报。用一APP记录这群人自我报告之前的20分钟和之后的20分钟监视智能手机的使用情况。结果显示,人们越刷手机越无聊。感到无聊然后去刷手机,这并不能缓解人们的无聊病症。感到无聊关键在心,你的心空空荡荡没有东西,刷多少手机都是时间的浪...原创 2020-03-31 17:02:29 · 446 阅读 · 1 评论