- 博客(2966)
- 收藏
- 关注
原创 摩西十戒
第一条:“我是耶和华-你的神,曾将你从埃及地为奴之家领出来,除了我之外,你不可有别的神。”第二条:“不可为自己雕刻偶像,也不可做什么形象仿佛上天、下地,和地底下、水中的百物。不可跪拜那些像,也不可事奉它,因为我耶和华-你的神是忌邪的神。恨我的,我必追讨他的罪,自父及子,直到三四代;爱我、守我戒命的,我必向他们发慈爱,直到千代。”第三条:“不可妄称耶和华-你神的名;因为妄称耶和华名的,耶和...
2019-01-11 17:57:25
3300
1
原创 深入总结一下 MiMo-Embodied: X-Embodied Foundation Model Technical Report 这篇 文章
小米公司推出的MiMo-Embodied是全球首个开源跨具身(X-Embodied)基础模型,融合自动驾驶与具身智能两大领域。该模型采用"视觉编码+跨模态投影+语言推理"的三段式架构,通过ViT视觉编码器、跨模态投影器和LLM骨干实现多模态融合与高效推理。其创新性在于支持知识双向迁移,在29项基准测试中创下SOTA记录。模型采用"渐进式四阶段训练"策略,从基础能力构建到复杂任务泛化逐步提升性能。2025年11月21日已在Hugging Face和GitHub全面开源。
2025-11-24 19:15:44
484
原创 为啥亚洲的金融中心是香港、新加坡,而不是东京?
瑞士原来是接纳粹和美国人的业务,后来被美国政府打击,很多机构不给有美国身份的人开户,现在已经不咋行了。东京不是金融中心,或者是没人找他做生意,或者是日本不想做这行当。伦敦和几个英国海外领地接的是俄罗斯,东欧,中东和部分非洲业务。你把金融中心理解成洗钱中心就懂了。新加坡接的是东南亚业务。接的是玩币那群人的业务。纽约接的是全球业务,
2025-11-24 14:49:49
40
原创 duoke
本文介绍了使用Python控制DucoCobot机器人的基本方法。主要包括:1) 机器人连接与基础控制(上电、使能、急停等);2) 运动控制(关节运动、直线运动、圆弧运动)的参数设置与实现;3) 数据获取(TCP姿态、关节位置、力反馈等)。文章提供了详细的代码示例,并说明了运动参数范围、单位转换及常见错误处理等注意事项。该示例覆盖了机器人控制的主要场景,可作为开发参考。
2025-11-21 16:46:04
120
原创 python 如何获取股票的 财务数据
摘要:本文作者分享了自己从Tushare转向Baostock的经历,因不满Tushare积分清零政策而改用Baostock获取股票数据。文章提供了一个Python代码示例,演示如何通过Baostock接口查询多只股票(贵州茅台、招商银行、五粮液)的2020年第三季度财报数据,包括ROE、净利润率等11项财务指标。代码展示了完整的登录、数据获取和登出流程,最终输出包含股票代码、发布日期、财务指标等信息的结构化表格数据。(148字)
2025-11-19 11:57:42
274
原创 /usr/local/include/pybind11/conduit/wrap_include_python_h.h:44:10: fatal error: Python.h: No such fi
本文介绍了通过设置环境变量来添加C/C++头文件搜索路径的第二种方法。具体操作是使用export命令设置CPATH或C_INCLUDE_PATH环境变量,示例中以Python 3.10头文件路径为例。这种方法能够在不修改编译命令的情况下扩展编译器的头文件查找范围。
2025-11-19 10:59:33
85
原创 一个社会的财富分布 服从什么分布
社会财富分布呈现混合分布特征:对于约95%的普通人群,财富服从对数正态分布,表现为乘性增长带来的右偏分布;而对顶层1%-5%的超级富豪群体,财富则严格遵循帕累托分布(幂律分布),呈现极端的长尾特征。这种分段分布源于不同财富积累机制:普通人受随机事件和储蓄影响,而富人则通过资本回报的正反馈效应实现财富加速集中。值得注意的是,财富分布比收入分布更不平等,体现了资本回报率高于经济增长率的核心特征。这种混合分布深刻揭示了现代经济中普遍不平等与极端财富集中的结构性矛盾。
2025-11-18 10:06:18
268
原创 你有什么三十岁之后才悟出的人生道理
摘要:人们常误以为世界遵循正态分布(钟形曲线),但现实中大多数混沌系统更符合幂律分布(L形)。正态分布常见于人为设计的封闭系统(如高考分数、IQ测试),这些系统通过设置上限和基础题来强制形成正态分布。而自然系统往往是"极端斯坦"的幂律分布,存在少数极端值和大量普通值。高考等标化考试的设计目的是为了公平排序90%的普通人,而非反映真实的能力差异。(149字)
2025-11-18 09:56:08
394
原创 已知 空间 正交 基 用世界坐标 系 表示 ,和在 正交 基下的 相对 坐标p , 求在 base 坐标系下 的坐标 给出 python 代码
本文介绍了三维坐标系转换的实现方法,包含相对坐标与世界坐标的双向转换函数(relative_to_world_coordinates和world_to_relative_coordinates),以及封装成CoordinateTransformer类。代码验证了基向量的正交性,并通过标准正交基、旋转坐标系和自定义正交基三个示例展示了功能。结果显示转换精度高,误差极小(1e-10量级),逆变换可准确还原原始坐标。该实现可用于需要不同坐标系间精确转换的应用场景。
2025-11-15 21:17:20
107
原创 深圳各个区五行属什么
深圳各区五行属性解析:全市呈现"水火既济"复合格局,福田区土金相生(莲花山稳如泰山,金融中心强化财富);南山区火木金三元融合(科技园青龙升腾,深圳湾金带环抱);罗湖区金水交融(水贝珠宝城金属性强,深圳河玉带缠腰);宝安区金土相济(制造业金属特质,羊台山白虎脉);光明区木火通明(森林覆盖率极高,科学城八卦阵列);龙华区火土共生(商贸繁荣高层密集);坪山区金土交织(制造业集群,马峦山支撑);龙岗区土水相合(制造业基地稳定,水系发达)。各区五行相互生克,构成完整的城市能量生态系统。
2025-11-15 16:52:32
1139
原创 上海 各个区五行属什么
上海各区五行属性解析:整体以水为主、金木为辅。核心城区中,黄浦区为火土交融(火土荣华局),浦东新区水金双轮(金水相生财局),静安区火水共济(水火既济),徐汇区甲木旺盛(木火通明),虹口区辛金变革(金水相涵)。西部区域长宁区庚金肃杀(金土相生),普陀区土金相生(土金生财)。各区形成完整五行生态系统,共同构成上海"水龙脉"城市的多元格局。(150字)
2025-11-15 16:49:21
1031
原创 新松机械臂编译
Thrift C++软件库是基于Apache 2.0许可的开源项目,支持跨平台开发。在Linux系统上需通过bootstrap和configure步骤构建,依赖OpenSSL、pthreads和librt等库。Windows版本需链接额外依赖项,如libevent(用于非阻塞服务器)。该库提供SSL支持(仅限阻塞模式)和Windows命名管道传输功能。最低支持C++11标准,Windows版本需7及以上系统。文档详细说明了构建流程、链接配置和平台特定注意事项,并提供了SSL证书验证的示例实现。
2025-11-15 16:06:15
841
原创 已知 空间 两点 A B ,求 A到 B 延长 线 上 C 点 C 到B 的距离 为 某个值 比如 0.1 米 给出 python 代码 并且 画出图像
这篇文章介绍了一个计算空间点延长线坐标的Python程序。程序包含三个主要函数:find_point_on_extension用于计算AB延长线上距离B点指定距离的点C坐标;plot_points_and_line通过Matplotlib绘制3D空间中的点A、B、C及连接线;calculate_additional_info计算并验证三点之间的距离和共线性。主程序通过示例点坐标演示了功能,输出计算结果并生成3D可视化图形。该程序可用于空间几何分析,计算延长线坐标,并验证三点共线性。
2025-11-12 20:22:08
110
原创 已知 空间 三个 A,B C 点 ,求 顺序 经过 A B C 三点 圆弧 轨迹 ,给出 python 代码 并且 画出图像
本文介绍了一个Python程序,用于计算和可视化空间中经过三点A、B、C的圆弧轨迹。程序首先检查三点是否共线,然后计算圆弧所在平面的法向量、圆心位置和半径。通过求解线性方程组确定圆心坐标,并生成圆弧上的点集。最后使用matplotlib进行3D可视化,绘制圆弧轨迹、三点位置、圆心以及辅助连线。代码包含完整的中文注释和错误处理,可灵活调整三点坐标,并保持坐标轴比例一致以获得更好的视觉效果。
2025-11-12 20:07:27
178
原创 Rotation.from_euler(‘xyz‘) Rotation.from_euler(‘XYZ‘)不同
欧拉角旋转中,from_euler('xyz')和from_euler('XYZ')的关键区别在于旋转轴系定义:小写字母表示内在旋转(绕物体自身转动后的轴),大写字母表示外在旋转(绕固定世界坐标系轴)。内在旋转的轴会随物体转动而改变方向,外在旋转的轴始终固定。两种旋转方式即使角度相同,最终结果也会不同,使用时需根据实际需求选择适合的模式。
2025-11-11 19:55:07
202
原创 RT 常见 用法是什么
RT矩阵(刚体变换矩阵)广泛应用于机器人学、计算机视觉和图形学领域,主要包括坐标系变换、机器人运动学、传感器融合、3D图形渲染等场景。典型应用包括:描述机器人连杆位姿关系、多传感器数据融合、点云配准、物体位姿估计以及相机标定等。通过矩阵运算可实现坐标系间的点/向量转换,如将相机坐标系的点转换到世界坐标系。示例代码展示了如何使用RT矩阵实现坐标系变换功能,通过齐次坐标转换完成点的空间映射。该矩阵是处理空间位姿问题的核心工具。
2025-11-11 18:38:58
162
原创 已知 [x,y,z,rx,ry,rz ] 求 RT矩阵 ,给出 python 代码 rx ry rz 是 欧拉角 xyz 使用 numpy
本文介绍了一个将XYZ欧拉角转换为旋转矩阵和RT矩阵的Python实现。代码包含两个主要函数:euler_xyz_to_rotation_matrix将欧拉角转换为3x3旋转矩阵,支持弧度或角度输入;manual_euler_xyz_to_rt_matrix在此基础上构建4x4齐次变换矩阵(RT矩阵)。示例展示了如何使用该代码将包含位移和旋转的6维姿态向量转换为RT矩阵,输出结果显示了完整的4x4变换矩阵。该实现通过逐个构建X、Y、Z轴旋转矩阵并按ZYX顺序相乘,准确反映了欧拉角的连续旋转过程。
2025-11-11 18:19:07
88
原创 已知 [x,y,z,rx,ry,rz ] 求 RT矩阵 ,给出 python 代码 rx ry rz 是 欧拉角 xyz 使用 Scipy(推荐)
该代码实现将包含平移和欧拉角的位姿转换为4x4齐次变换矩阵。使用numpy和scipy.spatial库,函数euler_xyz_to_rt_matrix将输入位姿[x,y,z,rx,ry,rz]转换为旋转平移矩阵,支持弧度/角度两种输入模式。示例展示了弧度输入[1,2,3,0.1,0.2,0.3]和角度输入[1,2,3,30,45,60]的转换结果,输出均为包含旋转和平移信息的4x4矩阵,其中3x3子矩阵为旋转部分,第4列前3行为平移向量。
2025-11-11 18:17:42
88
原创 介绍一下 机器人坐标转换的 RT 矩阵
RT矩阵是机器人学和计算机视觉中的刚体变换矩阵,用于描述物体在三维空间中的位置和姿态(位姿)。它由3x3旋转矩阵R(表示物体旋转)和3x1平移向量T(表示位移)组成,通过4x4齐次坐标变换矩阵统一表示。RT矩阵在机器人运动、传感器标定等场景中广泛应用,能够将不同坐标系下的位姿信息进行统一转换。其标准形式将旋转和平移整合在一个矩阵运算中,便于进行连续变换和计算。
2025-11-11 17:54:29
723
原创 介绍一下 Rotation.from_euler
Rotation.from_euler是Scipy库中用于处理空间旋转的核心方法,可将欧拉角转换为旋转对象。该方法支持单个或批量转换,并能导出为旋转矩阵、四元数等格式。主要应用于机器人学、计算机视觉和三维姿态计算领域,实现直观欧拉角与计算机友好旋转表示之间的转换,便于后续的旋转运算和坐标变换。
2025-11-11 14:24:43
671
原创 机械臂手眼标定
机械臂手眼标定方法研究 摘要:本文研究了机械臂系统中摄像头与机械臂的手眼标定问题。重点分析了"眼在手上"模式下的标定方法,该方法通过建立机械臂末端坐标系与摄像头坐标系之间的转换关系,实现视觉与运动控制系统的坐标系统一。标定过程涉及四个关键坐标系:基坐标系、末端关节坐标系、标定板坐标系和摄像头坐标系。通过解决不同坐标系间的坐标转换问题,使视觉检测结果能够准确指导机械臂运动,从而提高机械臂作业的精确性和可靠性。该方法为机械臂视觉伺服系统的实现提供了重要技术支撑。
2025-11-11 14:01:24
319
原创 DiffusionVLA 与BridgeVLA 相比 在 精度和成功率和效率上 有什么 优势
DiffusionVLA(DiVLA)在三大维度上显著优于BridgeVLA:1)精度方面,DiVLA通过扩散模型生成连续动作序列,实现更精准的物理合理轨迹,在零样本抓取任务中准确率达63.7%;2)成功率上,DiVLA在复杂工业场景和多步骤任务中表现突出,平均成功率超过85%,并具备语义理解能力(指令遵循成功率91.3%);3)效率层面,DiVLA推理速度达82Hz,是BridgeVLA的3.3倍,且训练样本需求减少10倍以上。这些优势使DiVLA在需要精细控制、复杂推理和高效部署的场景中更具竞争力。
2025-11-10 18:44:05
521
原创 DiffusionVLA 算法 和 pi 0.5 相比 在 精度和成功率和效率上 有什么 优势
DiffusionVLA (DiVLA) 在视觉语言动作任务中展现出显著优势,尤其在3D操作精度、复杂任务成功率和效率方面表现突出。实验数据显示,DiVLA在工厂分拣任务中成功率高达49.3%,零样本bin-picking准确率达63.7%,远超其他基线模型。其创新性的"推理+扩散"双引擎架构实现了更精准的连续动作控制和长序列任务规划能力,相比π0.5等模型在训练数据需求(减少10倍+)和计算资源消耗(仅需155 H800小时)方面也具有明显优势。虽然π0.5在家庭长时序任务上有特色,但
2025-11-10 18:35:54
924
原创 介绍 一下 DiffusionVLA 算法
DiffusionVLA(DiVLA)是由美的集团与华东师范大学联合开发的视觉-语言-动作模型,提出融合自回归推理与扩散策略的新范式,解决了传统VLA模型推理能力不足和动作精度欠缺的问题。其核心创新在于通过"推理注入"机制(FiLM调制)将预训练VLM的语义理解能力与扩散模型的精确动作生成相结合,实现端到端可解释控制。模型采用双核心架构:推理核心(VLM)负责任务理解,动作核心(扩散模型)生成连续动作序列。推理阶段,VLM生成的逻辑文本被编码为调制参数,动态调节扩散模型特征计算。该模型在
2025-11-10 18:30:57
1098
原创 BridgeVLA 对比 pi 0.5 有提升吗
BridgeVLA和π0.5作为不同赛道的机器人视觉语言模型,各具优势。BridgeVLA专精3D操作领域,采用3D点云转多视角2D图像的技术架构,在RLBench基准测试中平均成功率88.2%,尤其擅长高精度对齐任务(如Insert Peg成功率88%)。π0.5则聚焦2D家庭场景,通过分层推理处理长时序任务(10-15分钟),在整理床铺等复杂家务中成功率60%-80%。BridgeVLA在3D操作精度(提升基线6.8%)和抗干扰能力(14种扰动中13种最优)上突出,而π0.5在家庭环境多步骤任务中表现优
2025-11-10 18:23:46
480
原创 BridgeVLA 算法:3D 操作学习的 VLM 对齐新范式
BridgeVLA算法是由中科院自动化所与字节跳动Seed团队开发的3D视觉-语言-动作模型,解决了传统VLM与3D机器人操作间的输入输出不对齐问题。该模型通过将3D点云渲染为2D多视角图像实现输入对齐,将动作预测转换为2D热图实现输出对齐,在CVPR 2025 GRAIL workshop挑战赛中获得冠军。实验显示仅需3-5条轨迹即可达到96.8%的任务成功率,开创了"少样本3D操作"新范式。算法工作流程包括3D-2D投影、2D热图预测和3D反投影三个关键步骤,显著提升了真实机器人操作
2025-11-10 18:17:53
1304
原创 介绍 一下 GR-3:大规模视觉 - 语言 - 动作模型
GR-3是由字节跳动Seed团队开发的40亿参数通用视觉-语言-动作(VLA)模型。该模型具备强大的泛化能力,能在未知环境中保持90%以上的指令跟随率,对未见物体的操作成功率比基线高17.8%。其高效微调特性仅需10条演示数据就能将新物体操作成功率提升至86.7%。GR-3采用混合Transformer架构,整合视觉-语言编码器、动作预测模块和多模态融合层三大组件,其中创新的RMSNorm归一化技术显著提升了指令跟随精度。模型通过三位一体训练策略(视觉-语言数据、机器人轨迹数据和VR辅助数据)实现高效学习,
2025-11-10 18:02:30
936
原创 介绍 一下 DINOV2 骨干网络
摘要:DINOV2是Meta AI研发的自监督视觉基础模型,基于ViT架构在1.42亿张无标注图像上训练。其特点包括:1)提供4种规模模型(21M-1.1B参数),采用14×14图像分块;2)创新性引入4个寄存器token作为计算中转站,消除注意力伪影;3)采用教师-学生框架和双重损失函数(DINO+iBOT),结合独立投影头和Sinkhorn-Knopp归一化优化训练。该模型无需微调即可生成通用视觉特征,实现优异的局部和全局信息表征能力。(149字)
2025-11-10 17:57:42
564
原创 介绍 一下 Pi3 (π³) 算法:排列等变视觉几何学习
Pi3 (π³) 算法是一种革命性的视觉几何学习方法,由浙江大学和上海AI Lab联合开发。该算法采用完全排列等变架构,无需依赖固定参考视图即可直接预测仿射不变的相机姿态和尺度不变的局部点图。核心创新包括:1)输入顺序无关性,确保输出随输入图像排列但几何结构不变;2)无参考视图的几何预测,解决传统方法依赖参考视角的问题;3)尺度与仿射不变性处理。技术架构通过特征提取、排列等变处理和多任务预测实现,采用轻量级Transformer结构。这种设计使Pi3在单幅图像、视频序列等多种场景中具有高度鲁棒性和可扩展性。
2025-11-10 17:35:39
620
原创 IBM 华为这种公司是创新的阻碍 ,他们原创能力不行 ,一旦有好的 创新 他们就下山摘桃子,小米也是这样
摘要:文章分析了IBM、华为、小米等科技巨头在创新生态中的角色。虽然这些企业往往不是革命性技术的首创者(从0到1),但极其擅长将已验证的技术规模化(从1到N)。它们通过强大的工程化能力、供应链优势和资本实力实现"摘桃子"策略。但文章指出,这种看似"阻碍创新"的行为实际上是创新生态的重要环节:初创企业承担技术风险探索方向,而巨头则负责技术产业化和价值实现,二者形成互补共生的创新体系。真正的创新不仅需要突破性的发明,更需要将技术转化为社会价值的规模化能力。
2025-11-07 18:38:33
896
原创 IPD制度 是不是 只能 适用于成熟的产品 或者市场 必须要有对标物 比如 华为 ict 对标 思科 鸿蒙 对标安卓 特别是硬件 或者 成熟的 软件 ,但是在原创领域,ibm 华为这种企业 没有 优
摘要:本文分析了IPD制度在不同创新场景下的适用性差异。在成熟市场和对标产品领域,IPD通过明确目标、清晰技术路径、可预测投资回报和风险控制等优势,能有效提升开发效率;但在原创性、探索性创新领域,IPD因需求不确定性、技术路径模糊、投资回报难量化等问题反而形成阻碍。文章指出,企业需建立两套机制:用IPD管理现有业务,同时为颠覆性创新设立独立特战队,采取不同的管理哲学和评估标准,才能兼顾当前效率与未来突破。
2025-11-07 18:37:36
641
原创 华为学习了 IPD制度 ,那为什么 大模型开发失败了
华为IPD方法论在大模型领域的局限性分析 文章指出华为在通用大模型竞争中相对落后的原因,揭示了IPD(集成产品开发)方法论与AI大模型开发之间的根本性矛盾。IPD作为华为成功的管理工具,在确定性、可预测性的产品开发中表现卓越,但在大模型开发这种高度不确定的探索性创新中却存在明显的不适配性。 核心冲突体现在:1)IPD强调投资回报和商业论证,而大模型早期需要战略投资和容忍不确定性;2)IPD依赖成熟技术平台和模块化开发,而大模型需要原始创新和涌现能力;3)IPD注重结构化流程,而大模型需要快速迭代和灵活性;4
2025-11-07 18:36:29
839
原创 IPD制度 让企业成功的核心原因是什么
摘要: IPD(集成产品开发)制度成功的关键在于其系统性解决企业产品开发中的核心问题。首先将产品开发从技术导向转向市场投资导向,确保资源投向有潜力的项目;其次通过跨职能团队打破部门壁垒,实现质量、成本和速度的协同优化;第三设立结构化决策评审点,实现及时止损和资源聚焦;最后通过平台化开发与模块复用提升效率和降低成本。IPD通过环环相扣的管理系统,确保战略正确与执行高效。
2025-11-07 18:35:02
671
原创 介绍 一下 IBM 的 IPD制度 ,讨论一下 IPD制度 的起源
IBM的IPD(集成产品开发)制度是一套成熟的产品开发方法论,强调将产品开发作为投资管理,通过跨部门协作和市场驱动提升开发效率。其核心包括跨职能团队、结构化流程、客户需求导向及异步开发等要素。该制度源于IBM上世纪90年代的生存危机,当时公司面临巨额亏损和官僚主义问题。CEO郭士纳推行改革,通过"银湖计划"成功开发AS/400e服务器,验证了IPD理念。IBM随后融合英特尔等公司的最佳实践,形成了完整的IPD体系框架,实现了从技术导向到市场导向的转型。
2025-11-07 18:34:18
577
原创 机器人运动学及轨迹规划—(1)刚体的位姿描述
机器人运动学是轨迹规划的基础,将机器人各关节视为刚体建立数学模型。机器人状态由位置(向量P表示)和姿态(旋转矩阵/欧拉角/四元数)描述。通过旋转矩阵表示坐标系间的姿态变换,其中3×3矩阵元素对应坐标轴投影分量。完整的位置姿态描述采用4×4齐次变换矩阵,包含位置矢量和旋转矩阵。旋转变换分为绕X/Y/Z轴三种情况,右乘表示绕当前坐标系旋转,左乘表示绕世界坐标系旋转。工业机器人多采用右乘表示方法进行坐标系变换。
2025-11-06 22:56:43
320
原创 如何能翻身进入上层社会?
这篇文章总结了一个从底层实现财富自由的成功路径:首先要选择自己既有天赋又有兴趣的技能,并将其钻研到极致;然后移民到能发挥这项技能且回报丰厚的地区;通过技能获得体面收入后,要合理消费并投资优质资产;最后依靠时间复利和持续学习实现财富积累。作者以亲身经历证明,20年间从河南底层到持有三本护照的财富自由,就是严格遵循这一循序渐进的"慢即是快"方法论。
2025-11-04 20:23:01
211
原创 介绍一下帕累托分布 包括概率密度函数,概率分布 和 期望计算与证明
帕累托分布是一种重要的厚尾概率分布,由意大利经济学家帕累托于1897年提出,用于描述"少数个体占据多数资源"的现象。本文系统阐述了其理论基础,包括概率密度函数、累积分布函数等性质,并严格证明了期望值仅在形状参数α>1时存在。研究发现帕累托分布在经济学、金融风险管理等领域具有广泛应用价值,其厚尾特性能够更好捕捉极端事件风险。文章还探讨了广义帕累托分布等多种扩展形式,并比较了不同参数估计方法的优劣,指出极大似然估计在多数情况下表现最优,而贝叶斯方法在小样本中更具优势。
2025-11-04 17:47:06
706
原创 【Transformer系列(2)】注意力机制、自注意力机制、多头注意力机制、通道注意力机制、空间注意力机制超详细讲解
本文系统介绍了注意力机制及其在深度学习中的应用。首先阐述了注意力机制的基本概念和计算过程(Query-Key-Value模型),随后详细解析了自注意力机制及其改进版多头注意力机制。最后探讨了计算机视觉领域的通道注意力机制,重点介绍了SENet等经典模型。文章以Transformer系列为主线,完整梳理了从基础理论到实践应用的关键知识点,为理解注意力机制在各类深度学习任务中的作用提供了系统指导。
2025-11-03 21:52:32
779
原创 哪些看似毫不相干的事物具有相同的数学原理
金融、物理和计算机科学中的三个重要理论模型——Markowitz投资组合模型、伊辛模型和二次优化问题,在数学形式上具有惊人的相似性。它们都表现为二次优化问题的数学结构,可以统一用成本函数F=∑Cijninj-ζ∑Rini表示。其中Markowitz模型通过资产协方差矩阵Cij控制风险,伊辛模型描述自旋相互作用,而二次优化则是计算机科学中的基础问题。这种跨学科的数学共性揭示了复杂系统背后的统一规律。
2025-11-03 21:01:17
303
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅