▐ 摘要
欧氏空间由于其直观的几何特性及简单有效的公式而被应用于几乎所有的深度学习模型。然而,近年来的研究发现,复杂结构数据(如社交网络、电商数据等)的建模精度往往会受到“平坦”的欧氏空间的制约,“弯曲”的曲率空间(如双曲空间和球形空间)由于具备更强的表征能力成为一种更佳的选择。
本文介绍的曲率学习框架(Curvature Learning Framework,以下简称 CurvLearn) 由阿里妈妈技术团队自研,旨在实现曲率空间下任意深度模型的训练与优化。基于 Tensorflow,CurvLearn 提供了丰富的流形实现,封装了完整的向量算子和高层 API,具备大规模分布式训练能力。目前该框架已在阿里广告关键业务场景落地,并取得了比欧氏空间更好的效果。
本文将对 CurvLearn 的相关背景、适用场景及实现逻辑做简要介绍,希望给大家带来一点启发与帮助,欢迎试用与交流讨论!
CurvLearn 开源地址:
https://github.com/alibaba/Curvature-Learning-Framework
▐ 框架背景
什么是曲率空间
曲率空间,也即微分流形,是三维欧氏空间中曲线和曲面概念的推广,呈现为局部平坦而整体“弯曲”的空间。
衡量空间“弯曲”程度的量即是曲率,曲率约接近于 ,空间越平坦,如欧氏空间曲率处处为 ;反之曲率绝对数值越大,空间畸变程度越高。根据空间各处曲率的不同,可以将曲率空间划分为常曲率空间及混合曲率空间两种。
常曲率空间指空间中各点截面曲率相等,即空间各处“弯曲”程度相同。根据曲率数值正负划分为双曲空间、欧氏空间及球面空间三种,各空间几何性质如下图所示。
混合曲率空间指空间各处曲率不同,整体呈现多样化的几何特性。实际上绝大部分常见的非欧空间都呈现出混合曲率特性,如下图展示了一个常见例子:环面空间。
曲率空间的特性
实际上不同空间暗涵了对数据分布的不同假设,一个常见例子是地图,在欧氏空间中计算真实城市距离会带来误差。因此不考虑真实数据分布而不假思索使用欧氏空间往往会带来模型精度上的损失。为此本文分别对不同空间适合的数据分布做出简要分析。
欧氏空间
欧氏空间各处均匀且平坦,具备各向同性及平移不变性,因此适合建模网格数据如图像等[1]。
双曲空间
双

介绍了一种基于Tensorflow的非欧氏深度学习框架——CurvLearn,该框架支持曲率空间下的深度模型训练与优化,适用于复杂结构数据的建模。通过提供丰富的流形实现和向量算子,CurvLearn在阿里广告业务中取得了显著效果。
最低0.47元/天 解锁文章
964

被折叠的 条评论
为什么被折叠?



