
技术摘抄
文章平均质量分 94
技术摘抄
木亦汐丫
这个作者很懒,什么都没留下…
展开
-
矩阵乘法加速计算优化最新进展
矩阵乘法作为众多 GPU 算子的基础操作,是高性能计算的重要问题之一,也是 AI 等应用的基石。它的算法机制本身相当简单,但为了达到更快的速度,人们多年来不懈努力,优化程度却一直有限。现在,加速矩阵乘法过程的任务成为数学和计算机科学的交叉点。研究人员至今仍在继续改进该过程,尽管近几十年来进展相当有限。名古屋大学计算机科学家 François Le Gall 表示,自 1987 年以来,矩阵乘法的数值改进「一直很小,而且极其难以实现」。原创 2024-09-11 18:52:05 · 1345 阅读 · 0 评论 -
【深度学习】深度学习的发展历程
深度学习起源和发展,机器学习中,我们经常使用两种方式来表示特征:局部表示和分布式表示;深度学习是将原始的数据特征通过多步的特征转换得到一种特征表示,并进一步输入到预测函数得到最终结果。深度学习以神经网络为主要模型,一开始用来解决机器学习中的表示学习问题。但是由于其强大的能力,其后深度学习越来越多地用来解决一些通用人工智能问题,比如推理、决策等,广泛应用于车牌识别、人脸识别、语音识别、智能助手、推荐系统、自动驾驶等重大领域。原创 2024-09-04 18:15:32 · 1367 阅读 · 0 评论 -
【大模型系列篇】大语言模型的前世今生
从历史上来看,自然语言处理的研究范式变化是从规则到统计,从统计机器学习到基于神经网络的深度学习,这同时也是语言模型发展的历史。要了解语言模型的发展历史,首先我们需要认识什么是语言模型。原创 2024-08-05 10:48:51 · 1286 阅读 · 0 评论 -
【搜索核心技术】经典搜索核心算法:BM25及其变种
上篇介绍了TF-IDF算法和它的四个变种,相对于TF-IDF而言,在信息检索和文本挖掘领域,BM25算法则更具理论基础,而且是工程实践中当仁不让的重要基线(Baseline)算法。BM25在20世纪70年代到80年代被提出,到目前为止已经过去二三十年了,但是这个算法依然在很多信息检索的任务中表现优异,是很多工程师首选的算法之一。本篇将谈谈BM25算法的历史、算法本身的核心概念以及BM25的一些重要变种,快速掌握这个信息检索和文本挖掘的利器。原创 2024-08-01 15:45:15 · 3024 阅读 · 0 评论 -
【搜索核心技术】经典搜索核心算法:TF-IDF及其变种
TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术,常用于挖掘文章中的关键词,而且算法简单高效,常被工业用于最开始的文本数据清洗。TF-IDF有两层意思,一层是"词频"(Term Frequency,缩写为TF),另一层是"逆文档频率"(Inverse Document Frequency,缩写为IDF)。原创 2024-07-30 18:04:32 · 874 阅读 · 0 评论