- 博客(230)
- 资源 (3)
- 收藏
- 关注

原创 机器学习算法实现(基于numpy)
这篇博客是将笔者边学边刷《机器学习公式推导与代码实现》的模型跟代码记录下来,部分地方结合自己的思考对原作者的代码有一定的改动,这些博客主要是动手去实现一些模型,感受机器学习各个模型能解决的问题以及收敛后的效果,所以对相关理论没有过于深入。
2023-07-28 13:28:22
321

原创 笔试算法通关(python实现)
这篇博客是将笔者边学边刷《算法通关之路》的题目跟代码记录下来,也参考了leetcode的官方题解,结合自己的思考对原作者的代码有一定的改动,所有题目都是来自于leetcode,几乎涵盖了leetcode和我们求职笔试中的全部题目类型。
2023-07-28 13:06:50
395
原创 《算法通关之路》chapter17一些通用解题模板
chapter17一些通用解题模板:二分法(三种)、回溯法、并查集、BFS、滑动窗口(三种)、数学(判断素数、最大公约数、最小公倍数)
2023-10-07 17:03:17
453
原创 《算法通关之路》chapter19解题技巧和面试技巧
chapter19-解题技巧与面试技巧:转化为全零矩阵的最少反转次数、矩阵置零、顺次数、单词接龙、统计全为 1 的正方形子矩阵、子串的最大出现次数、生命游戏
2023-10-06 17:00:36
414
原创 《算法通关之路》-chapter18融会贯通
chapter18-融会贯通:轮转数组、旋转链表、编辑距离、数组中的第K个最大元素、数据流中的第 K 大元素、二叉搜索树中第K小的元素、有序矩阵中第 K 小的元素、乘法表中第k小的数
2023-09-27 17:08:13
403
原创 编程题练习@9-13
同一局域网内的设备可以相互发现,具备直连路由的两个设备可以互通。假定设备A和B互通,B和C互通,那么可以将B作为中心设备,通过多跳路由策略使设备A和C互通。运营商建设基站时需要关注很多因素,其中:基站的信号覆盖范围、建设成本就是要考虑的部分因素。现有多个基站候选点,我们需要决策在哪些地点建设基站,要求:在尽可能多地覆盖服务地域的前提下尽可能少地建设基站。
2023-09-13 20:34:25
612
2
原创 编程题练习@9-7
一个有序的整数列表示方式通常使用逗号隔开。如果序列中的几个整数是连续递增 1 时可以使用数字范围的方式表达,通常用[-] 符隔开。给定某只股票连续N天的价格列表stockPrices,其中stockPrices表示股票某天的价格请生成一个新列表,对应位置输出为:要想等到股票价格上涨,至少需要等待的天数,如果股票价格不上涨,对应位置输出为0。给定一个 m*n 的整数矩阵作为地图,矩阵数值为地形高度:中庸行者选择地图中的任意一点作为起点,尝试往上、下、左、右四个相邻格子移动移动时有如下约束。
2023-09-07 16:25:45
589
1
原创 编程题练习@9-5
解析输入的字符串数组,提取出字符串中的时间戳信息,并且将字符串按照时间戳排序后,输出到控制台。有一个很长的英文单词串,里面全是小写字母,请你统计一下里面长度大于等于k的单词一共出现了多少次,然后输出出现频率最高的那个单词。给定一个二叉树的根节点root,该树的节点值都在数字0-9之间,每一条从根节点到叶子节点的路径都可以用一个数字表示。
2023-09-05 23:04:06
748
2
原创 《动手学深度学习》-57长短期记忆网络LSTM
长期以来,隐变量模型存在长期信息保存和短期输入缺失的问题。解决这一问题的最早方法之一是长短期记忆网络。
2023-08-30 22:40:44
223
原创 《自然语言处理》chapter7-预训练语言模型
自然语言处理的核心在于如何更好地建模语言。广义上的预训练语言模型可以泛指提前经过大规模数据训练的语言模型,包括早期的Word2vec、GloVe为代表的静态词向量模型,以及基于上下文建模的CoVe、ELMo等动态词向量模型。在2018年,以GPT和BERT为代表的基于深层Transformer的表示模型出现后,预训练语言模型这个词才真正被大家广泛熟知。
2023-08-30 12:11:23
369
原创 《动手学深度学习》-55循环神经网络
简单来说循环神经网络RNN就是在MLP中加了一项,使它可以与前一个时间的h_{t-1}发生关系。时序信息存储在W_{hh}。
2023-08-30 12:08:38
179
原创 编程题练习@8-29
最近小强很喜欢玩一款勇士打怪的游戏,勇者和怪物都有一个属性:能力值。当勇者遭遇-个怪物时,战斗方式如下:如果勇者的能力值不低于怪物的能力值,勇者胜。否则勇者败。小红计划在m天刷n道题,第i天计划刷a_i题。
2023-08-29 20:26:31
308
原创 《算法通关之路》-chapter16一些有趣的题目
chapter16一些有趣的题目:多数元素 II、柱状图中最大的矩形、一周中的第几天、水壶问题、可怜的小猪
2023-08-27 21:12:53
173
原创 编程题练习@8-26
为了使识别出来的文本序列和标准的文本序列之间保持一致,需要进行替换,删除,或者插入某些字。 这些插入,替换,删除的字的总个数,除以标准的文本词序列中字的个数的百分比,即为WER。输入一个2行n列(1≤n≤1e5)的矩阵a(1≤a[i][j]≤1e9)。你需要从矩阵中选择一些数,要求任意两数不能左右相邻,也不能上下相邻。求所选数字之和的最大值。
2023-08-27 15:48:56
316
原创 《动手学深度学习》-28批量归一化
批量归一化是一个线性变换,目的就是将方差和均值拉的比较好,使得变化不那么剧烈。对全连接层,对于每一个特征做一个标量的均值,标量的方差,区别在于不是仅仅对数据做操作,而是对参数也作用。对卷积层,作用在通道层,卷积的多通道相当于像素的特征。
2023-08-24 09:08:03
163
原创 编程题练习@8-23
导演在组织进行大运会开幕式的排练,其中一个环节是需要参演人员围成一个环形。小明用计算机随机生成了N个正整数,他希望从这N个数中选取若干个数,使得它们的和等于M。
2023-08-23 22:03:19
544
原创 《动手学深度学习》-21卷积层里的多输入多输出通道
输出通道数是卷积层的超参数。每个输入通道有独立的二维卷积核,所有通道结果相加得到一个输出通道结果。每个输出通道有独立的三维卷积核。
2023-08-23 17:41:08
204
原创 《动手学深度学习》-19卷积层
按照MLP的思想要为每一个卷积核大小的像素区域分配一个卷积核,而添加平移不变性和局部性,使得卷积核可以进行移动(模式/识别器不变),同时降低了参数量。
2023-08-23 15:35:37
181
原创 《动手学深度学习》-68Transformer
Transformer:缩放点积注意力是没有学习参数的,所以先把V、K、Q投影到线性层,在经过多个注意力计算,最后再拼接在一起做一次投影,总的来说效果上比较像卷积的多通道。Transformer选择8个头,每个头投影到512/8=64维度上。
2023-08-15 20:22:36
239
原创 《动手学深度学习》-67自注意力
在深度学习中,经常使用卷积神经网络(CNN)或循环神经网络(RNN)对序列进行编码。有了注意力机制之后,我们将词元序列输入注意力汇聚中,以便同一组次元同时充当查询、键和值。由于查询、键和值来自于同一组输入,因此被称为**自注意力**(`self-attention`)。
2023-08-04 19:01:27
211
原创 [比赛简介]Feedback Prize - Predicting Effective Arguments
本次比赛的目标是将学生写作中的论证元素分类为“有效(`effective`)”、“充分(`adequate`)”或“无效(`ineffective`)”。您将创建一个基于代表美国 6-12 年级人口的数据进行训练的模型,以最大程度地减少偏差。从本次比赛中得出的模型将有助于为学生获得有关议论文写作的更多反馈铺平道路。通过自动指导,学生可以完成更多作业,并最终成为更自信、更熟练的作家。
2023-08-04 12:17:16
206
原创 [比赛简介]OTTO – Multi-Objective Recommender System
本次竞赛的目标是预测电子商务点击、购物车添加和订单。您将根据用户会话中的先前事件构建多目标推荐系统。您的工作将有助于改善所有相关人员的购物体验。客户将收到更多量身定制的建议,而在线零售商可能会增加销售额。
2023-08-04 10:31:27
490
原创 《动手学深度学习》-65注意力分数
高斯核中的指数部分可以视为注意力评分函数(attention scoring function),简称评分函数,然后把这个函数的输出结果输入softmax函数中进行运算,将得到与键对应的值的概率分布(即注意力权重)。最后注意力汇聚的输出就是基于这些注意力权重的值的加权和。
2023-08-03 23:59:56
184
原创 《动手学深度学习》-64注意力机制
因此“是否包含自主性提示”将注意力机制与全连接层或汇聚层区分开来。在注意力机制的背景下,自主性提示被称为**查询**(`query`)。给定任何查询,注意力机制通过**注意力汇聚**(`attention pooling`)将选择引导至**感官输入**(`sensory input`),例如中间特征表示。在注意力机制中,这些感官输入被称为**值**(`value`)。更通俗的讲,每个值都与一个**键**(`key`)匹配,这可以想象为感官输入的非自主性提示。
2023-08-03 17:08:13
246
原创 编程题练习@8-2
在一些大学里,学生发表论文的话会有一定的奖学金加分。另外,对于一篇论文,其作者的顺序不同,加分也不相同。在某一棵以1为根的有根树上,有两个节点a,b上各存在一只毛毛虫。这两只毛毛虫只会往深度更大的点前进,当毛毛虫走到叶子节点时会停下。
2023-08-02 22:47:11
2455
11
原创 论文阅读《ICDE2023:Relational Message Passing for Fully Inductive Knowledge Graph Completion》
本文中,作者提出了一种名为RMPI的新方法,它使用一种新的关系消息传递网络来进行完全归纳KGC。它直接在关系之间传递消息,以充分利用用于子图推理的关系模式,使用图转换、图修剪、关系感知的邻域注意力、寻址空子图等新技术,并可以利用KG的本体模式中定义的关系语义。
2023-07-27 16:17:50
1836
原创 论文阅读《ESSWC2018:Modeling Relational Data with Graph Convolutional Networks》
本文引入了关系图卷积网络(R-GCNs),并将其应用于两个标准的知识库完成任务: 链接预测和实体分类。通过使用GNN编码器模型来丰富用于链接预测的因子分解模型DistMult,可以显著改善链接预测的结果。R-GCN可以视为是一个自动编码器,产生实体潜在特征的表示。R-GCN是首次将GCN用于关系数据建模。
2023-07-26 09:39:35
708
原创 论文阅读《AAAI2021:Topology-Aware Correlations Between Relations for Inductive Link Prediction in Knowle》
本文中,提出了一种新的归纳推理方法,即TACT,它可以有效地利用知识图中关系之间的拓扑感知相关性。具体来说,TACT从相关模式和相关系数两个方面对语义相关关系进行建模。将所有关系对分为7个类别不同的拓扑结构对应不同的关联模式。然后,将原始知识图转换为关系相关图(Relational Correlation graph, RCG),其中节点表示关系,边缘表示原始知识图中任意两个关系之间的关联模式。在RCG的基础上,提出了一种关联网络(RCN)来学习不同模式的相关系数,用于归纳链路预测。
2023-07-21 15:20:05
242
原创 论文阅读《2020ICML:Inductive Relation Prediction by Subgraph Reasoning》
知识图谱中关系预测的主要范式涉及实体和关系的潜在表示(即嵌入)的学习和操作。然而,这些基于嵌入的方法并没有显式地捕获知识图谱背后的组合逻辑规则,并且它们仅限于直推式设置,在直推式设置中,实体的全部集合必须在训练期间已知。本文提出了一种基于图神经网络的关系预测框架GraIL,它在局部子图结构上进行推理,并具有很强的归纳偏差来学习实体独立的关系语义。
2023-07-21 15:11:08
926
原创 论文阅读《2022WWW:Rethinking Graph Convolutional Networks in Knowledge Graph Completion》
KCN在建模图结构方面很有效。基于GCN的KGC模型通常使用编码器-解码器框架,GCNs和KGE模型分别充当编码器和解码器。许多基于GCN的KGC模型虽然引入了额外的计算复杂度,但未能超越最先进的KGE模型?作者发现GCNs中的图结构并没有对KGC的性能有显著提升,相反实体表示的转换为性能带来提升。本文提出的LTE-KGE模型带来与KGE模型相似的性能提升同时避免了GCN聚合中繁重计算负载。
2023-07-21 14:31:19
235
原创 论文阅读《2022ICLR:Are Message Passing Neural Networks Really Helpful for Knowledge Graph Completion? 》
基于 GNN 的模型带来的改进归因于增强的信息聚合过程。因此目前关于为 KGs 开发更好的 GNN 的研究仍然主要集中在推进信息聚合过程。作者发现:基于 GNN 的模型中的信息聚合过程并不是所报告的KGC性能改进的最关键原因。具体来说,作者用简单的多层感知器(MLPs)替换了几个最先进的以 KGC 为重点的GNN模型中的信息聚合过程,并在各种数据集和实现中实现了与其相应的基于 GNN 的模型相当的性能。结果表明,评分和损失函数确实有更强的影响,而信息聚合过程几乎没有贡献。
2023-07-21 14:03:04
844
原创 [比赛简介]CommonLit - Evaluate Student Summaries
kaggle新赛-CommonLit - Evaluate Student Summaries简介
2023-07-14 13:24:43
489
原创 女孩与花田-InsCode Stable Diffusion 美图活动一期
女孩与花田-InsCode Stable Diffusion 美图活动一期
2023-07-14 11:57:35
294
Kaggle中的比赛从什么时候开始可以提交5次
2023-05-31
TA创建的收藏夹 TA关注的收藏夹
TA关注的人