自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Jiawen9的博客

机器学习、深度学习、NLP、数据挖掘

  • 博客(230)
  • 资源 (3)
  • 收藏
  • 关注

原创 机器学习算法实现(基于numpy)

这篇博客是将笔者边学边刷《机器学习公式推导与代码实现》的模型跟代码记录下来,部分地方结合自己的思考对原作者的代码有一定的改动,这些博客主要是动手去实现一些模型,感受机器学习各个模型能解决的问题以及收敛后的效果,所以对相关理论没有过于深入。

2023-07-28 13:28:22 321

原创 笔试算法通关(python实现)

这篇博客是将笔者边学边刷《算法通关之路》的题目跟代码记录下来,也参考了leetcode的官方题解,结合自己的思考对原作者的代码有一定的改动,所有题目都是来自于leetcode,几乎涵盖了leetcode和我们求职笔试中的全部题目类型。

2023-07-28 13:06:50 395

原创 手撕考研数据结构(代码汇总篇)

手撕考研数据结构(线性表、树、图、查找排序、算法),全部由c++实现

2023-06-02 00:09:21 5842 2

原创 《算法通关之路》chapter17一些通用解题模板

chapter17一些通用解题模板:二分法(三种)、回溯法、并查集、BFS、滑动窗口(三种)、数学(判断素数、最大公约数、最小公倍数)

2023-10-07 17:03:17 453

原创 《算法通关之路》chapter19解题技巧和面试技巧

chapter19-解题技巧与面试技巧:转化为全零矩阵的最少反转次数、矩阵置零、顺次数、单词接龙、统计全为 1 的正方形子矩阵、子串的最大出现次数、生命游戏

2023-10-06 17:00:36 414

原创 《算法通关之路》-chapter18融会贯通

chapter18-融会贯通:轮转数组、旋转链表、编辑距离、数组中的第K个最大元素、数据流中的第 K 大元素、二叉搜索树中第K小的元素、有序矩阵中第 K 小的元素、乘法表中第k小的数

2023-09-27 17:08:13 403

原创 编程题练习@9-13

同一局域网内的设备可以相互发现,具备直连路由的两个设备可以互通。假定设备A和B互通,B和C互通,那么可以将B作为中心设备,通过多跳路由策略使设备A和C互通。运营商建设基站时需要关注很多因素,其中:基站的信号覆盖范围、建设成本就是要考虑的部分因素。现有多个基站候选点,我们需要决策在哪些地点建设基站,要求:在尽可能多地覆盖服务地域的前提下尽可能少地建设基站。

2023-09-13 20:34:25 612 2

原创 编程题练习@9-7

一个有序的整数列表示方式通常使用逗号隔开。如果序列中的几个整数是连续递增 1 时可以使用数字范围的方式表达,通常用[-] 符隔开。给定某只股票连续N天的价格列表stockPrices,其中stockPrices表示股票某天的价格请生成一个新列表,对应位置输出为:要想等到股票价格上涨,至少需要等待的天数,如果股票价格不上涨,对应位置输出为0。给定一个 m*n 的整数矩阵作为地图,矩阵数值为地形高度:中庸行者选择地图中的任意一点作为起点,尝试往上、下、左、右四个相邻格子移动移动时有如下约束。

2023-09-07 16:25:45 589 1

原创 编程题练习@9-5

解析输入的字符串数组,提取出字符串中的时间戳信息,并且将字符串按照时间戳排序后,输出到控制台。有一个很长的英文单词串,里面全是小写字母,请你统计一下里面长度大于等于k的单词一共出现了多少次,然后输出出现频率最高的那个单词。给定一个二叉树的根节点root,该树的节点值都在数字0-9之间,每一条从根节点到叶子节点的路径都可以用一个数字表示。

2023-09-05 23:04:06 748 2

原创 《动手学深度学习》-57长短期记忆网络LSTM

长期以来,隐变量模型存在长期信息保存和短期输入缺失的问题。解决这一问题的最早方法之一是长短期记忆网络。

2023-08-30 22:40:44 223

原创 《自然语言处理》chapter7-预训练语言模型

自然语言处理的核心在于如何更好地建模语言。广义上的预训练语言模型可以泛指提前经过大规模数据训练的语言模型,包括早期的Word2vec、GloVe为代表的静态词向量模型,以及基于上下文建模的CoVe、ELMo等动态词向量模型。在2018年,以GPT和BERT为代表的基于深层Transformer的表示模型出现后,预训练语言模型这个词才真正被大家广泛熟知。

2023-08-30 12:11:23 369

原创 《动手学深度学习》-55循环神经网络

简单来说循环神经网络RNN就是在MLP中加了一项,使它可以与前一个时间的h_{t-1}发生关系。时序信息存储在W_{hh}。

2023-08-30 12:08:38 179

原创 编程题练习@8-29

最近小强很喜欢玩一款勇士打怪的游戏,勇者和怪物都有一个属性:能力值。当勇者遭遇-个怪物时,战斗方式如下:如果勇者的能力值不低于怪物的能力值,勇者胜。否则勇者败。小红计划在m天刷n道题,第i天计划刷a_i题。

2023-08-29 20:26:31 308

原创 《算法通关之路》-chapter16一些有趣的题目

chapter16一些有趣的题目:多数元素 II、柱状图中最大的矩形、一周中的第几天、水壶问题、可怜的小猪

2023-08-27 21:12:53 173

原创 编程题练习@8-26

为了使识别出来的文本序列和标准的文本序列之间保持一致,需要进行替换,删除,或者插入某些字。 这些插入,替换,删除的字的总个数,除以标准的文本词序列中字的个数的百分比,即为WER。输入一个2行n列(1≤n≤1e5)的矩阵a(1≤a[i][j]≤1e9)。你需要从矩阵中选择一些数,要求任意两数不能左右相邻,也不能上下相邻。求所选数字之和的最大值。

2023-08-27 15:48:56 316

原创 《动手学深度学习》-28批量归一化

批量归一化是一个线性变换,目的就是将方差和均值拉的比较好,使得变化不那么剧烈。对全连接层,对于每一个特征做一个标量的均值,标量的方差,区别在于不是仅仅对数据做操作,而是对参数也作用。对卷积层,作用在通道层,卷积的多通道相当于像素的特征。

2023-08-24 09:08:03 163

原创 编程题练习@8-23

导演在组织进行大运会开幕式的排练,其中一个环节是需要参演人员围成一个环形。小明用计算机随机生成了N个正整数,他希望从这N个数中选取若干个数,使得它们的和等于M。

2023-08-23 22:03:19 544

原创 《动手学深度学习》-21卷积层里的多输入多输出通道

输出通道数是卷积层的超参数。每个输入通道有独立的二维卷积核,所有通道结果相加得到一个输出通道结果。每个输出通道有独立的三维卷积核。

2023-08-23 17:41:08 204

原创 《动手学深度学习》-20卷积层里的填充和步幅

填充是想把模型做深时所用的办法,步幅可以成倍的减小输出形状。

2023-08-23 16:26:47 190

原创 《动手学深度学习》-19卷积层

按照MLP的思想要为每一个卷积核大小的像素区域分配一个卷积核,而添加平移不变性和局部性,使得卷积核可以进行移动(模式/识别器不变),同时降低了参数量。

2023-08-23 15:35:37 181

原创 编程题练习@8-20

题目:游戏内有需求,要把图片的像素沿着横轴做垂直翻转,一个像素内的数据由四个数字构成。

2023-08-20 11:20:48 752

原创 《动手学深度学习》-68Transformer

Transformer:缩放点积注意力是没有学习参数的,所以先把V、K、Q投影到线性层,在经过多个注意力计算,最后再拼接在一起做一次投影,总的来说效果上比较像卷积的多通道。Transformer选择8个头,每个头投影到512/8=64维度上。

2023-08-15 20:22:36 239

原创 《动手学深度学习》-67自注意力

在深度学习中,经常使用卷积神经网络(CNN)或循环神经网络(RNN)对序列进行编码。有了注意力机制之后,我们将词元序列输入注意力汇聚中,以便同一组次元同时充当查询、键和值。由于查询、键和值来自于同一组输入,因此被称为**自注意力**(`self-attention`)。

2023-08-04 19:01:27 211

原创 [比赛简介]Feedback Prize - Predicting Effective Arguments

本次比赛的目标是将学生写作中的论证元素分类为“有效(`effective`)”、“充分(`adequate`)”或“无效(`ineffective`)”。您将创建一个基于代表美国 6-12 年级人口的数据进行训练的模型,以最大程度地减少偏差。从本次比赛中得出的模型将有助于为学生获得有关议论文写作的更多反馈铺平道路。通过自动指导,学生可以完成更多作业,并最终成为更自信、更熟练的作家。

2023-08-04 12:17:16 206

原创 [比赛简介]OTTO – Multi-Objective Recommender System

本次竞赛的目标是预测电子商务点击、购物车添加和订单。您将根据用户会话中的先前事件构建多目标推荐系统。您的工作将有助于改善所有相关人员的购物体验。客户将收到更多量身定制的建议,而在线零售商可能会增加销售额。

2023-08-04 10:31:27 490

原创 《动手学深度学习》-65注意力分数

高斯核中的指数部分可以视为注意力评分函数(attention scoring function),简称评分函数,然后把这个函数的输出结果输入softmax函数中进行运算,将得到与键对应的值的概率分布(即注意力权重)。最后注意力汇聚的输出就是基于这些注意力权重的值的加权和。

2023-08-03 23:59:56 184

原创 《动手学深度学习》-64注意力机制

因此“是否包含自主性提示”将注意力机制与全连接层或汇聚层区分开来。在注意力机制的背景下,自主性提示被称为**查询**(`query`)。给定任何查询,注意力机制通过**注意力汇聚**(`attention pooling`)将选择引导至**感官输入**(`sensory input`),例如中间特征表示。在注意力机制中,这些感官输入被称为**值**(`value`)。更通俗的讲,每个值都与一个**键**(`key`)匹配,这可以想象为感官输入的非自主性提示。

2023-08-03 17:08:13 246

原创 编程题练习@8-2

在一些大学里,学生发表论文的话会有一定的奖学金加分。另外,对于一篇论文,其作者的顺序不同,加分也不相同。在某一棵以1为根的有根树上,有两个节点a,b上各存在一只毛毛虫。这两只毛毛虫只会往深度更大的点前进,当毛毛虫走到叶子节点时会停下。

2023-08-02 22:47:11 2455 11

原创 《机器学习公式推导与代码实现》chapter22-EM算法

EM算法简介、numpy编程EM算法实现三硬币问题

2023-07-27 22:33:31 184

原创 论文阅读《ICDE2023:Relational Message Passing for Fully Inductive Knowledge Graph Completion》

本文中,作者提出了一种名为RMPI的新方法,它使用一种新的关系消息传递网络来进行完全归纳KGC。它直接在关系之间传递消息,以充分利用用于子图推理的关系模式,使用图转换、图修剪、关系感知的邻域注意力、寻址空子图等新技术,并可以利用KG的本体模式中定义的关系语义。

2023-07-27 16:17:50 1836

原创 论文阅读《ESSWC2018:Modeling Relational Data with Graph Convolutional Networks》

本文引入了关系图卷积网络(R-GCNs),并将其应用于两个标准的知识库完成任务: 链接预测和实体分类。通过使用GNN编码器模型来丰富用于链接预测的因子分解模型DistMult,可以显著改善链接预测的结果。R-GCN可以视为是一个自动编码器,产生实体潜在特征的表示。R-GCN是首次将GCN用于关系数据建模。

2023-07-26 09:39:35 708

原创 《算法通关之路》-chapter15回溯法

回溯法合集:全排列、全排列 II、组合总和、组合总和 II、子集、子集 II

2023-07-25 19:35:06 176

原创 论文阅读《AAAI2021:Topology-Aware Correlations Between Relations for Inductive Link Prediction in Knowle》

本文中,提出了一种新的归纳推理方法,即TACT,它可以有效地利用知识图中关系之间的拓扑感知相关性。具体来说,TACT从相关模式和相关系数两个方面对语义相关关系进行建模。将所有关系对分为7个类别不同的拓扑结构对应不同的关联模式。然后,将原始知识图转换为关系相关图(Relational Correlation graph, RCG),其中节点表示关系,边缘表示原始知识图中任意两个关系之间的关联模式。在RCG的基础上,提出了一种关联网络(RCN)来学习不同模式的相关系数,用于归纳链路预测。

2023-07-21 15:20:05 242

原创 论文阅读《2020ICML:Inductive Relation Prediction by Subgraph Reasoning》

知识图谱中关系预测的主要范式涉及实体和关系的潜在表示(即嵌入)的学习和操作。然而,这些基于嵌入的方法并没有显式地捕获知识图谱背后的组合逻辑规则,并且它们仅限于直推式设置,在直推式设置中,实体的全部集合必须在训练期间已知。本文提出了一种基于图神经网络的关系预测框架GraIL,它在局部子图结构上进行推理,并具有很强的归纳偏差来学习实体独立的关系语义。

2023-07-21 15:11:08 926

原创 论文阅读《2022WWW:Rethinking Graph Convolutional Networks in Knowledge Graph Completion》

KCN在建模图结构方面很有效。基于GCN的KGC模型通常使用编码器-解码器框架,GCNs和KGE模型分别充当编码器和解码器。许多基于GCN的KGC模型虽然引入了额外的计算复杂度,但未能超越最先进的KGE模型?作者发现GCNs中的图结构并没有对KGC的性能有显著提升,相反实体表示的转换为性能带来提升。本文提出的LTE-KGE模型带来与KGE模型相似的性能提升同时避免了GCN聚合中繁重计算负载。

2023-07-21 14:31:19 235

原创 论文阅读《2022ICLR:Are Message Passing Neural Networks Really Helpful for Knowledge Graph Completion? 》

基于 GNN 的模型带来的改进归因于增强的信息聚合过程。因此目前关于为 KGs 开发更好的 GNN 的研究仍然主要集中在推进信息聚合过程。作者发现:基于 GNN 的模型中的信息聚合过程并不是所报告的KGC性能改进的最关键原因。具体来说,作者用简单的多层感知器(MLPs)替换了几个最先进的以 KGC 为重点的GNN模型中的信息聚合过程,并在各种数据集和实现中实现了与其相应的基于 GNN 的模型相当的性能。结果表明,评分和损失函数确实有更强的影响,而信息聚合过程几乎没有贡献。

2023-07-21 14:03:04 844

原创 [比赛简介]Kaggle - LLM Science Exam

kaggle新赛简介-Kaggle - LLM Science Exam

2023-07-16 15:41:16 873

原创 [比赛简介]CommonLit - Evaluate Student Summaries

kaggle新赛-CommonLit - Evaluate Student Summaries简介

2023-07-14 13:24:43 489

原创 女孩与花田-InsCode Stable Diffusion 美图活动一期

女孩与花田-InsCode Stable Diffusion 美图活动一期

2023-07-14 11:57:35 294

原创 《算法通关之路》-chapter14贪心法

贪心法:分发饼干、跳跃游戏、任务调度器、分发糖果、无重叠区间

2023-07-13 19:57:55 169

西大851软件工程13-18试题

官方公布的试题,博主的付费专栏有13-20的试题答案解析

2021-01-03

数据集-用做回归.csv

可用做深度学习测试的一维线性回归数据集。数组大小247*900,实验数据取自真实场景,回归精度好。9种特征,每种特征有100条数据。

2020-06-20

数据集-用做分类.csv

可用做深度学习测试的一维多分类数据集,取自真实实验场景。数组大小247*900。900条特征数据,9种类别,分类效果很好。

2020-06-20

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除