- 博客(78)
- 资源 (3)
- 问答 (1)
- 收藏
- 关注
原创 阅读论文笔记《Translating Embeddings for Modeling Multi-relational Data》
TransE 模型最大的优点就是在链接预测任务中表现极为优秀。它不仅能够准确地预测出实体之间的关系,而且在处理大规模数据集时,具有较高的效率和可扩展性。同时,模型的简单性使得它能够很好地泛化,在学习新关系时速度快,不需要对已经训练好的嵌入进行复杂的修改。
2025-02-19 21:38:45
1065
原创 阅读论文笔记《Efficient Estimation of Word Representations in Vector Space》
这篇文章写于2013年,对理解 word2vec 的发展历程挺有帮助。本文仅适用于 Word2Vect 的复盘。
2025-02-15 14:06:55
1373
原创 【总结报告】基于归纳知识图嵌入的元知识转移(Meta-Knowledge Transfer for Inductive Knowledge Graph Embedding
本文对论文 Meta-Knowledge Transfer for Inductive Knowledge Graph Embedding 做了简单的总结,主要总结了元知识的建模和获取这两部分。
2024-10-30 23:20:38
940
原创 Python 基础:使用 unittest 模块进行代码测试
在本文中,我们学习了:如何使用模块unittest中的工具来为函数和类编写测试,如何编写继承的类,以及如何编写测试方法,以核实函数和类的行为符合预期;如何使用方法setUp()来根据类高效地创建实例并设置其属性,以便在类的所有测试方法中使用。
2024-06-27 20:29:05
942
1
原创 Python 基础:用 json 模块存储和读取数据
用户关闭程序时,往往需要保存用户提供的信息,一种简单的方式是使用(JavaScript Object Notation)模块。这个模块最初是为 JavaScript 开发的,但随后成了一种常见格式,被包括 Python 在内的众多语言采用。这个模块让我们能够将简单的 Python 数据结构转储到文件中,并在程序再次运行时加载该文件中的数据。我们还可以使用 json 在 Python 程序之间分享数据。
2024-06-27 18:08:58
574
原创 Transformer 结构
这个部分类似于我们最开始讲的端到端模型中的注意力机制,它是为了帮助 Decoder 端每一步的生成都可以关注和整合每个 Encoder 端每个位置的信息。和 Encoder block 一样,这样的 Decoder block 也可以进行堆叠,如上图我右方标记了“Nx”。在原论文中,Decoder block 也是一共堆叠了 6 层。
2024-06-27 14:38:23
1536
原创 Python 基础:异常
异常是程序运行时可能遇到的非预期情况,如除以零或文件未找到等。使用try-except代码块可以捕获并处理这些异常,防止程序因错误而中断而代码块则进一步允许在无异常发生时执行特定代码。静默失败是指程序在遇到错误时不显示任何错误信息,继续执行。合理使用异常处理机制,可以提高程序的健壮性和用户体验。
2024-06-20 20:00:06
1052
原创 Python 基础:文件
虽然 open() 和 open() 搭配使用也可以,但是并非在任何情况下都能轻松确定关闭文件的恰当时机。如果非要在 with代码块外访问的话,可以先在 with 代码块内将文件的各行存储在一个。如果指定的文件不存在,Python 将创建一个空文件。为此,我们可以一次性读取文件的全部内容,也可以以每次一行的方式逐步读取。让我们只管打开文件,并在需要时使用它,Python 自会在合适的时候。如果要给文件添加内容,而不是覆盖原有的内容,可以以附加模式(要以每次一行的方式检查文件,可对文件对象使用。
2024-06-19 20:04:04
1053
原创 BPE (Byte-Pair Encoding) Tokenization
我们其实也可以直接将每个单词作为一个单元来进行后续的训练,但是这样当我们处理新单词的时候就没有办法给出一个合适的表示,可能许多没有见过的所有的字都公用同一个表示。将文本数据集中的所有实例中的选定字符对替换为新创建的词元,从 step 2 进行重复,直到达到预定的词汇表大小或无法进一步合并字符对。然而,作为真人的我们第一次看到生词的时候,并不是对它一无所知的,我们可以通过生词的组成来进行猜测意思。最终生成的词汇表包含了所有 token,包括原始的字符和合并后的 token。如果我们要处理一个没有见过的单词。
2024-06-19 13:45:18
1165
原创 Python 基础:类
定义一个类非常简单,只需要使用class关键字,后面跟着类名(首字母大写),然后是冒号。类体中的代码块定义了类的属性和方法。class Car:return f"在上面的例子中,Car是一个类,它有三个属性:makemodel和year。__init__(开头结尾都有两个下划线)方法是一个特殊的方法,被称为类的构造器,它在创建类的新实例时自动调用。在这个方法中,形参self必不可少。
2024-06-16 20:26:21
1914
1
原创 注意力机制
给定一个查询向量(query vector)和一组值向量(value vectors),注意力机制根据query计算value的加权和。计算相关性给定一个查询向量(query vector)和一组值向量(value vectors),首先计算query与每个value之间的相关性。通常可以使用点积、内积、余弦相似度等方法来度量相关性。计算结果可以表示为一个得分向量,其中每个得分表示query与对应value的相关性。计算注意力权重通过对得分向量进行归一化,可以得到value。
2024-06-16 11:10:41
724
原创 Seq2seq、编码器&解码器神经网络
Seq2seq(Sequence to Sequence)的作用是将一种序列转换为另一种序列,比如将英文句子翻译为中文句子,或者将一篇文章进行概括。一种解决 Seq2seq 问题的方法是编码器-解码器模型。下面我们以英语句子翻译为西班牙句子为例来进行介绍。
2024-06-10 17:09:20
1233
原创 大模型基础
从GPT-3 (1750亿个参数) 中,我们可以看到大规模预训练语言模型中的丰富知识。之所以选择预训练语言模型,是因为之所以选择预训练语言模型在 GLUE 上的结果优于人类的表现,这反映了预训练语言模型的语言理解能力。基于以上的特点,使用预训练的语言模型现在是各种 NLP 任务的标准,与语言模型相关的研究也在 2018 年迅速发展了起来。在GPT-3中,许多复杂的任务,如编写代码和下棋,可以转化为基于预先训练的语言模型的动作序列生成。第二步:然后,我们可以使用特定任务的训练数据对预先训练的语言模型进行。
2024-05-05 11:45:38
445
原创 自然语言处理基础
自然语言处理(Natural Language Processing,简称NLP)是计算机科学与人工智能领域的一个重要研究方向,目的是让计算机能够理解、解析、生成和处理人类的自然语言。自然语言处理有着非常重要的意义,其一,我们认为人类语言是人类智能一个非常重要的体现;其二,NLP 是人工智能能够通过图灵测试的一个非常重要的工具。其中图灵测试(最开始的名字是 imitation game)是判断机器是否智能的一个非常重要的手段。
2024-05-03 18:56:09
1307
1
原创 24二战上岸北邮计算机经验贴(初试+复试超详细)
我认为有直系学长学姐领路真的会少走很多弯路。我现在写下这个经验贴呢,也希望帮助到后面备考北邮的学子!也欢迎大家加入北邮计算机群进行讨论学习,里面都是一些同样备考的同学,还有很多在读北邮热心的学长学姐,会分享很多重要的北邮计算机考情资讯以及复试要注意的东西。
2024-04-25 16:27:42
5337
原创 SiteSpace 使用方法笔记
CiteSpace 是一个用于可视化和分析科学文献的工具。它可以从科学文献库中提取关键词、作者、机构和引用关系等信息,并将其可视化为图形网络。一些使用案例。
2024-04-07 23:50:38
1295
原创 问题与解决:用 jQuery Ajax 发送请求,后端获取 session 为空
最近在做错题集的 web 开发课程设计,根据以往的经验前端和后端的数据我大部分都在用 session 进行传输。最近刚学习并运用了 Ajax 技术,当我像以前一样在后端更新session时,发现前端没有获取新的session数据,由此我打算认真来学习一下session,顺便将已有的项目整理一下。希望路过的大佬们可以指点一二,同时也希望给遇到同样困惑的小伙伴提供帮助🙂
2022-05-30 18:26:52
1895
转载 拉格朗日乘数法计算技巧
拉格朗日乘数法用来解决多元函数在约束条件下的极值,在计算的过程中,不免会有些繁琐,甚至出错,这里提及了6中技巧用来简化计算
2022-05-29 10:50:05
10906
原创 由参数方程所确定的函数的导数
目录一、参数方程1、背景2、定义二、参数方程所确定的函数的导数一、参数方程1、背景上图表示的是当忽略空气阻力时,抛射体的运动轨迹。其中 v1v_1v1 和 v2v_2v2 分别表示抛射体的水平初速度和铅直初速度。由高中物理知识,我们可以写出抛射体在运动过程中的运动轨迹表达式:{x=v1ty=v2t−12gt2\left\{ \begin{array}{l} x=v_1t\\ y=v_2t-\frac{1}{2}gt^2\\\end{array} \right. {x=v1ty=v2
2022-04-06 16:09:38
3994
原创 概率论——期望个数统计
一、题目描述某互联网公司一年一度的春招开始了,一共有 n 名面试者入选。每名面试者都会提交一份简历,公司会根据提供的简历资料产生一个预估的能力值,数值越大代表越有可能通过面试。小 A 和小 B 负责审核面试者,他们均有所有面试者的简历,并且将各自根据面试者能力值从大到小的顺序浏览。由于简历事先被打乱过,能力值相同的简历的出现顺序是从它们的全排列中等可能地取一个。现在给定 n 名面试者的能力值 scores,设 X 代表小 A 和小 B 的浏览顺序中出现在同一位置的简历数,求 X 的期望。提示:离散的非
2022-03-29 17:00:30
519
原创 博弈——除数博弈
一、题目描述爱丽丝和鲍勃一起玩游戏,他们轮流行动。爱丽丝先手开局。最初,黑板上有一个数字 n 。在每个玩家的回合,玩家需要执行以下操作:选出任一 x,满足 0 < x < n 且 n % x == 0 。用 n - x 替换黑板上的数字 n 。如果玩家无法执行这些操作,就会输掉游戏。只有在爱丽丝在游戏中取得胜利时才返回 true 。假设两个玩家都以最佳状态参与游戏。二、C语言程序bool divisorGame(int n){ if(n % 2 == 0)
2022-03-29 16:22:10
3573
原创 博弈——Nim 游戏
一、题目描述你和你的朋友,两个人一起玩 Nim 游戏:桌子上有一堆石头。你们轮流进行自己的回合, 你作为先手 。每一回合,轮到的人拿掉 1 - 3 块石头。拿掉最后一块石头的人就是获胜者。假设你们每一步都是最优解。请编写一个函数,来判断你是否可以在给定石头数量为 n 的情况下赢得游戏。如果可以赢,返回 true;否则,返回 false 。二、C语言程序bool canWinNim(int n){ if(n % 4) return true; else
2022-03-29 15:26:07
3540
原创 数论——分式化简
一、题目描述有一个同学在学习分式。他需要将一个连分数化成最简分数,你能帮助他吗?连分数是形如上图的分式。在本题中,所有系数都是大于等于0的整数。输入的cont代表连分数的系数(cont[0]代表上图的a0,以此类推)。返回一个长度为2的数组[n, m],使得连分数的值等于n / m,且n, m最大公约数为1。C语言代码/** * Note: The returned array must be malloced, assume caller calls free(). */// 约分
2022-03-29 11:34:26
230
计算机考研初试资料(英语一)
2024-04-03
pygame怎么在中文输入法下捕获字母按键?
2024-07-05
jeesite导入数据表并初始化数据错误显示BUILD FAILURE
2021-03-28
TA创建的收藏夹 TA关注的收藏夹
TA关注的人