诸葛思颖-优快云博客

原创阅读论文笔记《Translating Embeddings for Modeling Multi-relational Data》

TransE 模型最大的优点就是在链接预测任务中表现极为优秀。它不仅能够准确地预测出实体之间的关系，而且在处理大规模数据集时，具有较高的效率和可扩展性。同时，模型的简单性使得它能够很好地泛化，在学习新关系时速度快，不需要对已经训练好的嵌入进行复杂的修改。

2025-02-19 21:38:45 1065

原创阅读论文笔记《Efficient Estimation of Word Representations in Vector Space》

这篇文章写于2013年，对理解 word2vec 的发展历程挺有帮助。本文仅适用于 Word2Vect 的复盘。

2025-02-15 14:06:55 1373

原创【总结报告】基于归纳知识图嵌入的元知识转移（Meta-Knowledge Transfer for Inductive Knowledge Graph Embedding

本文对论文 Meta-Knowledge Transfer for Inductive Knowledge Graph Embedding 做了简单的总结，主要总结了元知识的建模和获取这两部分。

2024-10-30 23:20:38 940

转载终于有人把正向代理和反向代理解释的明明白白了！

用漫画的形式讲解了正向代理和反向代理的概念和好处，以及两者的对比。

2024-10-28 19:36:45 223 1

原创 Python 基础：使用 unittest 模块进行代码测试

在本文中，我们学习了：如何使用模块unittest中的工具来为函数和类编写测试，如何编写继承的类，以及如何编写测试方法，以核实函数和类的行为符合预期；如何使用方法setUp()来根据类高效地创建实例并设置其属性，以便在类的所有测试方法中使用。

2024-06-27 20:29:05 942 1

用户关闭程序时，往往需要保存用户提供的信息，一种简单的方式是使用（JavaScript Object Notation）模块。这个模块最初是为 JavaScript 开发的，但随后成了一种常见格式，被包括 Python 在内的众多语言采用。这个模块让我们能够将简单的 Python 数据结构转储到文件中，并在程序再次运行时加载该文件中的数据。我们还可以使用 json 在 Python 程序之间分享数据。

2024-06-27 18:08:58 574

原创 Transformer 结构

这个部分类似于我们最开始讲的端到端模型中的注意力机制，它是为了帮助 Decoder 端每一步的生成都可以关注和整合每个 Encoder 端每个位置的信息。和 Encoder block 一样，这样的 Decoder block 也可以进行堆叠，如上图我右方标记了“Nx”。在原论文中，Decoder block 也是一共堆叠了 6 层。

2024-06-27 14:38:23 1536

原创 Python 基础：异常

异常是程序运行时可能遇到的非预期情况，如除以零或文件未找到等。使用try-except代码块可以捕获并处理这些异常，防止程序因错误而中断而代码块则进一步允许在无异常发生时执行特定代码。静默失败是指程序在遇到错误时不显示任何错误信息，继续执行。合理使用异常处理机制，可以提高程序的健壮性和用户体验。

2024-06-20 20:00:06 1052

原创 Python 基础：文件

虽然 open() 和 open() 搭配使用也可以，但是并非在任何情况下都能轻松确定关闭文件的恰当时机。如果非要在 with代码块外访问的话，可以先在 with 代码块内将文件的各行存储在一个。如果指定的文件不存在，Python 将创建一个空文件。为此，我们可以一次性读取文件的全部内容，也可以以每次一行的方式逐步读取。让我们只管打开文件，并在需要时使用它，Python 自会在合适的时候。如果要给文件添加内容，而不是覆盖原有的内容，可以以附加模式（要以每次一行的方式检查文件，可对文件对象使用。

2024-06-19 20:04:04 1053

原创 BPE (Byte-Pair Encoding) Tokenization

我们其实也可以直接将每个单词作为一个单元来进行后续的训练，但是这样当我们处理新单词的时候就没有办法给出一个合适的表示，可能许多没有见过的所有的字都公用同一个表示。将文本数据集中的所有实例中的选定字符对替换为新创建的词元，从 step 2 进行重复，直到达到预定的词汇表大小或无法进一步合并字符对。然而，作为真人的我们第一次看到生词的时候，并不是对它一无所知的，我们可以通过生词的组成来进行猜测意思。最终生成的词汇表包含了所有 token，包括原始的字符和合并后的 token。如果我们要处理一个没有见过的单词。

2024-06-19 13:45:18 1165

原创 Python 基础：类

定义一个类非常简单，只需要使用class关键字，后面跟着类名（首字母大写），然后是冒号。类体中的代码块定义了类的属性和方法。class Car:return f"在上面的例子中，Car是一个类，它有三个属性：makemodel和year。__init__（开头结尾都有两个下划线）方法是一个特殊的方法，被称为类的构造器，它在创建类的新实例时自动调用。在这个方法中，形参self必不可少。

2024-06-16 20:26:21 1914 1

原创注意力机制

给定一个查询向量（query vector）和一组值向量（value vectors），注意力机制根据query计算value的加权和。计算相关性给定一个查询向量（query vector）和一组值向量（value vectors），首先计算query与每个value之间的相关性。通常可以使用点积、内积、余弦相似度等方法来度量相关性。计算结果可以表示为一个得分向量，其中每个得分表示query与对应value的相关性。计算注意力权重通过对得分向量进行归一化，可以得到value。

2024-06-16 11:10:41 724

原创 Seq2seq、编码器&解码器神经网络

Seq2seq（Sequence to Sequence）的作用是将一种序列转换为另一种序列，比如将英文句子翻译为中文句子，或者将一篇文章进行概括。一种解决 Seq2seq 问题的方法是编码器-解码器模型。下面我们以英语句子翻译为西班牙句子为例来进行介绍。

2024-06-10 17:09:20 1233

原创神经网络基础

接下来详细讲一下梯度的计算。对于一个具有 1 个输出和。

2024-06-03 14:33:31 3289

原创大模型基础

从GPT-3 (1750亿个参数) 中，我们可以看到大规模预训练语言模型中的丰富知识。之所以选择预训练语言模型，是因为之所以选择预训练语言模型在 GLUE 上的结果优于人类的表现，这反映了预训练语言模型的语言理解能力。基于以上的特点，使用预训练的语言模型现在是各种 NLP 任务的标准，与语言模型相关的研究也在 2018 年迅速发展了起来。在GPT-3中，许多复杂的任务，如编写代码和下棋，可以转化为基于预先训练的语言模型的动作序列生成。第二步：然后，我们可以使用特定任务的训练数据对预先训练的语言模型进行。

2024-05-05 11:45:38 445

原创自然语言处理基础

自然语言处理（Natural Language Processing，简称NLP）是计算机科学与人工智能领域的一个重要研究方向，目的是让计算机能够理解、解析、生成和处理人类的自然语言。自然语言处理有着非常重要的意义，其一，我们认为人类语言是人类智能一个非常重要的体现；其二，NLP 是人工智能能够通过图灵测试的一个非常重要的工具。其中图灵测试（最开始的名字是 imitation game）是判断机器是否智能的一个非常重要的手段。

2024-05-03 18:56:09 1307 1

原创 24二战上岸北邮计算机经验贴（初试+复试超详细）

我认为有直系学长学姐领路真的会少走很多弯路。我现在写下这个经验贴呢，也希望帮助到后面备考北邮的学子！也欢迎大家加入北邮计算机群进行讨论学习，里面都是一些同样备考的同学，还有很多在读北邮热心的学长学姐，会分享很多重要的北邮计算机考情资讯以及复试要注意的东西。

2024-04-25 16:27:42 5337

原创驾照科目一专项总结

爆炸物品、超限的不可解体的物品。（应急车道要“留”下来）30%以上未达到百50%

2024-04-09 11:24:39 988 1

原创 SiteSpace 使用方法笔记

CiteSpace 是一个用于可视化和分析科学文献的工具。它可以从科学文献库中提取关键词、作者、机构和引用关系等信息，并将其可视化为图形网络。一些使用案例。

2024-04-07 23:50:38 1295

原创《编译原理与技术》知识点、例题整理——2 形式语言与自动机基础

（掌握）

2024-01-26 13:51:16 1405 1

原创红黑树插入流程图

红黑树插入，一张流程图搞定

2023-04-11 13:57:47 197

原创网络重要节点排序方法

重要节点排序方法

2023-02-20 22:26:07 1795

原创 CSP-《ISBN号码》-感悟

ISBN号码

2023-02-14 16:34:39 180

原创 CSP-《最大的矩形》-感悟

最大的矩形

2023-02-13 22:26:42 155

原创 CSP-《有趣的数》-感悟

有趣的数

2023-02-13 13:53:18 378

原创 CSP-《I‘m stuck!》-感悟

I’m stuck!

2023-02-12 22:26:24 366

原创虚拟存储器

虚拟存储器：页式、段式、段页式

2022-11-17 19:48:01 184

原创求解全微分的原函数（二元）

求解全微分方程的三个方法：1、偏积分2、凑微分3、线积分

2022-09-05 09:17:17 10317 3

原创第四章：指令系统

指令格式指令的寻址方式程序的机器级代码表示CISC 和 DISC

2022-08-26 15:03:07 220

原创第三章：存储系统

存储器概述主存储器主存储器与CPU的连接外部存储器高速缓冲存储器虚拟存储器

2022-08-23 11:14:12 450

原创第二章：数据的表示和运算

1、浮点数的表示2、IEEE 754 规范3、浮点数的运算

2022-08-17 22:25:50 989

原创密码编码学与网络安全期末考试笔记

迎接期末考

2022-06-17 15:30:25 3258

原创问题与解决：用 jQuery Ajax 发送请求，后端获取 session 为空

最近在做错题集的 web 开发课程设计，根据以往的经验前端和后端的数据我大部分都在用 session 进行传输。最近刚学习并运用了 Ajax 技术，当我像以前一样在后端更新session时，发现前端没有获取新的session数据，由此我打算认真来学习一下session，顺便将已有的项目整理一下。希望路过的大佬们可以指点一二，同时也希望给遇到同样困惑的小伙伴提供帮助🙂

2022-05-30 18:26:52 1895

转载拉格朗日乘数法计算技巧

拉格朗日乘数法用来解决多元函数在约束条件下的极值，在计算的过程中，不免会有些繁琐，甚至出错，这里提及了6中技巧用来简化计算

2022-05-29 10:50:05 10906

原创由参数方程所确定的函数的导数

目录一、参数方程1、背景2、定义二、参数方程所确定的函数的导数一、参数方程1、背景上图表示的是当忽略空气阻力时，抛射体的运动轨迹。其中 v1v_1v1 和 v2v_2v2 分别表示抛射体的水平初速度和铅直初速度。由高中物理知识，我们可以写出抛射体在运动过程中的运动轨迹表达式：{x=v1ty=v2t−12gt2\left\{ \begin{array}{l} x=v_1t\\ y=v_2t-\frac{1}{2}gt^2\\\end{array} \right. {x=v1ty=v2

2022-04-06 16:09:38 3994

原创泰勒公式及泰勒级数

简要讲解泰勒公式的概念以及与泰勒级数的联系

2022-04-01 12:30:47 3986

原创概率论——期望个数统计

一、题目描述某互联网公司一年一度的春招开始了，一共有 n 名面试者入选。每名面试者都会提交一份简历，公司会根据提供的简历资料产生一个预估的能力值，数值越大代表越有可能通过面试。小 A 和小 B 负责审核面试者，他们均有所有面试者的简历，并且将各自根据面试者能力值从大到小的顺序浏览。由于简历事先被打乱过，能力值相同的简历的出现顺序是从它们的全排列中等可能地取一个。现在给定 n 名面试者的能力值 scores，设 X 代表小 A 和小 B 的浏览顺序中出现在同一位置的简历数，求 X 的期望。提示：离散的非

2022-03-29 17:00:30 519

TA关注的人

计算机考研初试资料（英语一）

彩虹模拟展示+制作方法+素材.zip

2020第九届数学中国数学建模国际赛赛前通知和论文模板.zip

包饺子中的数学.pptx

pygame怎么在中文输入法下捕获字母按键？

jeesite导入数据表并初始化数据错误显示BUILD FAILURE