- 博客(47)
- 收藏
- 关注
原创 高级系统架构师-第二章 (上)
计算机系统是指用于数据管理的计算机硬件、软件及网络组成的系统。是按人的要求接受和存储信息,自动进行数据处理和计算,并输出结果信息的机器系统。计算机系统硬件 :中央处理器、存储器、输入设备、输出设备软件:系统软件(操作系统、编译工具。。。应用软件(办公软件、娱乐软件)早期的计算机软件和计算机程序的概念几乎不加区分,后来计算机软件的概念在计算机程序的基础上得到了延伸。计算机软件是指在计算机硬件系统上运行的程序、相关的文档资料和数据的集合系统软件是整个计算机系统配置的不依赖特定应用领域的通用软件。
2024-08-12 11:11:22
735
原创 高级系统架构师 第一章
1 . 系统架构的定义架构是体现在组件中的一个系统的基本组织它们彼此的关系与环境的关系及指导它的设计和发展原则。系统是组织起来完成某一特定功能或某一组功能的组件集。系统这个术语包含了单独的应用程序、传统意义上的系统、子系统、系统之系统、产品线、整个企业及感兴趣的其他集合。系统用于完成其环境中的一个或多个任务。环境或者上下文决定了对这个系统的开发、运作、政策以及会对系统造成其他影响的环境和设置。任务是由一个或者多个利益相关者通过系统 达到一些目标的 系统的一个用途或操作。系统架构。
2024-07-30 15:59:54
893
原创 Commonsense and Named Entity Aware Knowledge Grounded Dialogue Generation
以外部知识为基础,在对话历史背景下解释语言模式,如省写、回指和共同引用,对对话的理解和生成至关重要。在本文中,我们提出了一种新的开放域对话生成模型,该模型有效地利用了大规模的常识知识,以及非结构化的特定主题的知识。我们使用使用协同引用的命名实体感知结构来增强常识知识。我们提出的模型利用一个多跳注意层来保存对话历史和相关知识的最准确和最关键的部分。此外,我们采用了一个常识性的实体增强注意模块。
2023-01-09 19:04:32
526
原创 GENERALIZATION THROUGH MEMORIZATION: NEAREST NEIGHBOR LANGUAGE MODELS
我们引入了kNN-LMs,它扩展了一个预先训练的神经语言模型(LM),通过与k个最近邻(kNN)模型线性插值。最近邻是根据预先训练好的LM嵌入空间中的距离进行计算的,并可以从任何文本集合中提取,包括原始的LM训练数据。定性地说,该模型在预测罕见的模式方面特别有用,如事实知识。总之,这些结果强烈地表明,学习文本序列之间的相似性比预测下一个单词更容易,而最近邻搜索是一种在长尾进行语言建模的有效方法。
2022-11-15 20:23:34
885
原创 Calibrating Factual Knowledge in Pretrained Language Models 事实校准 emnlp2022
在不从头开始进行再训练的情况下,校准plm中的事实知识
2022-10-13 21:41:27
761
原创 Increasing Faithfulness in Knowledge-Grounded Dialogue with Controllable Features
以知识为基础的对话系统旨在传递基于给定源文本中提供的证据的信息。我们讨论了训练生成神经对话模型的挑战,这些系统被控制,以保持对证据的忠诚。现有的数据集包含了一些忠实于选定证据的对话响应,以及更主观的或聊天风格的反应。我们提出了不同的评价措施,通过量化信息量和客观性来理清这些不同类型的响应。在训练时,根据这些评价措施向对话模型提供额外的输入。在生成时,这些额外的输入作为风格控制,鼓励模型生成忠实于所提供的证据的响应。我们还研究了在使用重采样技术解码时使用额外的控制。
2022-10-10 21:52:30
305
原创 Wizard of Wikipedia Knowledge-Powered Conversational agents
背景:开放域对话对话机器人应该展示开放域知识的使用,然后现在很少。目前的seq2seq模型是可以实现对输入的记忆,而不是使用背景知识作为上下文。难点:到目前为止,知识的使用一直被证明是困难的,部分原因是缺乏一个有监督的学习基准任务(benchmark),这个benchmark应该展现出知识渊博的、有明确背景知识的的开放域对话。因此:我们收集并发布了一个大型数据集,其对话直接基于从维基百科中检索到的知识。然后,我们设计了能够检索知识、阅读和调节知识的架构,最后生成自然相应(对话机器人的回答)。
2022-10-10 16:19:20
816
原创 Template-Based Named Entity Recognition Using BART
Template-Based Named Entity Recognition Using BART 场景:Few-Shot Learning + Prompt Learning+PLM(BART)+
2022-06-27 20:50:07
2200
翻译 HPT: Hierarchy-aware Prompt Tuning for Hierarchical Text Classification
HPT Hierarchy-aware Prompt Tuning for Hierarchical Text Classifification
2022-06-07 22:16:42
1119
2
原创 FSL入门综述
FSL 的定义FSL是机器学习的一类问题,它具有以下的特点:• Act as a test bed for human-like learning: To move towards human intelligence, the ability of computer programs to solve FSL problem is vital. 像人一样学习• Reduce data gathering effort and computation cost: FSL can also help to
2021-12-06 21:18:34
2144
1
原创 simpledb环境配置
1.VMtools安装虚拟机-重新安装VMtools是灰色的虚拟机-设置- CD/DVD 选择VMware安装目录里的Linux.ios打开虚拟机,桌面出现VMware右键open将压缩包移动到想要的目录,然后右键extract here,进入vmware-tools-distrib目录,右键open in terminal,sudo ./vmware-install.pl,然后一直回车、yes2.jdk安装(1) 添加ppasudo apt install software-propertie
2021-10-20 16:32:42
249
原创 Ubuntu网络无法连接
1、关掉网络:sudo service network-manager stop 或者 /etc/init.d/networking stop ;2、删除文件:sudo rm /var/lib/NetworkManager/NetworkManager.state3、重启网络:sudo service network-manager start 或者 /etc/init.d/networking start ;4、再次输入:ifconfig,静态ip出现,同时网络可用了。...
2021-10-20 16:24:23
925
原创 最长等比子序列
def MaxLen(str): length=len(str) if length==2: return 2 if length==3: return 2+int(str[1]/str[0]==str[2]/str[1]) longest=[[2 for i in range(length)]]*length print(longest) for j in range(length): for i in ran
2021-10-17 20:16:42
408
原创 phpmyadmin Fatal error: Maximum execution time of 300 seconds exceeded
~xampp\phpMyAdmin\libraries下的config.default里$cfg[‘ExecTimeLimit’] = 300;改成$cfg[‘ExecTimeLimit’] = 0;(不限制)
2021-04-15 14:53:09
569
原创 使用JWPL处理维基百科数据-使用eclipse
环境配置 eclipse+jdk 建议不要下载最新版本,十分容易不兼容,后患无穷 eclipse官网下载又慢又卡,清华镜像:https://mirrors.tuna.tsinghua.edu.cn/eclipse/technology/epp/downloads/release/jdk下载:https://www.oracle.com/java/technologies/javase-downloads.html数据下载:中文:https://dumps.wikimedia.org/zhwiki/.
2021-04-08 12:58:33
481
1
原创 eclipse 镜像
官网下载又慢又容易中断,用户体验极差镜像 https://mirrors.tuna.tsinghua.edu.cn/eclipse/technology/epp/downloads/release/建议不要下最新的,很容易不兼容
2021-04-06 20:31:15
360
原创 命令行目录命令
进入命令行:win+R 输入cmd 回车资源管理器进入想进的文件夹 路径后边直接输入cmd进入D盘 直接D:进入本目录的下一级目录 cd进入指定目录 cd /d
2021-04-06 16:04:25
158
原创 程序员面试金典 面试题 03.02. 栈的最小值
请设计一个栈,除了常规栈支持的pop与push函数以外,还支持min函数,该函数返回栈元素中的最小值。执行push、pop和min操作的时间复杂度必须为O(1)。示例MinStack minStack = new MinStack();minStack.push(-2);minStack.push(0);minStack.push(-3);minStack.getMin(); --> 返回 -3.minStack.pop();minStack.top(); -->
2021-03-20 21:49:31
161
原创 程序员面试金典 面试题 03.01. 三合一
三合一。描述如何只用一个数组来实现三个栈。你应该实现push(stackNum, value)、pop(stackNum)、isEmpty(stackNum)、peek(stackNum)方法。stackNum表示栈下标,value表示压入的值。构造函数会传入一个stackSize参数,代表每个栈的大小。示例1 输入:["TripleInOne", "push", "push", "pop", "pop", "pop", "isEmpty"][[1], [0, 1], [0, 2], [0],
2021-02-02 09:29:43
236
1
原创 程序员面试金典 面试题 02.08. 环路检测
给定一个链表,如果它是有环链表,实现一个算法返回环路的开头节点。如果链表中有某个节点,可以通过连续跟踪 next 指针再次到达,则链表中存在环。 为了表示给定链表中的环,我们使用整数 pos 来表示链表尾连接到链表中的位置(索引从 0 开始)。 如果 pos 是 -1,则在该链表中没有环。注意:pos 不作为参数进行传递,仅仅是为了标识链表的实际情况。示例1输入:head = [3,2,0,-4], pos = 1输出:tail connects to node index 1解释:链表中有一个
2021-01-30 10:24:44
178
原创 程序员面试金典 面试题 02.07. 链表相交
给定两个(单向)链表,判定它们是否相交并返回交点。请注意相交的定义基于节点的引用,而不是基于节点的值。换句话说,如果一个链表的第k个节点与另一个链表的第j个节点是同一节点(引用完全相同),则这两个链表相交。示例输入:intersectVal = 8, listA = [4,1,8,4,5], listB = [5,0,1,8,4,5], skipA = 2, skipB = 3输出:Reference of the node with value = 8输入解释:相交节点的值为 8 (注意,如果两个
2021-01-27 18:53:00
129
原创 程序员面试金典 面试题 02.06. 回文链表
编写一个函数,检查输入的链表是否是回文的。示例1输入: 1->2输出: false 示例2输入: 1->2->2->1输出: true 解答 python3# Definition for singly-linked list.# class ListNode:# def __init__(self, x):# self.val = x# self.next = Noneclass Solution: de
2021-01-27 18:31:55
167
1
原创 程序员面试金典 面试题 02.05. 链表求和
给定两个用链表表示的整数,每个节点包含一个数位。这些数位是反向存放的,也就是个位排在链表首部。编写函数对这两个整数求和,并用链表形式返回结果。示例输入:(7 -> 1 -> 6) + (5 -> 9 -> 2),即617 + 295输出:2 -> 1 -> 9,即912解答 python3# Definition for singly-linked list.# class ListNode:# def __init__(self, x):#
2021-01-27 18:14:29
181
原创 程序员面试金典 面试题 02.04. 分割链表
编写程序以 x 为基准分割链表,使得所有小于 x 的节点排在大于或等于 x 的节点之前。如果链表中包含 x,x 只需出现在小于 x 的元素之后(如下所示)。分割元素 x 只需处于“右半部分”即可,其不需要被置于左右两部分之间。示例输入: head = 3->5->8->5->10->2->1, x = 5输出: 3->1->2->10->5->5->8提示:顺序不一定完全相同解答 python3# Definition f
2021-01-25 15:31:00
127
原创 程序员面试金典 面试题 02.03. 删除中间节点
实现一种算法,删除单向链表中间的某个节点(即不是第一个或最后一个节点),假定你只能访问该节点。示例输入:单向链表a->b->c->d->e->f中的节点c结果:不返回任何数据,但该链表变为a->b->d->e->f解答 python3# Definition for singly-linked list.# class ListNode:# def __init__(self, x):# self.val = x
2021-01-25 14:02:52
102
原创 程序员面试金典 面试题 02.02. 返回倒数第 k 个节点
实现一种算法,找出单向链表中倒数第 k 个节点。返回该节点的值。示例输入: 1->2->3->4->5 和 k = 2输出: 4解答 python3# Definition for singly-linked list.# class ListNode:# def __init__(self, x):# self.val = x# self.next = Noneclass Solution: def kthTo
2021-01-25 13:52:13
201
原创 程序员面试金典 面试题 02.01. 移除重复节点
编写代码,移除未排序链表中的重复节点。保留最开始出现的节点。示例1输入:[1, 2, 3, 3, 2, 1] 输出:[1, 2, 3]示例2输入:[1, 1, 1, 1, 2]输出:[1, 2]解答 python3# Definition for singly-linked list.# class ListNode:# def __init__(self, x):# self.val = x# self.next = Noneclas
2021-01-24 15:39:12
122
原创 程序员面试金典 面试题 01.09. 字符串轮转
字符串轮转。给定两个字符串s1和s2,请编写代码检查s2是否为s1旋转而成(比如,waterbottle是erbottlewat旋转后的字符串)。示例1输入:s1 = "waterbottle", s2 = "erbottlewat" 输出:True示例2输入:s1 = "aa", s2 = "aba" 输出:False解答 python3class Solution: def isFlipedString(self, s1: str, s2: str) -> bool:
2021-01-18 14:37:19
141
原创 程序员面试金典 面试题 01.08. 零矩阵
编写一种算法,若M × N矩阵中某个元素为0,则将其所在的行与列清零。示例1输入:[ [1,1,1], [1,0,1], [1,1,1]]输出:[ [1,0,1], [0,0,0], [1,0,1]]示例2输入:[ [0,1,2,0], [3,4,5,2], [1,3,1,5]]输出:[ [0,0,0,0], [0,4,5,0], [0,3,1,0]]解答 python3class Solution: def setZeroes
2021-01-18 13:59:25
151
原创 程序员面试金典 面试题 01.07. 旋转矩阵
给你一幅由 N × N 矩阵表示的图像,其中每个像素的大小为 4 字节。请你设计一种算法,将图像旋转 90 度。不占用额外内存空间能否做到?示例1给定 matrix = [ [1,2,3], [4,5,6], [7,8,9]],原地旋转输入矩阵,使其变为:[ [7,4,1], [8,5,2], [9,6,3]]示例2给定 matrix =[ [ 5, 1, 9,11], [ 2, 4, 8,10], [13, 3, 6, 7], [15,14,
2021-01-17 19:25:51
102
原创 程序员面试金典 面试题 01.06. 字符串压缩
字符串压缩。利用字符重复出现的次数,编写一种方法,实现基本的字符串压缩功能。比如,字符串aabcccccaaa会变为a2b1c5a3。若“压缩”后的字符串没有变短,则返回原先的字符串。你可以假设字符串中只包含大小写英文字母(a至z)。示例1输入:"aabcccccaaa" 输出:"a2b1c5a3"示例2输入:"abbccd" 输出:"abbccd" 解释:"abbccd"压缩后为"a1b2c2d1",比原字符串长度更长。解答 python3class Solution: de
2021-01-17 17:03:11
131
原创 程序员面试金典 面试题 01.05. 一次编辑
字符串有三种编辑操作:插入一个字符、删除一个字符或者替换一个字符。 给定两个字符串,编写一个函数判定它们是否只需要一次(或者零次)编辑。示例1输入: first = "pale"second = "ple"输出: True示例2输入: first = "pales"second = "pal"输出: False解答 python3class Solution: def oneEditAway(self, first: str, second: str) -> boo
2021-01-17 15:37:49
115
原创 知识图谱-实体消歧(语义消歧)
命名实体歧义:命名实体指称多样性: 一个命名实体可以用多种方式表达.命名实体指称歧义性: 一个指称可能表示不同的命名实体.命名实体聚类消歧 命名实体链接消歧命名实体聚类消歧是利用聚类算法来对实体进行消歧. 命名实体链接消歧则是借助外部知识库将待消歧命名实体指称链接到外部知识库中对应实体来进行消歧.基于中文维基百科的命名实体消歧方法计算文本特征向量与不同词义的维基特征向量的相似度(可由词间距离转换 余弦距离 欧式距离等)。面向实体链接的多特征图模型实体消歧方法以中文维基百科作为知识库支撑
2021-01-17 10:20:12
3866
2
原创 程序员面试金典 面试题 01.04. 回文排列
给定一个字符串,编写一个函数判定其是否为某个回文串的排列之一。回文串是指正反两个方向都一样的单词或短语。排列是指字母的重新排列。回文串不一定是字典当中的单词。示例1:输入:"tactcoa"输出:true(排列有"tacocat"、"atcocta",等等)解答 python3class Solution: def canPermutePalindrome(self, s: str) -> bool: n=len(s) m=[];
2021-01-16 10:30:21
152
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人