chansonzhang-优快云博客

与 Isomap 试图保持近邻样本之间的距离不同，局部线性嵌入（Locally Linear Embedding, 简称 LLE）试图保持邻域内样本之间的线性关系。西瓜书 10.5.2 节局部线性嵌入。表示要求特征向量是单位向量）。则式 (10.29) 可重写为。LLE 在低维空间（维度为。进行特征值分解后最小的。个特征值对应的特征向量（LLE 先为每个样本。

2023-07-22 19:50:53 237

原创 Learning from Dialogue after Deployment: Feed Yourself, Chatbot!

让机器人在对话中学习

2023-06-17 23:09:09 502 1

原创 k8s集群证书管理

Kubenetes 证书管理的一些记录

2023-06-10 17:12:22 1480 1

原创西瓜书公式（10.24）的推导

在西瓜书 10.4 节 “核化线性降维” 中，引入了一个映射函数。是高维空间中的一个标准正交基。映射到高维特征空间中，即。的具体形式，于是引入核函数。由前文中的推导可以得到。一般情形下，我们不清楚。

2023-06-10 13:31:05 1245

原创 Dialogue Transformers

Rasa 中的 Transformer Embedding Dialogue (TED) 对话策略

2023-02-11 21:03:49 600

原创 CGMH: Constrained Sentence Generation by Metropolis-Hastings Sampling

通过 MH 采样实现带约束的句子生成

2022-11-26 15:44:05 971

原创 PADA: Example-based Prompt Learning for on-the-fly Adaptation to Unseen Domains

Source Domain -> DRF -> Example-specific Prompt -> Unseen Domain

2022-10-22 20:48:13 566

原创 Jax 中的 Autograd 和 PyTorch 中的 Autograd 有何联系？

其实都有 HIPS/autograd 血统

2022-09-28 07:33:48 538

原创 SimCSE: Simple Contrastive Learning of Sentence Embeddings

仅使用标准的 dropout 作为噪声

2022-08-06 19:57:30 439

原创 CLEAR: Contrastive Learning for Sentence Representation

数据增强+对比学习+MLM

2022-06-25 19:08:02 746

原创 DeCLUTR: Deep Contrastive Learning for Unsupervised Textual Representations

使用自监督对比学习来学习文本表示

2022-06-18 15:34:36 320

原创 An Unsupervised Sentence Embedding Method by Mutual Information Maximization

IS-BERT: 基于句子表示与局部 n-gram 表示互信息最大化来进行无监督句子表示学习

2022-05-28 20:46:09 335

原创 Sentence Meta-Embeddings for Unsupervised Semantic Textual Similarity

将预训练 sentence encoders 集成到 sentence meta-embeddings 中，解决无监督 STS 任务。

2022-05-28 14:49:08 184

原创 Multi-View Domain Adapted Sentence Embeddings for Low-Resource Unsupervised Duplicate Question Detec

MV-DASE 基于 GCCA 合并了多种不同的 embedding

2022-04-10 17:40:26 906

原创 Domain Adaptive Dialog Generation via Meta Learning

DAML

2022-04-09 10:25:33 248

原创 Overview of the English Slot Filling Track at the TAC2014 Knowledge Base Population Evaluation

Abstract概述了 TAC2014 Knowledge Base Population (KBP) evaluation 中的的词槽填充赛道（English Slot Filling (SF) track）。KBP 旨在促进从自由文本中提取命名实体和数值型实体之间的二元关系的研究。今年（2014）的主要变化是：包含歧义查询接受通过推断得到的输出对任务和输入格式的简化，移除了 query 中实体对于知识库的引用最高得分为 36.72 F1，中位数为 19.80 F1。1 Introd

2022-03-19 19:02:36 273