
nlp&nlg
xiewenbo
互联网广告行业呆过几年,旅游公司呆过几年,对机器学习,自然语言处理,图像识别,个性化推荐 有兴趣
展开
-
基于Bert的NLG
《Unified Language Model Pre-training for Natural Language Understanding and Generation》《MASS: Masked Sequence to Sequence Pre-training for Language Generation》《BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translat.原创 2020-11-06 00:11:37 · 446 阅读 · 0 评论 -
[PGN]coverageLosss note
原创 2019-12-26 23:45:42 · 242 阅读 · 0 评论 -
命名实体识别从数据集到算法实现-标注法记录-技术很旧
命名实体识别(Named Entity Recognition, NER)是 NLP 的基础任务,指从文本中识别出命名性指称项,为关系抽取等任务做铺垫。狭义上,是识别出人名、地名和组织机构名这三类命名实体(时间、货币名称等构成规律明显的实体类型可以用正则等方式识别)。当然,在特定领域中,会相应地定义领域内的各种实体类型。目前的主流工作,是将 NER当做深度学习任务来做,所以,我们需要大量的、高质量...转载 2019-12-09 19:17:23 · 1513 阅读 · 0 评论 -
Downloadable NLG systems
Tools and Software for English - Downloadable NLG systemsFor languages other than English, see List of resources by language.The natural language generation systems listed below are available转载 2015-10-20 15:12:42 · 961 阅读 · 0 评论 -
中文文本处理简要介绍
本文作者李绳,博客地址 http://acepor.github.io/。作者自述:一位文科生曾励志成为语言学家出国后阴差阳错成了博士候选人三年后交完论文对学术彻底失望回国后误打误撞成了数据科学家作为一个处理自然语言数据的团队,我们在日常工作中要用到不同的工具来预处理中文文本,比如 Jieba 和 Stanford NLP software。出于准确性和效率的考转载 2016-01-08 15:31:27 · 647 阅读 · 0 评论 -
穷人的语义处理工具箱之一:语义版Jaccard
|为什么我们是ML界的穷人如果对工业界里的机器学习(ML)从业者进行阶级划分的话,划线标准不是你用的算法的学名听起来多酷炫,无论你手里抡着的是最潮的深度高达1000层的深度学习核炸弹,还是听起来有点掉渣的大刀长矛朴素贝叶斯,如果没有大量数据,尤其是能跑监督学习算法的带标签训练数据,你就是ML界标准的底层渣男渣女或者渣娘炮。再加上计算资源,如果贵公司有上千台GPU服务器集群可供阁转载 2016-01-13 00:01:13 · 614 阅读 · 1 评论 -
深度学习中Embedding层有什么用?
from:https://blog.youkuaiyun.com/u010412858/article/details/77848878这篇博客翻译自国外的深度学习系列文章的第四篇,想查看其他文章请点击下面的链接,人工翻译也是劳动,如果你觉得有用请打赏,转载请打赏:Setting up AWS & Image Recognition Convolutional Neural Network...转载 2019-03-05 17:53:51 · 730 阅读 · 0 评论