
NLP相关
文章平均质量分 65
自我学习和实践记录
xhanZ
这个作者很懒,什么都没留下…
展开
-
【Python】regex对英文生成文本中的字符串处理
主要针对连续重复字符串 (repetition)比如:“I love my cat cat cat cat cat”“I love you. I love you. I love you. I love you. ”还有其他一些后处理。def replace_regex(x, remove=None): # 小写独立i 转 I x = re.sub(r"\bi\b","I",x) # i -> I # 连续重复字符(原文中以空格分隔 如 "p p p p p","* *原创 2021-06-16 19:52:31 · 259 阅读 · 0 评论 -
【笔记】自然语言处理NLP---概论
(from 人文学院开设课程)目录1. 自然语言处理概论1.1 自然语言处理研究的意义、历史与现状1.1.1 自然语言的特点1.1.2 自然语言处理研究的意义1.1.3 国外研究现状1.2 NLP的方法、特点和规律1.2.1 理性主义与经验主义1.2.2 语料库语言学:经验主义研究方法1.2.3 汉语语言处理的方法1.2.4 基于知识图谱的深度学习1. 自然语言处理概论1.1 自然语言处理研究的意义、历史与现状1.1.1 自然语言的特点任何语言,包括书面语、口语或手语,都是由小的元素(语素或音原创 2021-02-23 17:32:06 · 1961 阅读 · 0 评论 -
【笔记】CSE 599 Generative Models (一)生成模型
ResourceUW course: https://courses.cs.washington.edu/courses/cse599i/20au/CSE 599, Autumn 2020 Generative ModelsInstructor: John ThickstunIntro本课程探索各种现代技术,以学习通过示例给出未知概率分布的样本的方法。生成模型是研究的活跃领域:我们在本课程中讨论的大多数技术都是在最近10年中开发的。本课程与当前的研究文献紧密结合,将提供阅读该领域最新..原创 2021-01-20 18:04:03 · 735 阅读 · 0 评论 -
【Tools】资源收藏夹
目录平台MANAIBM WatsonNLP toolkitOpenNRENLP ability平台MANAMana AI 社区无意中发现的网站,提供一些AI服务的部署方案,有些要付费但不贵,还有社区。页面风格我挺喜欢的,感觉是自由和有活力的,但目前好像用户不太多,有待探索。IBM Watson非常成熟的AI产品技术平台,提供分级服务IBM cloudIBM watsonNLP toolkitOpenNREgithub/OpenNRE哈工大bert上fine turning ,中原创 2021-01-19 19:41:39 · 164 阅读 · 0 评论