
NLP
文章平均质量分 95
和我一起探索自然语言处理世界,让机器理解语言吧!
小叶pyか
21级在读本科生,热爱算法,人工智能和数据分析。写博客是为了记录自己的成长之路和做知识总结。座右铭:永远相信美好的事情即将发生!
展开
-
第三节、语言模型
语言模型,个人理解,也可以认为是,如何从机器的角度,来建模并认知语言。其发展历程基本也和自然语言处理的技术发展历史一致,从规则到统计,再从统计到深度学习。原创 2023-04-09 20:00:00 · 753 阅读 · 0 评论 -
第二节:文本数据预处理
在处理文本的任务中,也存在预处理这么一个重要阶段,包括诸如统一数据格式、去噪、词形还原、分词之类的基本操作,以及语义分析、关键词提取、对于数据不平衡的处理等更进一步的精细处理。原创 2023-04-08 16:30:00 · 2077 阅读 · 0 评论 -
第一节、文本数据的读写及操作
在自然语言处理的第一步,我们要面对的是各种各样以不同形式表现的文本数据,比如,有的是纯 txt 文档,有的是存储在 Excel 中的表格数据,还有的是无法直接打开的 pkl 文件等。刚开始接触编程的同学在这里就犯难了,这可怎么把文本数据拿来进行代码层面的操作呢?事实上,会者不难,针对这些不同类型的数据,可以基于 Python 中的基本功能函数或者调用某些库进行读写以及作一些基本的处理。本实验将介绍一些常见形式文件的操作,相信在学完本实验以后,大家能够非常快速地上手读写及处理大部分类型的文本数据。知识点。原创 2023-04-07 21:30:00 · 821 阅读 · 1 评论 -
自然语言处理(NLP)在医疗领域的应用
自然语言处理在生物医学领域迅速发展,已经成为当前的研究热点原创 2023-03-18 11:41:07 · 3563 阅读 · 0 评论 -
【NLP】一文读懂Bert模型
一看就懂,一学就会!原创 2023-03-18 10:36:02 · 1194 阅读 · 0 评论 -
图解GPT-2
这是第一个训练只包含解码器的 transformer 的任务。也就是说,该模型被训练来阅读维基百科的文章(没有目录前的开头部分),然后生成摘要。文章实际的开头部分被用作训练数据集的标签至此,我们的 GPT-2 的完全解读,以及对父类模型(只包含解码器的 transformer)的分析就到此结束了。希望读者能通过这篇文章对自注意力机制有更好的理解。在了解了 transformer 内部的工作原理之后,下次再遇到它,你将更加得心应手。原创 2023-03-16 20:22:57 · 1066 阅读 · 1 评论 -
ChatGPT的前世今生
让机器理解语言!原创 2023-03-15 17:39:40 · 6492 阅读 · 1 评论