NLP-文本和词汇-自然语言处理
第二节 词链表
中国 成都
C H E N G D U , C H I N A
目录
1链表
2索引列表
3变量
文本是什么?在一个层面上,它是一页纸上的符号序列就像这页纸一样。在另一个层面上, 它是章节的序列, 每一章由小节序列组成, 小节由段落序列组成, 以此类推。然而, 对于我们而言, 我们认为文本不外乎是词和标点符号的序列。
【例2 - 1 】下面是我们如何在 Python 中表示文本, 如何表示《白鲸记》的开篇句, 查询它的长度? 每个文本开始的句子定义为 sent1…sent9。请检查其中的两个句子?
sent1 = [‘Call’, ‘me’, ‘Ishmael’, ‘.’]
这个方括号内的东西在 Python 中叫做链表(list,也叫列表): 它就是我们存储文本的方式。我们可以通过输入它的名字来查阅它。

检查句子
sent4 + sent5
本文介绍了自然语言处理中的文本表示,重点关注Python中使用链表(列表)存储文本的方法。通过示例展示了如何创建、访问、修改链表元素,以及进行索引和切片操作。此外,还提到了字符串在NLP中的应用。
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



