# -*- coding: utf-8 -*-
from __future__ import unicode_literals
import nltk.tokenize as tk
#需要分词的文本
doc = "Are you ok? \
I'm fun,and you? \
I'm ok."
#文本分句
tokens = tk.sent_tokenize(doc)
Python自然语言处理——nltk库入门之文本分词(英文)
最新推荐文章于 2025-07-20 21:07:45 发布