nltk: Tokenizing text into sentences

  1. 安装 nltk pip install nltk
  2. 下载nltk_data
    方法一: 通过客户端下载

    import nltk
    nltk.download()

    出现如下客户端,选择所需的包下载。(但由于网速原因,我自己没有下载成功)

    方法二: 通过命令行下载 (我自己也没下载成功)

    import nltk
    nltk.download(‘all’)

    方法三: 复制别人下载好的包
    通过盘多多的搜索,查找到python3所需的nltk_data文件夹 http://pan.baidu.com/share/link?shareid=3107283122&uk=270537756&fid=612886180436827 ,下载解压并放置到C://nltk_data的路径下

  3. text to sentences 的小例子

    from nltk.tokenize import sent_tokenize
    a=”Hello World. It’s good to see you. Thanks for buying this book.”
    b=sent_tokenize(a)
    print(b)





转载于:https://www.cnblogs.com/combfish/p/6264213.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值