- 博客(6)
- 收藏
- 关注
原创 jieba库的使用
jieba库的函数还是比较少的。jieba库是Python的第三方中文分词库。 jieba库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组。除了分词,jieba还提供增加自定义中文分词的功能。 jieba库支持3种分词模式:精确模式,将句子最精确地切开,适合文本分析;全模式,把句子中所有可以成词的成语都扫描出来,速度非常快,但是不能消除歧义;搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。无论使用
2022-12-08 18:56:16
642
原创 我的第一篇Blog
今天是加入优快云的第六天,也是我写的第一篇Blog。本人喜欢Python,也学一段时间了。记录一下最近学Python的感想(仅我个人的想法)。 第一次知道Python是2020年的夏天,在我表哥家,看到表哥桌子上一本《Python编程 从入门到实践》(到后来才知道那是第一版的)。我当时翻了翻,哇!代码,一行一行的好酷啊!但是第一次开始学Python是去年,入门的课程让我学的一塌糊涂。 后来...,后来也就歇菜了。 我觉得掌握Python是一件很酷的事情,所以有“重操旧业”,由于之前有
2022-12-07 19:14:23
357
5
空空如也
爬虫中的js逆向怎么学?
2022-12-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人