
Python 基础
文章平均质量分 75
留兰香丶
但行好事,莫问前程
展开
-
Python入门:jieba库的使用
jieba 库是一款优秀的 Python 第三方中文分词库,jieba 支持三种分词模式:精确模式、全模式和搜索引擎模式,下面是三种模式的特点。精确模式:试图将语句最精确的切分,不存在冗余数据,适合做文本分析全模式:将语句中所有可能是词的词语都切分出来,速度很快,但是存在冗余数据搜索引擎模式:在精确模式的基础上,对长词再次进行切分jieba GitHub 开源地址:https://...原创 2018-05-17 21:20:12 · 233482 阅读 · 39 评论 -
Python入门:操作文件
一、文件分类文本文件:由单一特定编码组成的文件,比如utf-8 编码、GBK 编码等,.py 与 .txt 等都属于文本文件。但是文本文件本质上是以二进制形式存储的。二进制文件:直接由 0 和 1 组成,没有统一的字符编码。比如:.png 与 .avi等都属于二进制文件。二、文件打开模式要获取一个文件对象,只需要使用 Python 内置 open() 的函数即可,在 open(...原创 2018-05-21 22:04:50 · 275 阅读 · 0 评论 -
Python入门:正则表达式
正则表达式是对字符串操作的一种逻辑公式,用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式,模式描述在搜索文本时要匹配的一个或多个字符串。一、常用操作符正则表达式中的常用操作符如下操作符说明举例.表示单个字符[ ]字符集,对单个字符给出取值范围[abc] 表...原创 2018-05-31 12:58:05 · 406 阅读 · 0 评论