# ///////////PY.11:Python第三方库///////////////////////////////////
# ====================================================
# 目录:
# 一、第三方库的安装:pip工具
# 二、第三方库的使用: jieba库
# 三、其他的第三方库:
# ====================================================
# /////////////一、pip安装////////////////////////
# 第三方库:区别于标准库,是非python官方人员写的非常实用的库
# 学会安装第三方库(如何安装、使用、卸载jieba库)
# 第三方库的安装方式(3种):
# 1.pip 工具安装
# 2.自定义安装(去官网)
# 3.文件安装(上官网下载库的文件,文件的扩展名是.whl)
#
# 安装库:
# pip install 库名
# windows+R键, 敲cmd回车,在cmd窗口中输入
#
# 卸载库:
# uninstall 库名
import jieba
from jieba import *
print(lcut('一蓑烟雨任平生'))
# 输出: ['一', '蓑', '烟雨任', '平生']
# ////////////二、jieba库///////////////////////////
# jieba : 第三方中文分词函数库;
# 用来将一段中文文本分割成中文词语的序列,需要通过pip指令进行安装。
# 4个函数:
# 1)最常用!!>>>Jieba.lcut(s)
# 精确模式,返回一个列表类型;s是你要操作的对象(字符串)
import jieba
ls = jieba.lcut("两岸猿声啼不住,轻舟已过万重山。")
print(ls)
# 输出:
# ['两岸', '猿声', '啼', '不住', ',', '轻舟', '已过', '万重山', '。']
# 2)jieba.lcut(s, cut_all=True)
# (注意,连接cut和all的是下划线)
# 全模式,返回一个列表类型
import jieba
ls1 = jieba.lcut("两岸猿声啼不住,轻舟已过万重山。", cut_all=True)
print(ls1)
# 输出:
# ['两岸', '猿声', '啼', '不住', ',', '轻舟', '已', '过', '万重', '万重山', '重山', '。']
# 区别在于,将词语拆得更多了
#(相较于精确模式,全模式找到所有分词的可能)
# 3)jieba.lcut_for_search(s)
# 搜索引擎模式,返回一个列表类型
import jieba
ls2 = jieba.lcut_for_search("两岸猿声啼不住,轻舟已过万重山。")
print(ls2)
# 输出:
# ['两岸', '猿声', '啼', '不住', ',', '轻舟', '已过', '万重', '重山', '万重山', '。']
# 搜索模式:首先执行精确模式,然后再对其中的一些长词进一步切分。
# 4)jieba.add_word(w)
# 向分词词典中增加新词w
jieba.add_word("天门山蜀道难")
ls3 = jieba.lcut("两岸猿声啼不住,轻舟已过万重山。")
print(ls3)
# /////////三、其他常见的第三方库//////////////////
# (选择题,分方向记住就行)
# 1.网络爬虫方向:
# request ; scrapy
# 2.数据分析方向:
# numpy ; scipy ; pandas
# 3.文本处理方向:
# pdfminer (读取pdf) ;
# openpyxl (处理excel);
# python-docx (处理word文档);
# beautifulsoup4 (解析和处理HTML、XML);
# 4.数据可视化 方向:
# matplotlib (二维图绘制);
# TVTK (三维可视化);
# mayavi (更方便的三维可视化)
# 5.用户图形界面 方向:(用户图形界面开发)
# PyQt5 ;
# wxPython;
# PyGTK
# 6.机器学习:
# scikit-learn (机器学习)
# TensorFlow (人工智能)
# Theano (深度学习)
# 7.web开发方向(web框架)
# Django
# Pyramid
# Flask
# 8.游戏开发方向:
# Pygame
# Panda3D
# cocos2d
# 9.其他第三方库:
# PIL 图像处理
# SymPy 数学计算
# NLTK 自然语言处理
# WeRoBot 微信机器人框架
# MyQR 二维码