知识点回顾:
- 导入官方库的三种手段
- 导入自定义库/模块的方式
- 导入库/模块的核心逻辑:找到根目录(python解释器的目录和终端的目录不一致)
目录
场景1: main.py 和 circle.py 都在同一目录
场景2: main.py 和 circle.py 都在根目录的子目录 model/ 下
场景3: main.py 在根目录,circle.py 在子目录 model 下
一、导入官方库
所谓学习python就是学习python常见的基础语法+学习你所处理任务需要用到的第三方库。
类别 | 典型库 | 解决的问题 | 学习门槛 |
---|---|---|---|
基础工具 | os 、sys、 json | 作系统交互、序列化数据(如读写 JSON 文件) | 低 |
科学计算 | numpy 、scipy | 数值计算、线性代数、信号处理 | 中 |
数据分析 | pandas 、matplotlib | 数据清洗、转换、可视化(如绘制折线图、柱状图) | 中 |
Web 开发 | Django 、Flask | 快速搭建 Web 应用(如网站后台、API 接口) | 中高 |
机器学习 | scikit-learn 、TensorFlow | 机器学习算法(分类、回归、深度学习) | 高 |
自动化脚本 | pyautogui 、pytest | 自动化测试、桌面操作自动化(如模拟鼠标键盘操作) | 低 |
网络爬虫 | requests 、Scrapy | 从网页提取数据(需注意反爬机制和法律合规) | 中 |
所以你用到什么学什么库即可。学习python本身就是个伪命题,就像你说学习科目一样,你没说清晰你学习的具体科目是什么,也没说学这个科目的哪些章节,毕竟每个科目都很大-----要有以终为始的思想。
1.1 标准导入:导入整个库
这是最基本也是最常见的导入方式,直接使用 import 语句。
# 方式1:导入整个模块
import math
print("方式1:使用 import math")
print(f"圆周率π的值:{math.pi}")
print(f"2的平方根:{math.sqrt(2)}")
输出:
方式1:使用 import math
圆周率π的值:3.141592653589793
2的平方根:1.4142135623730951
1.2 从库中导入特定项
当使用 from 语法从库中导入特定的函数或类时,这些函数或类就可以在您的代码中直接使用,不需要添加模块名作为前缀。因为在导入时没有包括模块的完整路径,前面也不能加上库名。
# 方式2:导入特定的函数或变量
from math import pi, sqrt
print("方式2:导入特定的函数或变量")
print(f"圆周率π的值:{pi}")
print(f"2的平方根:{sqrt(2)}")
输出:
方式2:导入特定的函数或变量
圆周率π的值:3.141592653589793
2的平方根:1.4142135623730951
类似的写法,如sklearn库很大,直接导入sklearn库会占用电脑大量内存,所以一般只导入你需要的库,如:
from sklearn.model_selection import train_test_split
1.3 非标准导入:导入整个库
如下,
● 这将导入`math`模块中定义的所有公开函数和变量。
● 和上述from同理,直接调用`sin()`、`cos()`等,而无需`math.`前缀。
from math import *
实例:
from math import *
print(f"圆周率π的值:{pi}。")
print(f"2的平方根:{sqrt(2)}")
输出:
圆周率π的值:3.141592653589793。
2的平方根:1.4142135623730951
上述这些,如果是python内置库,可以直接导入,大部分第三方库都需要先用pip来安装。下面的模块,也就是.py文件,是不需要安装即可调用的。
二、模块、包的定义
模块(Module)
-
本质:以
.py
结尾的单个文件,包含Python代码(函数、类、变量等)。 -
作用:将代码拆分到不同文件中,避免代码冗余,方便复用和维护。
包(Package)
在python里,包就是库
-
本质:有层次的文件目录结构(即文件夹),用于组织多个模块和子包。
-
核心特征:包的根目录下必须包含一个
__init__.py
文件(可以为空),用于标识该目录是一个包。
使用案例:求圆的面积
若编写一个计算圆面积的代码并保存为 circle.py
,这个文件就是一个模块。
使用时通过 import
导入模块,调用其中的函数(如 circle
circle.calculate_area(5)
)。
# circle.py
import math
def calculate_area(radius):
return math.pi * radius ** 2
IDE(如 VSCode 或 PyCharm)通常会将你打开的项目文件夹设为“根目录”(或者说,运行时的工作目录)。Python 在导入模块时,会从这个根目录(以及其他一些标准位置和脚本所在的目录)开始查找。
场景1: main.py 和 circle.py 都在同一目录
目录结构:
项目根目录/
├── main.py
└── circle.py
main.py
内容:
# main.py
from circle import calculate_area
# 或者: import circle (然后用 circle.calculate_area)
radius = 5
area = calculate_area(radius)
print(f"半径为 {radius} 的圆,面积是: {area}")
运行方案:直接在终端python main.py
场景2: main.py 和 circle.py 都在根目录的子目录 model/ 下
目录结构:
项目根目录/
└── model/
├── __init__.py (推荐添加,将 model 目录标记为包)
├── main.py
└── circle.py
model/main.py 内容:
# model/main.py
from circle import calculate_area
# 或者: import circle (然后用 circle.calculate_area)
radius = 5
area = calculate_area(radius)
print(f"半径为 {radius} 的圆,面积是: {area}")
运行方案:
-
运行命令:python model/main.py
-
进入路径:cd xxx(main的相对路径),然后执行python main.py (注意:如果先cd后,就不能采用第一个命令了)
场景3: main.py 在根目录,circle.py 在子目录 model 下
目录结构:
项目根目录/
├── main.py
└── model/
├── __init__.py (必需添加,将 model 目录标记为一个可导入的包)
└── circle.py
main.py 内容:
# main.py
from model.circle import calculate_area
# 或者: from model import circle (然后用 circle.calculate_area,因为此时你是导入了整个模块)
radius = 5
area = calculate_area(radius)
print(f"半径为 {radius} 的圆,面积是: {area}")
运行方案:直接在终端python main.py
场景4:
项目根目录/
├── circle2.py
└── utils/
├── __init__.py (必需添加,将 model 目录标记为一个可导入的包)
└── circle.py
└── model/
└── main.py
main.py内容;
from utils import circle # 这是根目录绝对路径的导入方式
radius = 5
area = circle.calculate_area(radius)
print(f"半径为 {radius} 的圆,面积是: {area}")
如果直接使用 python model/main.py,会报错!!!
输出:
---------------------------------------------------------------------------
ModuleNotFoundError Traceback (most recent call last)
Cell In[2], line 1
----> 1 from utils import circle # 这是根目录绝对路径的导入方式
3 radius = 5
4 area = circle.calculate_area(radius)
ModuleNotFoundError: No module named 'utils'
是因为 项目根目录 不在 sys.path 中,需要手动添加
# 查看sys.path
import sys
for i in sys.path:
print(i)
输出:
e:\CondaEnvs\envs\py60\python39.zip
e:\CondaEnvs\envs\py60\DLLs
e:\CondaEnvs\envs\py60\lib
e:\CondaEnvs\envs\py60
e:\CondaEnvs\envs\py60\lib\site-packages
e:\CondaEnvs\envs\py60\lib\site-packages\win32
e:\CondaEnvs\envs\py60\lib\site-packages\win32\lib
e:\CondaEnvs\envs\py60\lib\site-packages\Pythonwin
python 解释器会自动在 sys.path 中的目录中搜索模块,因为 utils 并不在 model 这个路径下,所以直接运行会报错。
有2类策略:
- 把 utils 路径加入到 sys.path 中
- 在 py文件 的终端中直接用 python -m model.main 运行,这种导入方法会默认从根目录开始查找。
ps:之所以你会感觉终端的命令明明是根目录,但是运行时却找不到,是因为python解释器理解的目录和终端的目录不一样,通过sys.path可以查看解释器理解的目录。
方法一:
(1)查找 项目根目录
# 查找项目根目录
import sys
import os
project_root = os.path.abspath(os.path.join(os.getcwd(), '..'))
project_root
输出:
'c:\\Users\\acstdm\\Desktop\\python60-days-challenge-master\\py60-stud\\DAY 30-模块和包的导入\\案例4'
(2)将 项目根目录 添加到 sys.path 中
# 如果项目根目录不在 sys.path 中,则添加它(通常添加到开头,优先搜索)
if project_root not in sys.path:
sys.path.insert(0, project_root)
sys.path
输出:
['c:\\Users\\acstdm\\Desktop\\python60-days-challenge-master\\py60-stud\\DAY 30-模块和包的导入\\案例4',
'e:\\CondaEnvs\\envs\\py60\\python39.zip',
'e:\\CondaEnvs\\envs\\py60\\DLLs',
'e:\\CondaEnvs\\envs\\py60\\lib',
'e:\\CondaEnvs\\envs\\py60',
'',
'e:\\CondaEnvs\\envs\\py60\\lib\\site-packages',
'e:\\CondaEnvs\\envs\\py60\\lib\\site-packages\\win32',
'e:\\CondaEnvs\\envs\\py60\\lib\\site-packages\\win32\\lib',
'e:\\CondaEnvs\\envs\\py60\\lib\\site-packages\\Pythonwin']
(3)再次运行 成功
# 再次运行 成功
from utils import circle # 这是根目录绝对路径的导入方式
radius = 5
area = circle.calculate_area(radius)
print(f"半径为 {radius} 的圆,面积是: {area}")
输出:
半径为 5 的圆,面积是: 78.53981633974483
方法二:
当使用 python -m model.main 时,Python 会将当前目录(即项目根目录)添加到 sys.path 的开头。
所以导入包的核心就是找到目录,只有理解了python解释器的目录关系,才能导入包,如果py文件中导入失败,不妨多调试几次路径即可
三、源代码的查看
如果第三方库是纯 python 写的,往往在函数上按住 ctrl 即可进入函数内部查看源代码。
但是很多第三方库为了性能,底层是用其他语言写的,这里我们计算机视觉库 OpenCV 为例。
OpenCV 核心是用 C++ 编写的(v可以显著提高性能),但它通过 Python 等其他语言的接口(bindings)使得这些功能可以在 Python 环境中被调用。这些接口是通过一种叫做 Python/C API 的技术实现的,其中 C++ 的功能被封装成 Python 模块,使得 Python 用户可以像使用纯Python 编写的库一样使用 OpenCV。
OpenCV 的核心是用 C++ 编写,并且已经编译成二进制文件,编译后的二进制文件可以在不同操作系统上运行,Python 中的用户通常不能直接看到方法的源代码。
二进制文件是机器语言,处理器可以直接理解和执行无需翻译,二进制语言反汇编是很困难的,用二进制语言除了效果好外,也是让用户无法看到源代码,保护了自己的知识产权。
这意味着:
二进制文件dll文件:当你在 Python 中导入 OpenCV 库(通过 import cv2 ),你实际上是在调用预先编译好的二进制文件。这些文件包含了实现 OpenCV 功能的可执行代码,而非人类可读的源代码。
接口封装:用户只能看到 Python 函数和对象的接口(即函数的定义,不包括实现的细节)。这也意味着无法从利用 ctrl 跳转到函数内部,pycharm 的 debugger 功能同理也无法看到内部结构。
文档和源代码:尽管在 Python 中不能直接看到 C++ 的源代码实现,用户可以参考官方文档来了解各个函数和方法的用法。如果需要查看实现细节,可以访问 OpenCV 的[GitHub仓库](https://github.com/opencv/opencv)查看 C++ 源代码。
这就需要我们养成看文档的能力,文档就是以终为始思想的体现。文档就是api使用说明书,可能你日常买东西都不喜欢看使用说明书,但是在代码学习中,这一步是绕不开的。