Python库
文章平均质量分 86
1. 目的:记录在 AI 研发过程中高频使用的 Python 库,方便快速查阅。
2. 原则:并非简单的罗列,而是聚焦于 核心作用、典型用法、以及为何在 AI 领域常用。
ruanchao
凡事由其自然,遇了处之泰然, 得意之时淡然,失意之时坦然, 艰辛曲折必然,历尽沧桑悟然。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pandas在AI中与其他库的协作
一个典型的AI项目流程清晰地展示了这些库是如何协做的:在这个工作流中,pandas 始终是数据处理的起点和中心,负责将原始数据整理成“整洁数据”(Tidy Data),为下游的各个专业库提供标准化的输入。处理结果最终又常常会回到 pandas 的 DataFrame 中,利用其强大的数据操作能力进行后续分析和展示。原创 2025-09-19 14:06:44 · 1071 阅读 · 0 评论 -
uvicorn 和 FastAPI 各自的作用以及它们如何协同工作
特性FastAPIuvicorn角色Web应用框架ASGI服务器主要职责业务逻辑、API定义、数据验证网络通信、进程管理、协议处理关注点开发效率、代码结构性能、并发、稳定性可替换性可替换为Django、Flask等可替换为Hypercorn、Daphne等依赖关系依赖于ASGI服务器来运行可以独立运行,负责托管应用正是这种清晰的分工合作,使得 FastAPI + uvicorn 的组合能够同时提供极佳的开发体验和运行时性能。原创 2025-09-14 11:29:34 · 910 阅读 · 0 评论 -
FAISS 库
FAISS 是一个专为海量高维向量相似性搜索而优化的高性能库。它通过智能的索引结构(如 IVF、PQ)极大地加速了搜索过程,使得在亿级甚至十亿级向量中实现毫秒级检索成为可能,是现代 AI 应用中实现语义搜索、推荐、检索等功能的基石技术。原创 2025-09-22 21:00:36 · 949 阅读 · 0 评论 -
BM25 算法
BM25 是一个强大、实用且高效的排序算法,它通过结合词频、逆文档频率和文档长度归一化,为搜索查询和文档的相关性提供了一个鲁棒且可靠的评分机制。它是理解和构建现代搜索系统不可或缺的基础知识。原创 2025-09-22 20:43:43 · 914 阅读 · 0 评论 -
pandas库
pandas是一个开源的、强大的、高性能的Python 数据分析库。它的名字源于“PanelData”(面板数据),这是一个计量经济学的术语。它构建在 NumPy 库之上,提供了更高级、更便捷的数据结构和操作工具。你可以把它想象成Python 中的 Excel 或 SQL,但功能更强大、更灵活,并且可以通过编程进行自动化操作。特性描述核心数据结构Series(一维),DataFrame(二维表格)核心功能数据清洗、转换、聚合、可视化类比工具Excel + SQL + 编程的强大结合体应用领域。原创 2025-09-19 11:58:40 · 775 阅读 · 0 评论 -
pydantic库
功能描述好处数据验证确保输入数据符合预期的类型和约束。提高代码健壮性,减少潜在的 bug。数据转换自动将原始数据(如 JSON、字典)转换为正确的 Python 类型。简化数据处理逻辑,代码更简洁。设置管理从环境变量等多来源安全地加载和验证配置。使应用配置更清晰、更安全、更易于管理。编辑器支持基于标准类型注解,IDE 支持好。提升开发效率,减少打字错误。自文档化模型结构即文档。代码即文档,易于理解和维护。总而言之,原创 2025-09-18 09:57:24 · 694 阅读 · 0 评论 -
jieba 库
你可以加载自定义词典,以便识别特定领域的词汇(如人名、专业术语、新词等),从而提高分词的准确性。保证特定名称(如“王建国”、“深度学习”)不被切分开。添加新词(如“yyds”、“元宇宙”)。或使用方法。原创 2025-09-22 20:33:59 · 808 阅读 · 0 评论 -
tqdm 库
场景使用方法标准循环手动更新(已知总量)Pandas 操作总而言之,tqdm是每个 Python 开发者工具箱中都应该有的“神器”之一。它用极少的代码极大地提升了用户体验和开发效率,是监控长时间运行任务的绝佳选择。原创 2025-09-20 21:20:05 · 444 阅读 · 0 评论 -
PyMuPDF 库
PyMuPDF是一个功能强大、速度极快的 Python 库,用于处理 PDF 和其他文档格式(如 XPS, EPUB, CBZ 等)。它之所以在代码中被选用,是因为它提供了对 PDF 文档极低层的访问和控制能力。文档解析器:读取PDF文件结构和内容文本提取器:获取PDF中的文本层内容图像定位器:找到页面中的所有图像及其位置信息数据提供者:为OCR处理提供图像像素数据几何信息源:提供页面和图像的尺寸、旋转等信息正是由于 PyMuPDF 的这些强大功能,代码才能实现既提取文本又处理图像的复合PDF解析方案。原创 2025-09-20 20:58:10 · 526 阅读 · 0 评论
分享