spaCy 是一个用于工业级自然语言处理的流行开源 Python 库。spaCy v3.0 引入了新的基于 Transformer 的流水线,将 spaCy 的准确度提升至当前最先进水平,并配备了一个全新的训练配置和工作流系统,以帮助你将项目从原型阶段推进到生产环境。在本文中,我们将展示一些新的设计概念,并解释其底层实现原理、实现方式以及最重要的原因。同时,我们还将分享在开发过程中积累的关于开发者体验的一些经验教训。
步骤概览
- 00:00 – 引言与“让他们写代码”的哲学
- 01:32 – spaCy 的声明式配置系统
- 06:44 – “自下而上”与“自上而下”的配置方式对比
- 08:35 – 函数注册表
- 12:55 – 类型提示与基于类型的验证
- 13:53 – 使用 Pydantic 进行数据验证
- 18:36 – 模型定义的静态分析
- 22:27 – 总结与结论
SPACY 资源
- 网站与文档:https://spacy.io
- GitHub:https://github.com/explosion/spaCy
- 免费在线课程:https://course.spacy.io
- Thinc:https://thinc.ai
本文相关资料
- “让他们写代码”演示文稿:https://speakerdeck.com/inesmontani/l…
- “让他们写代码”视频:[相应链接]
- spaCy v3.0 的新功能:https://spacy.io/usage/v3
- Catalogue 库:https://github.com/explosion/catalogue
- Pydantic:https://github.com/samuelcolvin/pydantic
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
879

被折叠的 条评论
为什么被折叠?



