python开发简介：编码规范与工程基础实践

shiter

已于 2022-07-08 19:03:10 修改

阅读量1.0k

点赞数

CC 4.0 BY-SA版权

分类专栏：自然语言处理实战入门【Generative AI重制版】基于大数据的机器学习原理与最佳实践大数据机器学习实践探索文章标签： python 自然语言处理开发语言

于 2021-12-17 23:43:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wangyaninglm/article/details/122005563

自然语言处理实战入门【Generative AI重制版】同时被 3 个专栏收录

140 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

大数据机器学习实践探索

130 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

基于大数据的机器学习原理与最佳实践

84 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

文章大纲

Python编码规范
pycharm 自动优化代码规范插件：pylint
python 文件头
如何编写高质量的代码：effective python
python 样例脚手架
参考文献

工欲善其事，必先利其器，熟练掌握python开发环境，虚拟环境，anaconda 等数据科学软件的使用技巧才能令自然语言处理工作游刃有余。

正则表达式，是处理自然语言的基础技术手段，学习和掌握正则表达式的相关技术可以迅速提取复杂文本中的有效信息，以便后续进行文本发掘。

网络爬虫，目的一般是为了原始数据积累，语料积累。有了语料和素材我们就可以针对爬取获得的数据，实战化的进行一些有针对性的分析。在实际应用中，我们往往做自然语言处理的第一步就是使用网络爬虫进行分析语料数据的积累。

语料与NLP常用资源，语料库协助算法对语言进行分析和建模，它的规模和质量可以在很大程度上决定模型算法的质量。在工程构建的过程中起到地基的作用。

Python编码规范

由于机器学习相关算法主要以python编写，本书也主要以python3.6为例进行算法实现的说明。规则的作用是避免混乱，当一个项目接受来自多个项目代码贡献者的代码，如果代码的风格不一致，会给代码阅读者和其它代码提交者造成不小的困扰。PEP8给出了组成主Python发行版中标准库的Python代码的编码约定。编码规范包含代码布局、命名规范等几个类别的注意事项，详细内容可以参考本章的链接[5-7]，本小节提供工程实战中重要的几点并加以着重阐述。

代码布局

有关缩进的建议是不要用tab, 也不要tab和空格混用。对于行连接的情况, 你应该垂直对齐换行的元素(见行长度部分的示例), 或者使用4空格的悬挂式缩进(这时第一行不应该有参数):
代码清单代码布局样例

<

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

shiter 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。