数据检查与验证:从基数到序数和名义数据
1. 基数数据检查项目
首先,我们有一个检查基数数据属性的项目。该项目需要一个 notebooks
目录。以下是一些详细信息:
- 检查模块重构 :鼓励将 samples_iter()
、 non_numeric()
和 numeric_filter()
等函数重构到一个单独的模块中。同时, AttrSummary
类和密切相关的 summary_iter()
函数也适合移到一个包含有用检查类和函数的单独模块。可以将这个模块放入 notebooks
文件夹以便于访问,也可以将 src
目录添加到 PYTHONPATH
环境变量中,使其在Jupyter Lab会话中可用,还可以通过在终端使用 ipython profile create
命令创建一个IPython配置文件,在其中添加启动文件夹并包含将 src
目录添加到 sys.path
的脚本。
- 模块单元测试 :从笔记本重构到单独模块的各种函数需要单元测试。很多函数会有 doctest
示例,整个笔记本会有一个 doctest
单元格。可以使用 pytest
命令的 --do