构建MLOps命令行工具与微服务实践
1. 命令行工具的数据检查与警告
在处理CSV文件时,我们可以使用命令行工具进行数据检查。以下代码展示了如何检查未命名列和包含回车符的字段,并给出相应警告:
if unnamed:
click.echo(f"Warning: found {unnamed} columns that are Unnamed")
carriage_field = carriage_returns(df)
if carriage_field:
index, column, field = carriage_field
click.echo((
f"Warning: found carriage returns at index {index}"
f" of column '{column}':")
)
click.echo(f" '{field[:50]}'")
要测试这个检查,可以从相关仓库下载包含回车符的示例CSV文件,然后使用 csv-linter 工具进行检查:
$ csv-linter carriage.csv
Warning: found carriage returns at index 0 of column 'notes':
'Aged in French, Hungarian, and American Oak barrel'
<
超级会员免费看
订阅专栏 解锁全文
2218

被折叠的 条评论
为什么被折叠?



