1. 写在最前面
似乎有很多为「粗心」犯错,而开脱的理由,比如:
-
人非圣贤,孰能无过
-
知错能改善莫大焉
但是事实真的如此吗?依稀记得很久之前自己思考过,其实有很多职业是一点粗心都允许出现的。比如:
-
作为医生,如果粗心,那就可能将患者的置于「失去生命」的危险中
-
作为核工程师,如果粗心,那就可能带来无法挽回的「核事故」风险
-
……
软件开发工程师,虽然不要求对粗心零容忍,但是也要时刻警醒自己「已经犯过的错,不能再犯第二次」。尊重别人的时间也是一种美德。
2. 粗心记录
粗心的地方有两处:
-
没有认真 review 同事的出包 Dockerfile:
-
导致用错了 Dockerfile 的 ADD 关键词的语法问题没有提前被发现
-
导致拷贝了 python 依赖的 libonnxruntime.so.1.17.1 动态库,但是没有更新动态链接库配置,导致系统无法找到库文件位置
-
-
测试的时候只看了转录效果,但是没有认真查看服务的日志
2.1 出包脚本问题
问题一: 同事写的的 Dockerfile 里,用 ADD
关键字,将需要测试的 .zip
包进行了拷贝,并且期待它会解压到对应的目录中。
失效原因: Docker 的 ADD
指令支持自动解压缩 .tar
、.tar.gz
、 .tar.bz2
、.tar.xz
文件,但不支持解压缩 .zip
文件。这个功能在 Docker 的早期版本就已经存在,具体来说,自 Docker 1.0 版本起就支持这些格式的自动解压缩。
正确做法:
-
在 Dockerfile 里在 base 镜像里,安装 zip 命令
-
显示运行 unzip 解压包的命令
问题二: 由于出包的镜像里缺少了 libonnxruntime.so.1.17.1 库,同事从其他存在该库的镜像中拷贝到了镜像里,但是更新动态链接库配置,导致库存在,但是程序在引用的时候,还是返回无法找到。
失效原因 : 没有在镜像里更新动态链接库的配置
正确做法: 更新 ldconfig 动态链接库的配置方式如下:
-
echo "/usr/local/lib" | sudo tee /etc/ld.so.conf.d/onnxruntime.conf
-
sudo ldconfig
借用伟大领袖的一句话,「实践是检验真理的唯一标准」,不能因为开发同事的积累更丰富,就默认写出的代码没有任何问题。「不攀附、不盲从,遇事有自己的判断和想法」这很重要。
2.2 复测行为确认的粗心
由于上文中所记录的原因,「预期使用新版本的包进行效果测试,但是由于没有正确配置,导致了误用了上个版本的包。」
但是这个问题是可以在测试效果行为的时候被发现的,不必让测试的同学测试一天后反馈的时候,研发才发现此问题。根因还是笔者测试的时候,进入了想当然的惯性思维,只检查了效果是否符合预期,但是没有做日志版本的检查。
注:惯性思维是一种可怕的行为,它似乎就好像是温水煮青蛙一样,让你变得不再对新事物充满好奇,不自觉的抵制解除新的改变,这真的很不好!
2.3 感悟
「浪费别人的时间,与谋财害命无异」,希望自己能引以为戒,再以后避免类似问题的出现。遇到事情知道就勇敢的说出自己的观点,不知道也不能攀附盲从,觉得大佬写的一定没有问题。
注:周五要请测试的小姐姐一起喝下午茶,简单弥补一下自己的错误产生的伤害。
3. 碎碎念
上海的气温真的是一秒入冬,真的寒冷的一天,看起来要开始喝热水了。
-
你不会的东西,觉得难得东西,一定不要躲,先搞明白,后精湛,你就比别人优秀了。因为大部分人都不舍得花力气去钻研,自动便被淘汰,所以你执着的努力,就占了大便宜
-
真正聪明的人,从来不说难听的话,因为人性不需要听真话,只需要听好听的话。
-
你看天上的云聚了又散,散了又聚,人生离合,亦复如斯
-
物物而不物于物