写了一篇本篇的续,可以自动创建PV:https://blog.youkuaiyun.com/pushme_pli/article/details/88561261
今天装好了Kubeflow,准备玩一个E2E的case。 按照Kubeflow的设计,它拥有全生命周期的ML/DL的开发和部署,也就是说囊括了
模型编写 --- 模型训练 — 超参搜索 — infrerence部署等全流程的支持,我决定试一试,当然从第一部开始,代码编写,现在看起来,这个开端并不容易!
在kubeflow中对于代码编写提供了业内最为著名的在线类IDE:Jupyter Nodebook的多用户版本Jupyter Hub, 使用随便一个名字登录后见下图:
看起来是要求Spawn一个盖用户自己使用的Server,事实上也是如此, 会在k8s中新建一个名为jupyter-${username}的pod。
我选择了默认配置,直接点击Spawn, 糟糕的事情发生了,页面一直卡着如下图:
别等了,放任不管的话会卡30min,别问我怎么知道的。
这时候我们查看k8s中的pod: