
巩固与修炼
每天八小时
加油,期待明天的自己
展开
-
巩固与修炼(一)
总结一下这两天的学习过程昨天研究了TensorFlow镜像,并根据官方镜像修改了jupyter notebook中的文件目录与默认密码的修改注:这里从尝试使用脚本来完成,结果失败,由于需要使用Python,在打开的命令中设置密码,并将生成的hash键值即sha1值提取(这里失败了好久好久),并将其放置jupyter的配置文件中运行镜像并在jupyter中进行pyth原创 2017-11-07 23:13:43 · 249 阅读 · 0 评论 -
巩固与修炼(二)
总结一下今天的学习过程五个字:崩溃的一天看prometheus与Grafana官方文档,有点晕,不过还好,大致学会了基本使用,能像监听进程似的将数据pull下来,进行查询与现实结合Grafana将prometheus收集的数据,进行筛选显示重要的失败的是:不能使用prometheus与Grafana监听kubernetes中运行的pod,也可以说是容器太无奈了,去了ku原创 2017-11-08 23:12:20 · 173 阅读 · 0 评论 -
巩固与修炼(三)
总结一下今天的学习过程上午继续试验昨天的找到的文章,使用prometheus监控kubernetes中的进程与容器,中午又请教了师兄,给我一篇文章,参考之后,搭建成功文章地址:http://blog.youkuaiyun.com/zqg5258423/article/details/53119009 非常感谢下午看了Prometheus网站的query语法,操作符、函数、样例等晚上和另外一个对原创 2017-11-09 22:31:38 · 174 阅读 · 0 评论 -
巩固与修炼(四)
总结一下今天的学习过程小注:前天由于一些杂事以及听报告和参见研一的迎新晚会(虽然我已经研二了,哈哈),昨天由于61周年校庆,在老校区听了讲座并学习今天算是颓废的一天吧,睡到日上三竿。。。(弥补前两天的睡眠不足)看了好几篇文章、博客踩了三个坑:1,jupyter几乎在语法上不区别Python2.X还是Python3.X,代码都能运行,但是在容器内部,使原创 2017-11-12 22:28:17 · 201 阅读 · 0 评论 -
巩固与修炼(五)
总结一下今日的学习过程碰到一个问题,不能解决:使用yaml部署四个pod,两个ps,两个worker,分布在一个集群两台机器上,分别为一个ps一个worker部署在一台机器上,使用docker exec命令进入四个pod中,运行Python程序,神奇的是:从节点运行一段时间后,两个pod莫名其妙的从从节点中消失了,又转义到主节点上了??????奔溃看了网易云公开课的视屏,看了一讲云计算原创 2017-11-13 23:57:07 · 169 阅读 · 0 评论 -
巩固与修炼(六)
总结一下今天的学习过程今天将网易云课堂的关于容器云与kubernetes结合的有关监控的Prometheus视频,感觉白交一张緑票了,讲的跟念书似的,重点一个没讲明白。。下午继续做相关的实验及学习了解在kubernetes中的常见的yaml文件编写的规则及语法看了一下kubernetes的文章有关容器会自动关闭的问题:在从节点跑程序,会自动终止,容器也会相应的退出,程序是没有问原创 2017-11-14 23:48:30 · 166 阅读 · 0 评论 -
巩固与修炼(七)
总结一下近五天的学习周三调了一天的参数,并尝试将单机式的CNN测试mnist数据集的程序修改成分布式的程序,结果不理想,没能成功周四出差去了一趟南宁周五接待Aneka平台工程师,并学习关于Aneka云平台的使用周六继续周三的事情,接续调代码,感觉自己好戳,,,,今天去老校区参加我们院里第一届人工智能大会,听了五场报告,并在其中一场进行了与教授的互动,提出了自己的疑惑,不过好像没原创 2017-11-19 23:20:52 · 175 阅读 · 0 评论 -
巩固与修炼(八)
总结一下昨天与今天的学习程序前天使用TensorFlow的分布式函数编写分布式程序,一直困惑不能结束死循环,不能在设定的步骤范围内停止昨天调了半天CNN架构的mnist程序,一直不能分布式执行,在那个配置比较差的机器上跑ps与wk,单个来跑CNN程序,结果失败,导致容器崩溃,姑且认为是内存与CPU配置过低不能承载程序换个思路,找了一个简单的mnist程序,改变成分布式程序,两个都能分布原创 2017-11-21 21:07:15 · 199 阅读 · 0 评论