【深圳出差感想】出差就是一场有限时间内的综合卷考试

本文由Markdown编辑器编辑完成。

文章封面图由豆包AI生成,提示词: “帮我生成图片:北京的标志性建筑,和深圳的标志性建筑,然后再加一个坐飞机出差的标志,比例 4:3.”

1.前言:

本周我作为研发,和产品经理,商务经理,一起去深圳一家医疗设备厂商出差。我的主要任务是在对方的一台医学影像工作站上面,安装我们的AI软件服务。

我们的AI软件服务,本来是搭载在Ubuntu服务器上面的软件服务。而对方的影像工作站,是在windows平台上运行的。我们公司产品在医院的运行模式一般是,医生从工作站上面推图到我们的Ubuntu服务器,待AI预测完成后。医生可以通过一个悬浮的小程序,点击后,自动打开Google浏览器,查看当前检查的AI预测结果。
在这里插入图片描述

但这样部署的问题是,每次现场部署,都需要配备一个搭载Ubuntu系统的服务器。而设备厂商,希望我们能够给出一套,可以直接在搭载影像工作站的windows系统上部署我们AI软件服务的解决方案。

为了解决将在Ubuntu(Linux)系统下面运行的软件服务,直接在windows上面运行,主要有两种方案可选。Hyper-v和WSL2,经过一些前期的调研和测试,我们研发选择了WSL2的方案。
在这里插入图片描述

经过在公司将近1周多的测试,基本完成了在windows上面部署我们服务的目标,除了一些附加功能和页面,由于时间限制,还未解锁外,基本达到了在客户现场安装和demo演示的目标。

由于是一种全新的部署方式,因此产品经理和商务,希望让我在客户现场,实地部署一下,因为很多问题,可能在真实的环境时才会暴露。

2. 公司内的模拟考试

为了能够在出差的有限时间内,尽量快的完成部署任务,以留出充足的时间,让产品经理给客户进行demo的演示和讲解工作。我在公司进行了一定的模拟。

因为我之前测试时,都是在windows 11操作系统上面进行。而通过远程查看,对方工作站所在的windows, 还是windows 10, 且关闭了自动更新。导致对方的系统版本,远低于我测试时的windows版本。

在这里插入图片描述
<客户现场的windows系统版本>

为了能够真实模拟在windows 10系统上的部署情况,我和产品经理请公司的IT, 专门找了一台空闲服务器,安装了一个win10的操作系统。但是由于是临时部署win10, 所以后面发现我们部署的win10的小版本,还是win10里面比较新的版本,也还是高于对方的小版本的。

但有总比没有强。

于是在出差的前一周周五,我才开始在win10上面进行模拟部署。果然,在win10上面部署时,很多之前在win11上面,可以运行的wsl指令,在win10上面都失效了。因此,我又开始研究,在win10上面如何部署WSL。经过2~3个小时的研究,终于赶在了周一下午要打车去机场前,完成了win10上面的部署和调试。这样心里面稍微踏实了一些。

3. 进入客户现场前的准备

星期一下午16:30 ~ 20:00, 我们一行三人坐飞机到达深圳宝安机场,紧接着又打车到距离机场20km左右的宾馆。办理完入住手续后,已经是晚上9点半。我和产品经理又商量起了第二天的部署过程。

在上飞机前,我们联系了设备厂商,希望他们的IT工程师,能够帮忙升级一下他们工作站的windows系统,升级到比较新的版本。但是当我们到达深圳,再次远程他们的工作站后,系统还是和原来一样,并未得到升级。
在这里插入图片描述

系统如果无法按预期升级,那么安装和部署过程中,就可能会遇到很多未知的问题。为了尽量减轻第二天的工作量,产品经理和我开始研究起了怎么升级他们的windows系统。当然也是在得到了他们的同意说,他们的工作站是可以正常工作在较新的windows 10系统上的。

终于我们通过下载了一个windows专门提供的升级助手(https://support.microsoft.com/zh-cn/topic/windows-10-%E6%9B%B4%E6%96%B0%E5%8A%A9%E6%89%8B-3550dfb2-a015-7765-12ea-fba2ac36fb3f#id0efd=windows_10),经过了将近1个多小时的时间,升级到了windows 10 22H2版本。这些操作完成后,基本已经快到晚上11点多了。
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
通过windows 10更新助手更新后,客户的系统,已经升级到了最新的Windows 10, 22H2的版本了。

4. 客户现场部署和演示

第二天便是正式的到客户现场安装部署了。我和产品经理基本是他们公司早上8:30一上班就到了。产品经理联系了对接人,简单见面寒暄和交待后,我们便投入到了紧张的部署工作中。

4.1 更换磁盘——使用我们携带的SSD

首先为了确保移植到客户服务器上面的WSL+Ubuntu24.04+AI的服务能够快速运行,我们自己携带了两块三星的SSD(一块500G, 另一块250G备用)。于是我们开始把SSD, 固定在服务器的硬盘插口上,通电,开机,查看"我的电脑"。结果鼓捣了半天,来来回回插了两三遍,T5820的服务器上面始终无法识别到我们的SSD。后来无奈,只能先把他们的一块东芝的机械盘取下来,再替换成我们的SSD, 终于被识别了。看来是服务器的第四个硬盘插槽坏了。

过了一会儿,产品经理和商务经理,都和客户去会议室开会,讲解我们公司的产品了。我开始独立操作。先是在磁盘管理器, 把SSD格式化后,在服务器上面新分配了一块新的盘符。然后将我们携带的移动硬盘中,导出的WSL+Ubuntu24.04的AI服务包,导入到新插入的SSD盘中。

然后大概快11点的时候,终于把大小约180G的包,导入到了SSD中。启动WSL后,遇到了容器无法自动启动的问题。每处理掉一个问题,有时候又会冒出一个新的问题。中间也改了一些docker的配置。虽然暂时解决了一些问题,但是却也留下了一些隐患。

由于要用到WSL2的一些指令,所以需要先运行wsl --update的指令。
在这里插入图片描述
但是由于客户的服务器,关闭了自动更新,且更新时,也无法接收其他Microsoft产品的更新,导致我在运行wsl --update的时候,出现了报错。

后来我又远程查看了一下,之前在公司安装的win10上面的,关于"windows更新"的各项配置。最终按照公司的配置,修改了客户的服务器上面的更新的配置后,终于可以开启自动更新,以及更新时,也可以接收到来自其他Microsoft产品的更新了。

这时看到了,在更新界面,windows开始下载很多的更新补丁文件。我们都知道,当windows下载了很多补丁文件的时候。当点击重启时,就会有两个选项。一个是“重启”,一个是“更新并重启”。由于我当时比较着急,希望重启后,尽快进入界面来测试。因此我一直没有选择“更新并重启”。这意味着,我虽然下载了很多的windows更新文件,但实际上却没有应用。

在这里插入图片描述
在这里插入图片描述
(为了解决docker服务无法自动启动的问题,修改了docker的配置文件,引起了后面更严重的问题)

在这里插入图片描述

快到下午1点的时候,遇到了一个很严重和致命的问题。就是我们通过docker-compose.yml, 通过ports映射出来的端口,在宿主机上面均无法被访问到。这意味着,需要在浏览器上面查看的页面,均无法给客户展示。

就这个问题,我在那里来来回回鼓捣了快2个小时都没有完成。期间产品经理也在帮我想办法,客户那边的经理,也过来询问进展。我也只能在那里不断地尝试。

商务经理由于第二天还有别的事情,于是先买好了下午4:30的回北京的飞机。并叮嘱产品经理和我,希望这次能够彻底解决了问题再回北京。毕竟大老远的来一趟也不容易。

眼看着时间一点点流逝,客户下午5点半就下班。我只能和产品经理说,希望找北京的负责线上团队的同事帮忙看一下了。在简单的沟通目前遇到的问题后,线上同事很快便定位到了问题。原来是我在解决前面docker服务无法自动启动的问题时,修改了docker服务的配置,引起了后面的这个问题。同事帮忙把我修改的配置删除后,再启动docker服务,便可以正常的访问了。前后也就用了十几分钟,而我一个人却在那里研究了将近两个小时都无法解决。

这个问题解决后,后面的问题便迎刃而解了。看了一下时间,已经是下午4点多了。产品经理赶紧了客户进行了沟通,进行了基本的演示。而且完成了从同一台windows的工作站上面,推图到当前这台服务器的AI预测服务,很快便完成了预测。客户对我们的服务的表现,还是比较满意的。并说,下周会专门进行相应的性能和其他测试。

我和产品经理,便赶紧准备买当天晚上的飞机回北京。而离飞机飞行前的机票是最贵的了,都不打折。从北京来深圳时的机票,只有1200多,而从深圳回北京的机票,则3000多。而第二天上午回北京的机票也不打折。经过一些权衡,最终我和产品经理,坐当晚9点多的飞机,经过2个多小时的飞行,回到了北京,已经是快凌晨12点了。

这场在客户现场的考试,最终还是有惊无险地完成了。虽然为了这场考试,我们在公司进行了几次模拟考试。但是,当在现场进行考试时,还是遇到了很多棘手的问题。最终通过请求场外帮助的方式,终于完成了这次考试。

事后进行复盘,还是有一些环节,可以进行优化,不至于整个过程搞得这么紧张,这么狼狈。

1> 由于windows系统,不同版本之间的差异蛮大。虽然我在公司的win10上面成功完成了部署,但是那是在各项更新都已经运用的情况下。在客户的现场,虽然win10系统,已经升级到了,和我在公司模拟时相同的22H2。但是,很多补丁,似乎并没有被安装。我为了打开客户windows上面的自动更新,修改了好多配置都没有生效。幸亏我当时通过远程比较了一下,公司的win10服务器,和客户的win10服务器,在“windows更新”方面的配置,按照公司的配置修改后,终于开启了自动更新。

2> 欲速则不达。虽然我已经开启了自动更新,而且也下载了很多windows的更新补丁。但是我为了更快地完成部署,在"重启"和“更新并重启”时,我直接选择了“重启”。导致下载的那些更新补丁,实际并未被应用在客户的系统里面。直到我在客户现场部署时,遇到了一个问题,提示必须要升级WSL到特定的内核版本才能解决。我才无奈,选择了“更新并重启”。在经过了5~10分钟的艰难等待后,并且重新安装了wsl_update.msi文件后,客户的windows系统的WSL内核,才终于从之前的5.x, 升级到了6.x. 而升级到了6.x的WSL版本后,就和我在公司模拟时使用的版本完全相同了。所以,环境和版本的一致性,在windows上面,还是非常重要的。

3> 请求外援的时机。一个docker的问题,前后卡住了我将近2个多小时,一度中午饭我都没有出去吃,而是产品经理给我带了点麦当劳解决。这个docker的问题,缘于我在慌乱解决docker启动问题时,不小心修改了docker的网络配置,导致了docker ports配置失效的问题。请求外援前,一方面是娴麻烦,因为还要和对方说明很多来龙去脉;一方面是自己过于自信,总觉得自己能够解决所有问题。另一方面内心也比较紧张,毕竟这道题,在之前的模拟中,都从来没有出现过。结果和线上同事沟通后,人家不到10分钟便解决了。

4> 在解决问题时,修改了哪些配置,一定要记住。否则,那么遗留的配置,很可能会引起很多新的问题。解决问题,一定要尽量抓住问题的本质。而这缘于你的经验。当你遇到的问题越来越多,解决的问题也越来越多,那么遇到新问题的概率就会降低,就不会那么慌乱。这也就是为什么在考试前,要进行很多的模拟考试。高考前,要做很多的历年的真题,当你见到的问题越来越多时,当你把那些问题都解决了,那么成功的机率也就越来越大了。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

inter_peng

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值