远程办公 4 大坑,坑坑“致命”!

受疫情影响,远程办公成为新常态,但需求激增导致办公软件集体宕机,信息安全问题频发。远程办公系统的分布式特性受到CAP不可能三角制约,设计难度高。此外,标准缺失和技术挑战阻碍了远程办公的普及。

作者 | 马超

责编 | 胡巍巍

出品 | 优快云(ID:优快云news)

受新冠肺炎的疫情影响,为避免病毒扩散,许多地方都实行严格的控制手段:封村、封路、封小区、暂停省际、县级、村级班车等措施。

在《国务院办公厅关于延长2020年春节假期的通知》中,春节假期已经延期至至2月2日,北京、上海、广东等多地继续延长假期。

由于科技巨头自带与计算机打交道的基因,更适合在家远程办公,比如阿里巴巴、腾讯和百度的员工,都是2月3日至7日在家办公,暂定2月10日正式回工作地。

2月3日,沪深三大股指全面调整的情况下,云办公板块,却是少数逆市上涨板块之一。有不少网友惊呼,这场疫情竞让我国提前迈向远程办公时代。

需求来势汹汹,办公协同软件集体宕机

虽然各大IT巨头,近段时间都在力推自家旗下的远程办公产品:例如企业微信、钉钉、华为云WeLink先后发布远程办公指南。

字节跳动旗下办公套件飞书,也迅速上线“线上办公室功能”,提供远程办公相关配套服务。

但是从实际情况来看,大家还是小看了远程办公的实际使用需求,在2月3日正式开工后,笔者在实际使用中发现企业微信和钉钉等远程办公软件,接连出现故障。有的远程办公软件长时间不能正常登录,也有人掉线就再也进不来。

对此企业微信表示,“数千万用户同时使用【会议】功能,网络出现拥堵。我们已紧急修复了网络,并做了扩容处理,现在已经恢复,欢迎再次尝试使用~”

钉钉也在官微上表示,“新年开工,海量企业和组织的早会全面开展,瞬间同时发起海量各类会议直播,网络暂时出现限流。我们通过紧急调配支持,目前已恢复。”

不仅公有云的协同办公软件如此,由于不少企业都要求使用VPN方式,接入行内系统,但是因为VPN容量接入不足,造成行外访问频繁掉线,据笔者单位负责信息安全同事的反馈,仅2月3日一天他接到有关VPN的电话就超过了200通。

远程办公系统难在何处

远程办公属于典型的分布式协同系统,而分布式系统又会受收CAP不可能三角的制约。

CAP不可能三角:是指在一个分布式系统(Distributed System)中,一致性(Consistency)、可用性(Availability)、分区容错性(Partition Tolerance)呈不可能三角关系,既三个目标只能同时做到两点,不可能三者兼顾。

站在远程办公角度来讲,CAP三角并不难理解,因为如果要所有参会者所得到的信息都保持一致、且系统始终可用,那么一旦有人掉线,就只能让整体会议暂停,分区容错性也不会得到满足。

反之,如果有既能满足可用性、又满足有人掉线时会议依然可以继续,那么必然会有信息延迟,而这时参会者的数据一致性,又无法完全保证。

也正是由于CAP不可能三度的限制,才让远程办公系统在设计上,必须做到均衡。但是这样的方案设计起来难度很高,目前笔者还没发现有成熟的产品出来。

远程办公系统难在何处

近日,笔者还注意到这样一条消息,腾讯安全发布提示称:“接到某互联网公司的求助信息,该公司某部门200多名员工电脑被感染病毒,腾讯安全工程师介入后,发现此安全事件是由于该企业在进行远程办公时,某位业务主管使用个人电脑被XRed病毒感染,导致通过该电脑分享的EXCEL文件全部带有该病毒,通过内部工作群分享后,造成信息安全风险扩散。”

在笔者看来,远程办公目前在信息安全方面,还存在以下几点问题:

  1. 远程办公与个人PC的安全边界不清:目前大部分单位都不允许将涉及的资料带出办公场所,但是目前远程办公产品中,还没有看到哪款产品具备将办公区和个人区进行严格隔离的功能,而边界不清的问题,极易导致信息泄露和病毒传播。

  2. 安全加固不足:由于远程协作的终端各类众多,有手机、笔记本、台式机,操作系统也是多种多样。这对于病毒的防控要求很高。针对这点笔者也看了一下,截止目前还未发现哪款主流云办公产品,能够对分享到群内的文件,进行免费杀毒处理。如果分享的文件不安全,那么远程办公产品,也将难以全面推广。

  3. 信息泄密风险:由于网络上的信息传输,存在着被监听、监控可能,虽然通过VPN加密隧道的方式,能够解决传输过程中的安全问题,但是员工远程接入时的周围环境,也存在着泄密可能,无法保证绝对安全,因此远程办公中一定要避免发送任何涉及机密的消息。不过从目前的情况看,大众普遍对于泄密风险认识不足。

  4. 远程办公系统相关标准缺失:目前远程办公还属于是新生事物,相关标准还处在缺失状态,对于终端隔离、云端安全加强及数据传输等方面统一制订标准,才是解决行业乱象的终极之道。

远程办公能否开启办公模式新大门

前阿里巴巴公司总裁卫哲,曾经说过:“没有遇到‘非典’,可能阿里巴巴就没了,‘非典’给阿里巴巴作了最大的推广,当时是每个人被迫都必须要用互联网的。”

2003年,阿里仅仅成立四年,正是“打基础”的关键时期。一位阿里员工由于去广州出差,感染了非典,使全公司员工都在家隔离。

不知道是不是这次闭关,让马云突发打通任督二脉,当年4月,马云在杭州湖畔花园组建秘密团队,并在一个月后正式上线淘宝网。

由于非典疫情,国人不便外出,只能使用互联网,淘宝的诞生恰逢其时,并开启了中国电子商务的黄金时代。

但从目前的情况来看,远程办公的开场白,并不算惊艳。

远程办公究竟是交易员工时间?还是考量员工成果?虽有一些岗位如销售、设计、编程等,非常适合将员工的结果量化,但是也有很多岗位如文秘、综合等很难量化成果。因此远程办公能否全面铺开推广,笔者还持观察态度。

推荐阅读 

OPPO 回应“不务正业”生产口罩;旧款 iPhone 降速被罚 2500 万欧元;Angular 9.0.0 发布| 极客头条

☞惊艳!Uber 的豪华开源深度学习“全家桶”

☞揭秘阿里、腾讯、字节跳动在家办公的区别

只需1分钟,这个网站用AI分离歌曲的人声、伴奏和乐器声

☞深度好文!新浪微博架构师详析微博云原生技术的思考与实践

10 大趋势带你预见 DeFi 2020!

你点的每一个在看,我认真当成了喜欢

别担心,你说“掉坑更严重了”,说明你现在遇到了比原来更复杂的问题 —— 这很正常,尤其是在内核网络栈这种高并发、无错误回滚机制的环境中。我们一步步来 **定位 + 拆解 + 修复**。 请你先告诉我你现在遇到的具体现象和错误信息,我会帮你: 1. 判断是编译问题?运行时崩溃(oops)?软中断卡死?还是性能更差? 2. 分析日志(dmesg / ftrace / crash dump) 3. 给出安全的修复路径 --- ### 🔧 请回答以下几个关键问题(越详细越好): > ✅ 把下面的内容复制粘贴回复我,填空即可 ```text 当前症状描述: - 现象:比如模块加载失败 / 系统重启 / 网络卡顿 / 流量骤降加剧 / dmesg 出现 Oops - 是否能正常加载模块?______(可以/不可以) - 加载命令:_________________________ - 卸载是否报错?_____________________ dmesg 输出关键片段: _______________________________________ _______________________________________ _______________________________________ 代码修改点摘要: - 修改了哪些函数?____________________ - tasklet / NAPI / 定时器是否有调整?_________ - 是否引入了新变量或结构体?_____________ 复现方式: - 如何测试流量?iperf? ping? pktgen? ________ - 测试带宽大约多少?________ Mbps/Gbps - 是否开启硬中断绑定?CPU 绑定情况?_________ 其他线索: - 是否出现 soft lockup?watchdog 报错?_______ - ksoftirqd CPU 使用率是否飙升?________ - 是否尝试过用 ftrace 跟踪?结果如何?_______ ``` --- 等你提供这些信息后,我就能精准判断你是: - ❌ 掉进了 **tasklet 重入陷阱** - ❌ 触发了 **竞态条件导致 skb 泄漏** - ❌ 引发了 **softirq 死循环** - ❌ 或者只是 **编译配置不匹配** 然后我会给你一个 **最小可恢复补丁 + 安全调试方案** --- 在此之前,我可以先预判几个你可能踩中的“深度内核大坑”👇 --- ## ⚠️ 常见“掉坑更严重”的 5 种情况及应对策略 | 掉坑类型 | 表现 | 解决方法 | |--------|------|---------| | 1. `tasklet` 中调用 `netif_receive_skb()` 导致无限递归 | soft lockup, CPU 100% | 改为 `napi_gro_receive()` 或使用 NAPI | | 2. `skb` 被重复释放或未克隆直接入队 | Oops, "bad slab pointer" | 入队前 `skb_clone()`,出队后 `kfree_skb()` | | 3. `this_cpu_ptr()` 用错 percpu 变量 | 访问非法地址,Oops | 确保 `qos_tasklet` 是 `__percpu` 类型 | | 4. 在原子上下文中睡眠 | kernel panic: "in atomic context" | 不要调用可能休眠的函数(如 kmalloc(GFP_KERNEL)) | | 5. tasklet 被频繁调度但处理不完 | softirq backlog 上升,延迟激增 | 改用 NAPI 或增加 budget 并主动让出 | --- 等你补充信息后,我会立刻给出针对性解决方案。 现在,请把上面那个模板填好发给我 👇 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

优快云资讯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值