• 博客(121)
  • 收藏
  • 关注

原创 【银河麒麟高级服务器操作系统】安全配置基线相关分析全过程及解决方案

现象描述:安全基线在银河麒麟高级服务器操作系统V10 sp2和V10 sp3能生效,在V10 sp1-0518系统版本上添加如上内容未生效。系统测试分析情况,可知,在银河麒麟高级服务器操作系统V10系统中,限制实现只有属于wheel组的用户才被允许使用su命令来切换到root用户这个安全基线功能,是需要在/etc/pam.d/su配置文件的pam_wheel.so模块后面,通过追加use_uid这个模块配置参数实现的。

2024-10-10 10:31:39 4874 1

原创 【银河麒麟高级服务器操作系统】虚拟机服务器执行systemctl提示timeout——分析全过程及处理建议

了解全新产品,请点击访问产品信息产品名称银河麒麟高级服务器操作系统(海光版)V10ISO环境信息主机型号虚拟机systemd崩溃,后续systemd连接异常,systemctl失败。需要查明systemd崩溃原因根据sosreport中的messages信息,systemd发生了coredump,收到了信号SIGQUIT。见图2.1.1图2.1.1使用gdb分析systemd的coredump文件,显示systemd是收到了SIGQUIT后发生的coredump。并未调用错误处理函数。

2024-09-10 11:34:47 1758 1

原创 【实际案例】服务器宕机情况分析及处理建议

现象描述:生产环境arm V7.6物理机在2024年 4月7号08:49分钟左右宕机(自动重启恢复),生成vmcore文件。处理建议:针对该问题建议应用方排查下相应java进程是否存在对大量小文件的目录进行遍历操作,以及根据实际需求看是否考虑关闭kernel.softlockup_panic。

2024-08-07 15:42:43 1771

原创 【操作指南】银河麒麟高级服务器操作系统内核升级——基于4.19.90-17升级

【操作指南】银河麒麟高级服务器操作系统内核升级——基于4.19.90-17升级

2024-05-06 09:38:34 10390 5

原创 【银河麒麟操作系统】ptmalloc内存释放原理及优化方案

ptmalloc系统参数的设置,根据现提供业务信息分析,

2025-04-03 10:00:55 587

原创 【银河麒麟高级服务器操作系统 】虚拟机运行数据库存储异常现象分析及处理全流程

虚拟机部署v10sp2系统,宿主机为欧拉定制系统。虚拟机运行Vastbase数据库软件,在03:10:04数据库执行了对表dwd_rq_jg_xjjl_all_delta_1824281295409119232(对应物理文件11747991)的删除操作,08:00:17数据库将数据写入表t_yh(对应物理文件11749618),在次日08点,读取表t_yh时异常。同时由于虚拟机的数据存储过程涉及到宿主机及网络存储,不排除数据库存在故障,或云平台存储故障,导致数据丢失,还需数据库厂商及云平台厂商进一步排查。

2025-03-28 11:08:43 423

原创 打造智算引擎!银河麒麟智算操作系统是专为AI时代设计的操作系统

传统审校依赖人工逐字核查,千页文档需3-5人日且存在漏检风险(错误率5%),而智慧审校通过优化LTP、ResNet、Diffusion等十大模型,实现千页文档小时级自动化审查,敏感信息识别准确率达99.8%,审校效率提升百倍;依托基于银河麒麟智算操作系统的国产智算底座,保障全链路数据安全,杜绝技术“后门风险”;实现了GPU拓扑感知调度,支持多机多卡拓扑感知调度。,既保证了底层算力的高效供给,又降低了中层AI工程化门槛,还完成上层AI应用的敏捷创新支撑,形成从基础算力到场景价值的完整转化闭环。

2025-03-13 15:21:50 283

原创 【银河麒麟高级服务器操作系统实例】虚拟机桥接网络问题分析及处理

由此可知,由于使用team0(roundrobin )模式,虚拟机arp广播报文,经vnet0进入网桥,此时网桥mac学习到虚拟机的mac地址对应vnet0的port,此时fdb表是正确的。V10SP2系统,使用kvm运行虚拟机,如果是物理机两个网口做成一个team,然后team接网桥,虚拟机再通过这个网桥连接网络,这种方式网络会有问题。实际测试下来,确实会发现网络不通,此时如把team1从网桥删掉,换成物理网口,网络就可以正常使用,单独配置team,也可以正常使用。物理机/虚拟机/云/容器。

2025-03-07 16:28:18 829

原创 【银河麒麟高级服务器操作系统实际案例分享】数据库资源重启现象分析及处理全过程

更多银河麒麟操作系统产品及技术讨论,欢迎加入银河麒麟操作系统官方论坛了解更多银河麒麟操作系统全新产品,请点击访问麒麟软件产品专区:https://product.kylinos.cn开发者专区:https://developer.kylinos.cn文档中心:https://document.kylinos.cn处理器:整机类型/架构:x86_64【内核版本】【OS镜像版本】

2025-03-04 11:30:58 624

原创 【银河麒麟高级服务器操作系统】服务器测试业务耗时问题分析及处理全流程分享

对比每个ConsumeMessageT线程cpu使用率,两套环境比较接近,最高都在12%左右,但是统计多个时间点活动的ConsumeMessageT进程数量,hygon_kylin环境中有107-135个,intel_redhat上只有71-105个,猜测cpu使用率可能跟测试程序拉起的ConsumeMessageT线程数有关,具体可能跟测试程序关系更大。针对intel_kylin组合业务耗时特别高的问题,分析1000线程数业务测试具体数据,如下图,copy事务最高耗时达到781s,平均4s多。

2025-02-28 16:56:53 907

原创 【详细指南】如何在银河麒麟操作系统上使用DeepSeek?

最近国内AI大模型DeepSeek爆火,相信使用银河麒麟操作系统的用户也非常急迫的想体验一把,接下来,一文给大家介绍在银河麒麟操作系统玩转DeepSeek的四种场景!

2025-02-14 17:21:15 3368 3

原创 【银河麒麟高级服务器操作系统】服务器卡死后恢复系统日志丢失-分析及处理全过程

【银河麒麟高级服务器操作系统】服务器卡死后恢复系统日志丢失-分析及处理全过程

2025-02-13 13:57:59 517

原创 【银河麒麟高级服务器操作系统】系统日志Call trace现象分析及处理全流程

日志中出现的问题表明在这个过程中,内存链表操作发生了损坏,导致内核警告,且伴随提示丢失了40多万行的内核日志信息,记录的情况也已经不是问题的第一现场,出现链表检测错误告警后并不会进行修复,在接下来使用到问题链表时,依旧会出发告警情况。日志系统进行预分配,需要在tmpfs中进行,且伴随内存页的迁移情况,其中伴随page->lru链表的告警的信息输出,由于日志系统存储在tmpfs中,也造成一定的hang住情况,丢失了不少内核信息,也丢失了问题第一现场。分析sa日志,磁盘读写延迟非常高。

2025-02-06 15:27:14 887

原创 【银河麒麟高级服务器操作系统】业务访问慢网卡丢包现象分析及处理过程

DSCP(DifferentiatedServicesCodePoint,差分服务代码点)是一种用于网络报文优先级分类的标记,使用每个数据包IP头部的TOS字段进行标识,通过不同的编码值来区分不同优先级。网卡品牌是:Mellanox,有多个优先级缓存区(8个,优先级0-7)。通过mlnx_qos工具将不同DSCP绑定到不同优先级缓存区,以设置具备不同DSCP的报文走哪个优先级缓存区。服务器业务访问很慢,可能存在网卡丢包,交换机侧有收到反压帧(有反压帧,说明服务器网卡的接收缓存区可能满了)。

2025-01-20 15:36:48 988

原创 打造服务保障标杆典型示范案例!麒麟软件再获殊荣

近日,2024年信息技术产品服务保障案例征集结果发布。麒麟软件“某大型国有银行服务器国产操作系统批量运维案例”成功入选。

2025-01-14 10:25:51 226

原创 2024 Linux kernel补丁贡献量出炉:麒麟软件在中国企业名列前茅

2024年Linux kernel社区补丁贡献数量及排名“揭榜”。根据Linux kernel社区官方数据累计,麒麟软件补丁贡献数量入围中国企业前五。

2025-01-14 10:24:05 335

原创 【银河麒麟高级服务器操作系统】服务器异常重启故障分析及处理建议

【银河麒麟高级服务器操作系统】服务器异常重启故障分析及处理建议

2025-01-06 14:10:07 1201

原创 【银河麒麟高级服务器操作系统实例】tcp半链接数溢出分析及处理全过程

在高并发压测下出现这种问题,推测是应用程序端问题,建议应用端排查,如全连接队列长度由 net.core.somaxconn和listen(fd, backlog) 的backlog两者最小值决定,如果listen函数传参backlog太小会导致这种现象。sar -B -f sa27,查看内存回收情况,问题发生期间,没有进行内存回收,可见内存资源是够的。sar -rh -f sa27,查看内存使用情况,问题发生期间,还存在空闲内存,且可用内存较多。物理机/虚拟机/云/容器。外网/私有网络/无网络。

2025-01-03 17:21:59 736

原创 【中标麒麟服务器操作系统实例分享】java应用DNS解析异常分析及处理

现象描述:中标麒麟服务器操作系统V7运行在 ARM虚拟机上java业务解析存储域名,出现偶发性失败。对此现象进行全流程分析,通过升级操作系统修复了所遇到的问题。

2024-12-19 14:24:36 1053

原创 【银河麒麟高级服务器操作系统】有关dd及cp测试差异的现象分析详解

现象描述:使用银河麒麟高级服务器操作系统执行两次dd用例后,表现不一致。基于上述的现象,猜测第一次dd没有等待数据完全落盘就结束了;而第二次dd是等待数据落盘之后才结束。

2024-12-13 15:18:10 1065

原创 【银河麒麟高级服务器操作系统】修改容器中journal服务日志存储位置无效—分析及解决方案

现象:systemd做init的容器中journal服务修改日志存储位置无效。经分析发现:镜像中缺少qrencode包,该包是journal日志服务所需要的。本文结合实际案例,给出来建议的解决方案。

2024-12-10 10:56:14 1025

原创 【银河麒麟操作系统真实案例分享】内存黑洞导致服务器卡死分析全过程

追踪Linux系统的内存使用一直是个难题,人们试着把能想到的各种内存消耗都加在一起,kernel text、kernel modules、buffer、cache、slab、page table、process RSS…等等,却总是与物理内存的大小对不上,这是因为Linux kernel并没有滴水不漏地统计所有的内存分配,kernel动态分配的内存中就有一部分没有计入/proc/meminfo中。

2024-12-06 16:20:38 1836

原创 【银河麒麟操作系统运维】某平台多台虚拟机异常重启分析及处理

继续分析vmcore中的堆栈信息,将其梳理如下所示。综合分析,多台机器异常重启的时间点基本一致,这降低了硬件问题的可能性,也不太可能是内核自身的问题。针对该问题我们核对了以往的问题工单,发现在另一个项目上出现过同样的问题,该项目上存在虚拟机大规模在凌晨4:30左右异常重启的问题,与本次虚拟机大规模异常重启时间一致。不同机器在同一时间同时触发异常重启,且在执行不同的内核基础函数时遇到了同一个异常的内存地址,这表明问题原因基本不在系统本身而是有第三方应用、模块等存在如堆栈溢出等异常改写了正常的内存数据。

2024-12-03 16:31:24 1121

原创 【终端加域操作】麒麟天御管控平台客户端常见问题解决方案

麒麟天御安全管控平台目前已经推出V4.1,市场推广范围越来越大,客户对于基本的终端加域操作不熟悉,本文将介绍基本的加域操作、加域过程中遇到的问题及解决方案

2024-11-27 14:44:54 567

原创 【银河麒麟操作系统】技术分析—KASAN讲解与应用

Kernel Address SANitizer(KASAN)是一种动态内存安全错误检测工具,主要功能是检查内存越界访问和使用已释放内存(UAF)的问题。

2024-11-19 11:09:39 681

原创 三管齐下,银河麒麟操作系统续航能力大幅优化

银河麒麟桌面操作系统最新版本在硬件功耗管理、应用功耗管理和高功耗进程管控等方面持续优化,提升电脑续航能力,给您带来更好体验!

2024-11-14 10:47:17 694

原创 效率大幅提升!手把手教您部署/升级天御最新版本

传统的手动式部署升级涉及多个步骤和考虑因素,通常实施前需要进行需求分析与规划、环境检查、建立备份和恢复计划、文档准备等等繁琐流程。在整个部署升级过程中需要保持高度专注,以避免因操作失误导致系统崩溃或数据丢失。天御V4.1.0致力解决上述问题,专注优化部署升级流程,部署步骤由30步缩减到7步,升级过程减少95%人工干预,部署和升级效率大幅提升!

2024-11-14 10:41:16 293

原创 【银河麒麟】时间同步工具chrony与ntp对比

使用chronyd服务平滑同步时间的方式要优于crontab + ntpdate,因为ntpdate同步时间会造成时间的跳跃,对一些依赖时间的程序和服务会造成影响,建议使用chrony服务来用于时间同步服务。但是对于生产环境已经长期稳定是用ntp服务来进行时间同步的环境,建议保留ntp环境,不建议强制将ntp更换为chrony。

2024-11-13 17:01:45 773

原创 【银河麒麟操作系统】软raid重建速度限制问题分析

现象描述:遇到软raid重建速度问题,分析重建速度受什么条件控制。现象总结:软raid重建速度受dev.raid.speed_limit_max控制,如果真实性能大于speed_limit_max,则速度维持在该值附近;如果真实性能小于speed_limit_max,则按真实速率做重建。在重建过程中,如果调小speed_limit_max的值,如果此时重建速度大于speed_limit_max的值,重建速度会慢慢降低,直到维持在speed_limit_max设定的速度,直到重构完成。

2024-11-05 15:44:01 365

原创 【银河麒麟高级服务器操作系统】虚拟机lvm分区丢失现象分析及解决建议

现象:目前服务器系统重启进维护模式,尝试挂盘进救援模式后,想查看日志和故障现象,发现chroot进不去,查看lvm分区后,发现400g的分区pvs显示unknown。此次现象由于直接再扩展分区创建物理卷导致,过程中会擦除dos分区表签名被擦除,并且扩展分区本身是不能直接被使用的,故导致此问题。

2024-11-01 09:59:06 761

原创 【银河麒麟高级服务器操作系统·实例分享】裸金属服务器开机失败分析及处理建议

现象描述:裸金属物理服务器开机卡在EFI stub页面,无法正常进入系统。本文进行详细分析,并给出了处理建议。

2024-10-25 13:50:08 1074

原创 【银河麒麟高级服务器操作系统实例】金融行业TCP连接数猛增场景的系统优化

现象描述:重点系统投产,TCP的连接数猛增,现在已经到15000个网络连接,需要评估下操作系统的瓶颈,如何优化可保证业务不会出行例如somaxconn,backlog等问题。

2024-10-21 14:28:53 1008

原创 【银河麒麟高级服务器操作系统-实例】集群存储文件系统异常,本地复现+详细分析+解决建议

现象描述:pod飘逸后挂载失败,通过"blkid -o udev /dev/dm-35命令和lsblk命令查看不到文件系统属性, 手动mount 挂载时,提示指定文件系统类型,mount -t ext4 后可正常挂载和访问。本文进行了复现并给出了详细分析结果与建议。

2024-10-17 13:57:48 931

原创 快速发现潜在的兼容性问题,了解一下【银河麒麟桌面操作系统镜像兼容检测工具】

这款工具专为银河麒麟桌面操作系统设计,旨在实时监控系统的各层组件(如内核、驱动程序、库文件等)的变化,并自动执行兼容性测试。

2024-10-15 13:33:14 857

原创 细说【银河麒麟操作系统】软件包依赖的概念、内容以及管理方法

在本文档中,我们将在银河麒麟操作系统的基础上详细探讨软件包依赖的概念、内容以及管理方法,以帮助开发者和系统管理员理解和利用这一机制,提高系统软件的整体性能和安全性。

2024-10-12 11:12:11 1471

原创 有效解决配置管理混乱,麒麟桌面操作系统V10 sp1 2403最新版本推出统一配置系统

银河麒麟桌面操作系统V10 sp1 2403最新版本推出了统一配置系统,打造了统一配置方案。该方案是一个体系化、结构化的设计,对应用进行模块化与配置化拆解,将应用设计成为“核心功能不变,扩展功能可配”的模式,为系统性的模块化/配置化提供基础支撑能力。统一配置系统针对开发人员、镜像制作人员、最终用户等不同受众提供了API、CLI工具和GUI工具。

2024-09-27 15:55:57 1542

原创 【技术实操】银河麒麟操作系统安装Node.js运行环境及其进程管理

本文介绍了在银河麒麟操作系统上部署Node.js运行环境以及通过PM2进行进程管理的相关操作,基于此可完成一个基础应用的部署。因篇幅有限,部分高阶用法未展开详述,如有兴趣可前往Node.js和PM2官网进行深入学习。

2024-09-20 15:29:36 3198 1

原创 【银河麒麟高级服务器操作系统实例】tcp_mem分析处理全过程&内核参数调优参考

而zone的managed_pages统计出现错位会进一步造成其他影响,一是影响各个zone的内存回收水位的计算,因为内存回收水位是按照各个zone managed_pages的比例来分配的,zone Normal原本管理的内存被统计到zone Movable后,可以看到其内存回收水位min/low/high变成了27/59/91这个极小的值,这又影响了后续系统的内存回收。综上所述,本次tcp_mem异常报错问题产生的原因为当前使用的低版本内核存在的managed_pages统计出现错位的bug。

2024-09-18 10:05:49 1451

原创 麒麟安全加固工具,为系统打造坚固“金钟罩”!

当今数字化时代,系统安全的重要性不言而喻。为应对网络安全风险、满足用户高等级安全诉求,麒麟软件打造了满足用户高等级安全诉求的 “麒麟安全加固工具”,实现服务器操作系统安全配置的规范化、标准化、制度化,为系统安全打造坚固“金钟罩”!

2024-09-06 11:25:14 804

原创 【银河麒麟高级服务器操作系统实例】虚拟化平台系统服务中断现象分析及处理建议

故障现象:反馈智能运维系统登录页面提示500。初步排查,发现虚机B系统日志显示在系统出现软中断,并持续15分钟时间。虚机C系统日志也有软中断报错,虚机A系统日志无21号日志,因此无法判断是否有软中断报错,影响智能运维系统服务中断。

2024-09-06 11:17:36 1561

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除