
运维
运维
城俊BLOG
从此好好码代码。。
展开
-
ubuntu shell获取IP地址、日期时间、重定向保存log,shell脚本保存管道命令执行结果
# shell 字符串替换还是用 sed比较方便$ ip addr | grep global | cut -b 10-20 | sed 's/\./_/g'# 效果是: 输出 10_123_123_123 这种格式的IP地址参考1参考2参考3参考4原创 2022-04-13 00:11:39 · 3673 阅读 · 0 评论 -
ubuntu制作windows系统启动盘,安装。报错:windows无法安装到这个磁盘
ubuntu 18.04制作win7启动U盘$ cd 到iso文件所在目录# 可以通过Ubuntu自带的Disks格式化U盘并分区# 指定好格式化后的Upan 格式,如FAT或NTFS$ $ sudo woeusb --device cn_windows_7_ultimate_with_sp1_x64_dvd_u_677408.iso /dev/sdd --target-filesystem FAT参考:https://blog.youkuaiyun.com/rootie321/article/detail原创 2022-02-12 11:40:51 · 1994 阅读 · 0 评论 -
ln: failed to access ‘xxx‘: Transport endpoint is not connected
现象:# 运行下面命令报错sudo ln -s /disk1/abc /disk2/def报错:ln: failed to access '/disk2/def': Transport endpoint is not connected原因:/disk2/def 挂载点掉了解决:# 查看当前挂载情况$ mount |grep /disk2/def# 卸载:上一行命令输出有 n 行结果,就运行下面这行命令 n+1 次 (最后一次会报错)$ sudo unmount -l /disk2/原创 2022-01-06 10:52:01 · 3469 阅读 · 0 评论 -
ubuntu apt 安装firefox报错 E: 无法下载 错误: 404 Not Found [IP:
$ sudo apt-get install xrdp正在读取软件包列表... 完成正在分析软件包的依赖关系树 正在读取状态信息... 完成 xrdp 已经是最新版 (0.9.5-2)。您也许需要运行“apt --fix-broken install”来修正上面的错误。下列软件包有未满足的依赖关系: gnome-core : 依赖: firefox-esr (>= 30) 但无法安装它 或 firefox (>=原创 2021-09-13 13:42:02 · 2496 阅读 · 0 评论 -
ubuntu终端terminal / pycharm编辑器 / VNC 显示中文乱码 - 方块麻将问号乱码,终端中英文输出切换
https://www.cnblogs.com/coinbt/p/8306860.html原创 2021-08-20 23:08:00 · 1435 阅读 · 0 评论 -
ubuntu菜单桌面终端麻将方块乱码
早晨上班,运行了个$ sudo /usr/share/locales/install-language-pack en_US.UTF-8桌面顿时变这样:慌的一批。。# 安装中文语言包# $ sudo apt-get install language-pack-zh-hans# 安装英文语言包$ sudo apt-get install language-pack-en# 修改local配置$ sudo gedit /etc/default/locale如果想显示英文(当前英文的地方变成原创 2021-08-19 11:04:44 · 788 阅读 · 0 评论 -
【汇总】硬盘安装和使用问题
新买的8T sata 固态硬盘Linux ubuntu服务器不识别linux ubuntu硬盘数据丢失【硬盘开机未挂载】不需要u盘,将Ubuntu 18.04安装在移动硬盘中,随身携带Linux ubuntu安装挂载新硬盘Ubuntu18.04 开机自动挂载其他硬盘...原创 2021-07-23 14:12:27 · 111 阅读 · 0 评论 -
新买的8T sata 固态硬盘Linux ubuntu服务器不识别
服务器开机情况下,插在 服务器 硬盘槽中,蓝灯闪一下,没有其他反应$ sudo fdisk -l # 也没有通过硬盘盒连接到WIN10也不识别解决:通过计算机 - 管理- 磁盘 格式化 成 GPT 分区格式 然后就可以识别了...原创 2021-07-15 15:12:39 · 4208 阅读 · 0 评论 -
【定位内存泄漏】top命令 内存占用监控日志分析
通过top命令监控进程活动,保存日志# -d 1表示top命令频率为 每隔0.5秒;-n 1 表示刷新1次后退出# 循环每隔0.5秒执行一次# col命令过滤输出内容保存到日志时产生的控制字符(乱码问题)while true; do top -d 0.5 -n 1 | col -b >> ./top0705.log; sleep 0.5; done对日志进行分析from tqdm import tqdmimport matplotlib.pyplot as plttx.原创 2021-07-14 11:12:25 · 1370 阅读 · 1 评论 -
【进程丢失】pytorch DDP分布式训练10个epoch就丢失1个GPU进程
现象:已经重复发生过,而且掉进程的卡bus id不一样Pytorch 版本 1.7.0 ,卡:titan rtx x 8很奇怪的bug,目前分析的原因:batch size过大,每张卡显存占的太满,导致训练的时候显存爆了?问题:那为什么一开始不爆呢?程序有显存泄漏?显卡过热(这个目前应该不是引起的原因,因为散热风挡已经开到最大,温度最多70度左右)...原创 2021-05-30 13:02:45 · 1073 阅读 · 2 评论 -
linux ubuntu 命令输出到日志产生乱码 ‘ <0x1b>(B<0x1b>[m<0x1b>[39;49m<0x1b>[K’
背景:linux监控命令输出,追加的方式保存到日志,但是打开日志发现产生了控制乱码,如 ‘ <0x1b>(B<0x1b>[m<0x1b>[39;49m<0x1b>[K’ 之类的鬼东西代码:while true; do top >> ./top0705.log; sleep 0.5; done现象:一个top命令 结果保存到日志产生的解决:使用col命令过滤输出结果,然后再保存到日志while true; do top | col -b原创 2021-07-05 14:22:50 · 1125 阅读 · 0 评论 -
如何定位有故障的显卡,查看序列号,更换
故障的现象是:运行命令$ nvidia-smi之后要么不显示显卡的情况,要么显示很缓慢。并且结果中有ERR! 提示定位:查看显卡情况:$ nvidia-smi,可以看到有一张显卡出现了故障。并且只要有这张显卡插在服务器上,这个命令的输出都会非常缓慢可以看到,循坏的显卡BUS-ID是02;如何找到这张显卡呢?通过$ nvidia-smi -q 查看BUS-ID和显卡的序列号之间的对应关系可以看到,损坏的显卡(BUS-ID 02)的序列号(Serial Number)尾号为4953去机房,找原创 2021-05-18 06:58:23 · 8653 阅读 · 1 评论 -
linux扫盲
1,看看进程的ID和进程在干什么$ ps j 23661 $$原创 2020-04-20 15:45:34 · 524 阅读 · 1 评论 -
conda install/update 代理联网报错 ProxyError: Conda cannot proceed due to an error in your proxy configur
conda联网报错:$ conda update condaCollecting package metadata (current_repodata.json): failedProxyError: Conda cannot proceed due to an error in your proxy configuration.Check for typos and other configuration errors in any '.netrc' file in your home dire原创 2021-05-08 11:02:47 · 2677 阅读 · 0 评论 -
ubuntu 18.04 vnc xfce窗口界面无法点击标题栏移动、拖拽缩放、关闭(没有按钮)
按住alt可以移动按住alt+f8可以缩放https://askubuntu.com/questions/695409/kate-is-missing-all-button-icons翻译 2021-04-26 13:39:23 · 1937 阅读 · 0 评论 -
ubuntu服务器调风扇转速
1,ipmitool lan print 查看ipmi的ip地址2,修改 /etc/network/interfaces 启用网卡二(反注释),重启网络:/etc/init.d/networing restart3,找一根网线将网卡二对应的网口连接到ipmi网口(单独的一个网口),拔掉网卡一对应的网口4,浏览器登录上述ip地址,找到configuration -> fan mode5,三个选项:full speed 风速最大,噪音最大,散热最好heavyio 风速中等,噪音中等,散热中等原创 2021-04-07 09:23:17 · 5859 阅读 · 0 评论 -
GPU服务器散热噪音问题
GPU:RTX TITAN 核弹解决:1,风扇转速调低(降低噪音),紧贴显卡芯片散热 (热量主要来自于显卡芯片)2,机箱盖子选择上出风,出风孔要大3,机箱盖子选高一点的型号原创 2021-03-31 22:19:47 · 1190 阅读 · 0 评论 -
linux ubuntu 如何查看GPU显卡(或者设备)和CPU的连接关系 【grep 命令】
1,查看插槽slot物理地址及连接的CPU:$ sudo dmidecode -t slot2,查看物理地址对应的设备:$ lspci综合这两个命令的输出结果能得到CPU和设备的连接关系原创 2021-03-31 21:50:46 · 2210 阅读 · 0 评论 -
ubuntu 18.04 dashboard没有应用app图标
点开左上角dash然后出来是空的我是这么整了一通解决了,不一定适合你的情况。仅供参考可能的解决方法:# 你可以删掉这个或者备份,建议备份sudo rm -r gnome-software/sudo apt install unity-lens-applicationssudo apt install gnome-tweakssudo apt install gnome-tweak-toolunity --replace# 打开看看有没有什么变化gnome-tweaks# 没有变化就重原创 2021-03-28 12:52:53 · 738 阅读 · 0 评论 -
局域网windows / mac 和linux ubuntu之间文件传输 pscp winscp,scp到服务器指定端口
PSCP (612KB的一个小工具)存为.bat文件,可以在windows下执行@echo off pscp.exe -l hww -pw "user1" -r E:\user1\data\results usr1@10.xxx.xxx.xxx:/home/user1/data/pausewinSCP官网下载使用原创 2021-01-22 13:44:27 · 586 阅读 · 0 评论 -
shell根据文件列表list.txt使用scp拷贝文件和目录结构到远程服务器,远程创建目录
将单个文件拷贝到远程服务器但是希望拷贝(scp命令)到对应的目录(就是文件名的上一层目录, lastDir)下面,保持目录结构如果不存在,则在远程服务器上创建 (ssh命令)自动验证账号密码:$ apt-get install sshpass代码:# usage: sudo sh xxx.shtime=$(date "+%Y%m%d%H%M%S")fdir="/data5/user1/src/images"# divided file list txtsflistDir="/data原创 2021-01-11 14:56:17 · 1737 阅读 · 1 评论 -
ngrok报错 ERR_NGROK_108,ngrok关闭隧道
$ ./ngrok start -config ngrok.yml vnc sshYour account 'j' is limited to 1 simultaneous ngrok client session.Active ngrok client sessions in region 'us': - ts_1xxxxxxxxxxxxxxxx (2000:0000:0000:xxxxxxxxxxxxxxx)ERR_NGROK_108解决:killall ngrok参考:https翻译 2021-01-06 23:08:46 · 5444 阅读 · 2 评论 -
linux ubuntu18.04 update-initramfs -u提示The initramfs will attempt to resume from /dev/nvme0n1p3
update-initramfs: deferring update (trigger activated)Processing triggers for initramfs-tools (0.130ubuntu3.11) ...update-initramfs: Generating /boot/initrd.img-5.4.0-48-genericI: The initramfs will attempt to resume from /dev/nvme0n1p3I: (UUID=297bb92翻译 2020-12-31 16:29:45 · 4105 阅读 · 3 评论 -
ubuntu 18.04 gcc g++降级
9.x降级到5.x:https://blog.youkuaiyun.com/qxqxqzzz/article/details/111875737降级到4.8:$ sudo nano /etc/apt/sources.list# sources.list全部内容:deb http://mirrors.ustc.edu.cn/ubuntu/ xenial main restricted universe multiversedeb-src http://mirrors.ustc.edu.cn/ubuntu/ .原创 2020-12-31 14:53:34 · 1402 阅读 · 0 评论 -
apt-get install报错:GnuTLS recv error (-110): The TLS connection was non-properly terminated.
$ sudo apt-get install -y nvidia-docker2...Err:4 https://nvidia.github.io/nvidia-container-runtime/stable/ubuntu16.04/amd64 nvidia-container-runtime 3.4.0-1 GnuTLS recv error (-110): The TLS connection was non-properly terminated.Get:5 https://nvidia原创 2020-12-21 23:32:15 · 8169 阅读 · 2 评论 -
sudo apt update报错:E: Problem executing scripts APT::Update::Post-Invoke-Success ‘if /usr/bin/test -w
完整报错:$ sudo apt update...(appstreamcli:27333): GLib-CRITICAL **: g_strchug: assertion 'string != NULL' failed(appstreamcli:27333): GLib-CRITICAL **: g_strchomp: assertion 'string != NULL' failedfree(): double free detected in tcache 2Aborted (core d翻译 2020-12-21 22:54:49 · 2224 阅读 · 0 评论 -
sudo apt update报错W: GPG error: http://xxx the public key is not available: NO_PUBKEY
完整报错:$ sudo apt update...W: GPG error: http://files.freeswitch.org/repo/ubuntu-1604/freeswitch-1.6 xenial InRelease: The following signatures couldn't be verified because the public key is not available: NO_PUBKEY 1FDDF413C2B201E5E: The repository 'htt原创 2020-12-21 22:51:00 · 578 阅读 · 0 评论 -
ubuntu mxnet joint training 机器反复重启
ubuntu 18.04LTS迭代4000/6000 batch之后就会自动重启从CPU温度,显卡温度等方面没有看出来原因原创 2020-12-01 10:19:00 · 343 阅读 · 0 评论 -
linux ubuntu硬盘数据丢失【硬盘开机未挂载】
ubuntu 18.04开机之后发现一个机械硬盘挂载的文件夹下是空的。以为数据丢了,慌得一批后来发现是开机没有挂载上。有惊无险开机硬盘两种挂载方式:/etc/fstab和/etc/rc.local区别:fstab文件中的记录的硬盘如果挂载不成功就会造成开机失败,但是rc.local不影响原因:机器反复重启损坏了磁盘,导致挂载失败解决:修复一下$ fsck /dev/sda1其他:查看硬盘挂载目录树:$ lsblk逐行查看硬盘$ fdisk -l | more...原创 2020-11-30 16:57:03 · 2395 阅读 · 0 评论 -
docker load Error processing tar file(exit status 1): write xxx layer.tar: no space left on device
Error processing tar file(exit status 1): write /feb71c851eeaa5f74ee94a1be3a399915b7d3433bc6ff8fa5ea8a67fea0b4643/layer.tar: no space left on device解决:# 看一下存储位置$ sudo docker info # 改一下存储位置$ sudo nano /etc/docker/daemon.json# 重新加载$ sudo systemctl .原创 2020-11-26 18:53:32 · 10162 阅读 · 2 评论 -
ubuntu系统硬件状态监控:内存使用量、温度、磁盘IO占用率
$ free -hlhttps://blog.youkuaiyun.com/we_shell/article/details/36887629翻译 2020-11-13 16:39:40 · 2462 阅读 · 0 评论 -
ubuntu apt update 报错: Certificate verification failed: The certificate is NOT trusted handshake
1,系统时间不对。改系统时间和时区2,把/etc/apt/source.list中出错的URL中的https换成http原创 2020-11-06 21:00:27 · 3700 阅读 · 3 评论 -
ubuntu18.04安装comfast cf-wu725b (rtl8723bu)无线网卡驱动
https://github.com/lwfinger/rtl8723bu翻译 2020-10-12 11:13:27 · 2069 阅读 · 0 评论 -
ubuntu18.04切换使用指定的无线网卡(开启/禁用)
环境:# 内核版本$ uname -aLinux pc7 5.4.0-48-generic #52~18.04.1-Ubuntu SMP Thu Sep 10 12:50:22 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux# 查看系统的网卡:可以看到有两块无线网卡(wlo1和wlx40a5ef0e1fd6)、一块有线网卡(eno2)# 可以看到wlo1已经被禁用了(DISABLED)$ sudo lshw -C network *-network:0 DIS原创 2020-10-11 09:22:02 · 4509 阅读 · 2 评论 -
ubuntu18.04安装tenda u6无线网卡驱动
1,win10笔记本连接wifi2,通过网线将wifi网络共享给ubuntu主机3,ubuntu主机安装无线网卡驱动原创 2020-10-09 12:07:14 · 1661 阅读 · 1 评论 -
通过shell执行python代码,通过python执行shell代码
文章目录通过shell执行python通过python执行shell通过shell执行python变量赋值和显示logName='1.log'echo $logName获取时间time=$(date "+%Y%m%d%H%M%S")字符串拼接logFile='./models/model-r100-'logName=$logFile$time".log"按照列表循环#!/bin/bashmpath="/data2/model"for i in ${models原创 2020-09-25 10:41:08 · 6717 阅读 · 0 评论 -
ubuntu液晶屏幕显示抖动
不是屏幕坏了在设置里面调整一下分辨率,不要选i结尾的比如 1920x1080和1920x1080i。选择前面的原创 2020-09-05 15:42:04 · 1025 阅读 · 0 评论 -
linux ubuntu scp Host key verification failed
一开始我(user2)在 456.xxx.xxx.xx 机器上执行命令:$ sudo scp -r user1@123.xxx.xxx.xx:/home/user1/folder1 user2@456.xxx.xxx.xx:/home/user2/folder2/想把123.xxx.xxx.xx 机器上的文件夹folder1拷贝到 456.xxx.xxx.xx 机器的folder2下面,但是报错:user1@123.xxx.xxx.xx's password:Host key verificati原创 2020-08-18 18:29:24 · 373 阅读 · 0 评论 -
linux ubuntu 查找文件、文件夹、包含指定内容的文件 grep / locate / find
find 命令$ sudo find /home/ -name 'v2'查找:/home/xxx/data/86/images/v2/act-5/002822.jpg所在的位置:$ locate v2/act-5原创 2020-08-06 11:26:23 · 3806 阅读 · 0 评论 -
代码差异比较 diff pycharm sublimetext
好用的代码比较工具:pycharmsublimetext安装:https://www.cnblogs.com/olive27/p/6038144.html用法:https://blog.youkuaiyun.com/a0405221/article/details/78769672https://www.diffchecker.com/ ?翻译 2020-08-04 16:31:34 · 1399 阅读 · 0 评论