
解决问题
文章平均质量分 66
shuozhang_Hebut
这个作者很懒,什么都没留下…
展开
-
bash多进程执行python脚本
使用bash多进程并行运行多个复杂python脚本原创 2023-02-09 15:08:25 · 1294 阅读 · 0 评论 -
终端执行python命令无响应
环境Ubuntu系统装有Anaconda问题阐述执行可以正常运行的py文件时,始终无响应(不报错,也不输出任何信息)。直接执行python命令同样会卡,但也可以进。尝试导入包也会卡住,有些包导入时无响应。执行pip list,conda envs list会卡住无响应。问题解决其他用户代码可以正常执行,结合上述现象,初步判断可能是Anaconda出现了问题,尝试卸载Anaconda(直接删除整个Anaconda目录即可)后重新安装,问题解决。Anaconda有时会出现奇奇怪怪的问原创 2022-03-19 14:50:26 · 5265 阅读 · 0 评论 -
加速LaTeX编译速度:使用VScode远程工具Remote-SSH在Linux系统上编译LaTeX
由于在Windows中编译LaTeX的速度要远低于在LInux中编译速度,但我们可能经常需要在Windows系统上办公,因此有没有一种方法可以在Windows中用LaTeX写文章同时享受Linux的编译速度呢?答案是:Windows系统:VScode(扩展:Remote-SSH+LaTeX Workshop)远程Linux系统:TeX Live 2021在远程Linux系统中安装TeX Live 2021(以Ubuntu为例)下载TeX Live(国内镜像:http://mirrors.cq原创 2021-11-15 22:47:21 · 3182 阅读 · 0 评论 -
ubuntu 禁止普通用户su 至root
发现CentOS 等其他系统的配置方法与Ubuntu系统的不一样,且关于Ubuntu系统的配置方法的文章很少,因此写下这篇做一下记录。原理:配置wheel组为管理员权限组,将想拥有管理员权限的用户加入到改组下,其他普通用户不加入,就可以保证其他普通用户均不能使用su切换至root环境下。配置方法:设置除了有管理权限的用户外其他用户均不能使用su命令登录到root用户下(需要解锁passwd和shadow):在Ubuntu系统中仅需要修改 /etc/pam.d/su 文件,找到 # auth原创 2021-09-24 14:25:42 · 2755 阅读 · 0 评论 -
解决win10中ssh登录错误信息:ssh_exchange_identification: Connection closed by remote host
1、报错:ssh登录报错在使用ssh登录时出现的错误信息:ssh_exchange_identification: Connection closed by remote host.2、出现此错误的状况:内网使用ssh登录时报错,此报错不正常,暂时无法分析错误原因,但总结一下错误现象:本机(win10)测试:内网机器IP ping不同,但部分机器的ssh可以正常登录,某些机器无法正常登录并报上述错误。本机上网正常,IP也在同一段,但并不意味着整个网络就正常。找一台Linux机器(同样的网络环境原创 2021-09-20 17:07:31 · 4359 阅读 · 0 评论 -
GPU服务器中挖矿病毒-查杀-分析-预防
1. 确认是挖矿病毒使用命令nvidia-smi发现GPU被root用户(也可能是普通用户)大量占用,体现形式为:显存占用率不一定为100%,但GPU使用率为100%。使用命令 top(htop) 发现CPU使用率非常高,将近100%。(注意此处可能看到很多以root用户运行的程序,但大多数可能是系统默认程序。)使用上述两个命令,可以发现CPU和GPU均被大量占用,此时我们利用nvidia-smi命令查看运行程序的PID进程号,并尝试通过kill的方式结束进程,若发现kill后会重启,并且原创 2021-09-17 09:48:13 · 3398 阅读 · 0 评论 -
Ubuntu 如何进入Recovery Mode获取无密码root权限
1、需求Ubuntu操作系统自带恢复模式(Recovery Mode),通过此功能,用户可以无需密码进入root环境执行任何操作,比如进入损坏系统的命令行,修复错误配置的文件,测试系统内存是否不工作等。某些错误只能通过进入这个环境才能解决,比如下面的错误:sudo: >>> /etc/sudoers:syntax error 在行 21 附近<<<sudo: /etc/sudoers 中第 21 行附近有解析错误sudo: 没有找到有效的 sudoers 资源,原创 2021-06-07 21:17:06 · 6883 阅读 · 1 评论 -
电脑突然经常死机?(ubuntu系统如何检查原因)
问题描述台式机(我的是GPU服务器)隔3-5天就会死机一次,硬件重启可以正常启动。原因分析出现这种情况大概率不是系统或某个软件卡顿造成的,因为这两种死机情况一般不会很频繁。然而,无论我们是否进行过载操作,机器总是隔一段时间死一次机,而且间隔时间很短,仅几天,这很有可能是硬件问题造成的,而死机很有可能和内存条有关系。(我们已经排除了CPU或GPU由于温度过高导致的断电保护机制。)问题检测Windows系统有很多硬件检测软件,比如可以使用aida64进行硬件检测,尽量多检测几次,一般硬件问题都可以检测原创 2021-04-23 13:16:57 · 9613 阅读 · 1 评论 -
nvidia-smi报错 NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver.
1、报错:nvidia-smi报错NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest nvidia driver is installed and running.2、出现此错误的状况是:曾经安装成功过显卡驱动或ubuntu20系统(可能还不太稳定),装系统时自带显卡驱动。由于重启等原因导致显卡驱动掉了,需要重装显卡。3、解决:3.1、使原创 2021-01-28 20:07:14 · 18809 阅读 · 4 评论 -
Pytorch问题:device-side assert triggered 未必是标签越界导致
详细报错信息如下:关键错误为:/pytorch/aten/src/ATen/native/cuda/Loss.cu:106: operator(): block: [73,0,0], thread: [30,0,0] Assertion input_val >= zero && input_val <= one failed.THCudaCheck FAIL file=/pytorch/aten/src/THC/THCCachingHostAllocator.cpp lin原创 2020-12-26 22:28:13 · 17322 阅读 · 3 评论 -
ubuntu20 使用Netplan配置双网卡服务器(静态IP+动态IP)
从Ubuntu18.04版开始,尤其是20.04,Ubuntu已经切换到基于YAML的Netplan来配置网络。本文将在Ubuntu 20机器上配置静态+动态IP地址的过程。进入网络管理目录原创 2020-11-07 16:32:13 · 16490 阅读 · 0 评论 -
通过路由器端口映射,对局域网内服务器进行ssh登录
需求分析多台服务器连在同一个路由器下,其中一台进行认证上网,其他服务器也可以正常上网。但是,路由器下机器的IP均由路由器自动分配,这个IP在外网是无法访问到的(也就是只有连在这个路由器下的机器之间可以相互访问)其他可上网的电脑均访问不到,即使进行上网认证的那台机器也不能被外网访问到。解决方法对该路由器下的每台机器进行端口映射(类似内网穿透)原理由于路由器的外网IP(入口IP)仅有一个,因此访问此IP是无法找到该路由器下的机器的,但通过为每台机器手动分配一个外部端口后,ssh登录时指定要访问的机器的原创 2020-11-06 22:09:22 · 8203 阅读 · 0 评论 -
解决:QH6249 qh_lib_check: Incorrect qhull library called.
在执行一个python文件的时候,突然报一下错误:QH6248 qh_lib_check: Incorrect qhull library called. Caller uses reentrant Qhull while library is non-reentrantQH6249 qh_lib_check: Incorrect qhull library called. Size of qhT for caller is 8184, but for library is 2896.QH6256原创 2020-08-07 13:44:18 · 1089 阅读 · 0 评论 -
解决:显存充足 但却出现Internal: out of memory
1、在以下环境运行tf或keras可能汇报下面的错误:环境:UbuntuCUDA10.1tensorflow1.14 / keras 2.2.4错误(查看显存充足的情况下):on-OK-status: CudaLaunchKernel(FillPhiloxRandomKernelLaunch, num_blocks, block_size, 0, d.stream(), gen, data, size, dist) status: Internal: out of memory2、原创 2020-08-05 15:05:00 · 2436 阅读 · 0 评论 -
解决CUDA10.1无法安装tf 1.x问题:ImportError: libcublas.so.10.0
问题: 目前官方在Tensorflow 1.x 等版本中最多支持到CUDA 10.0,如下图:对于CUDA10.1仅TF 2.1 可以使用,如果在CUDA 10.1上安装tf 1.x,则会报一下错误ImportError: libcublas.so.10.0: cannot open shared object file: No such file…解决:最好新建conda虚拟环境conda create -n tfpython=3.6不要使用pip进行安装,而是使用conda命令来安装,原创 2020-07-11 16:10:10 · 1830 阅读 · 1 评论 -
问题:Failed to get convolution algorithm. This is probably because cuDNN failed to initialize
问题:Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.出现以上问题,并不是CUDA或cuDNN出现问题,而是GPU分配出现问题,这里装了...原创 2020-03-23 23:32:13 · 409 阅读 · 0 评论