Torch安装+Densecap实验

本文介绍了DenseCap模型的安装流程与实验步骤。DenseCap是一种能够对图像中的多个区域进行精确定位并生成描述的模型。文章详细记录了Torch环境的搭建过程,包括LuaJIT和Torch的基本包依赖项安装、GPU加速配置等。此外还提供了在视觉基因组数据集上的评估结果。

Torch安装+Densecap实验

本博客用于记录学习过程,欢迎交流。

Densecap引入密集的字幕任务,不仅能够定位局部显著的图像,而且能用自然语言来描述该区域。密集字幕任务概括和统一了两个任务,一个是只需要单个单词描述的目标检测任务,另一个是对整个图像的一个预测区域的字幕标注任务。为了同时解决定位和描述任务,提出了一个统一高效的直传处理图像架构,全卷积定位网络(FCLN)架构,无需外部区域的建议,并可以用单轮优化进行端对端的训练。该架构包含一个卷积网络,一个新的密集定位层,一个生成标签序列的递归神经网络的语言模型。评估了视觉基因组数据集,该数据集包括94000图像和4,100,000个区域字幕。在字幕生成和图像检索两个任务上对算法进行了评估,不管是速度还是准确性上,对当前最优的基线都有提升。

1.安装 Torch

1.1 下载Torch

git clone https://github.com/torch/distro.git ~/torch –recursive

1.2 安装LuaJIT和Torch所需的基本包依赖项

cd ~/torch
bash install-deps

1.3 安装LuaJIT,LuaRocks.

安装LuaJIT,LuaRocks,然后使用LuaRocks(lua软件包管理器)安装核心软件包,如torch,nn和path,以及其他几个软件包

./install.sh

1.4 更新环境变量。

更新环境变量,添加Tor环境ch的变量,并在正确的配置文件中修改路径。

source ~/.bashrc

2.配置Densecap

2.1 安装依赖

luarocks install torch
luarocks install nn
luarocks install image
luarocks install lua-cjson
luarocks install https://raw.githubusercontent.com/qassemoquab/stnbhwd/master/stnbhwd-scm-1.rockspec
luarocks install https://raw.githubusercontent.com/jcjohnson/torch-rnn/master/torch-rnn-scm-1.rockspec

2.2 安装GPU acceleration

luarocks install cutorch
luarocks install cunn

2.3 安装(Optional) cuDNN

luarocks install cudnn

2.4 下载预训练模型

sh scripts/download_pretrained_model.sh

2.5 看图说话单张图片

th run_model.lua -input_image imgs/elephant.jpg
cd vis
python -m SimpleHTTPServer 8181

打开这个网页:
http://localhost:8181/view_results.html

原图:
这里写图片描述

结果:
这里写图片描述

2.6 看图书画多张图片

制定输入目录:

th run_model.lua -input_dir /path/to/my/image/folder

指定输出目录:

th run_model.lua -input_dir /path/to/my/image/folder -output_dir /path/to/output/folder/

安装过程遇到的问题:

安装 Torch问题1:

/usr/bin/ld: cannot find -lgfortran
collect2: 错误: ld 返回 1
make[1]: * [../libopenblas_haswellp-r0.2.20.dev.so] 错误 1
make[1]:正在离开目录 `/tmp/OpenBLAS/exports’
make: * [shared] 错误 2
Error. OpenBLAS could not be compiled

解决方案:
sudo apt-get install gfortran-4.9

问题2

问题2:Then make sure files named as libcudnn.so.4 or libcudnn.4.dylib are placed in your library load path (for example /usr/local/lib , or manually add a path to LD_LIBRARY_PATH)

解决方案:
到官网https://developer.nvidia.com/cuDNN注册下载cudnn-7.0-linux-x64-v4.0-prod.tgz,解压然后将cuda/lib64/libcudnn.so.4 复制到/usr/lib下。

然后执行下列命令:

hdu@hdu:~/densecap$ th run_model.lua -input_image imgs/elephant.jpg

1/1 processing image imgs/elephant.jpg

参考文章:
http://weibo.com/5501429448/DtW9teG9s?type=comment#_rnd1484010132423

<think>嗯,用户想安装特定版本的PyTorch,特别是2.6.0+cu126。我需要回忆一下安装PyTorch的不同方法。记得通常有两种主要方式:使用pip或者conda。用户提供的引用中有几个链接和命令,可能需要参考这些信息。 首先,用户提到通过pip安装whl文件。比如引用[1]中的命令是安装torch-2.6.0+cu126的whl文件,但用户可能需要注意Python版本和系统架构。比如文件名中的cp311代表Python3.11,用户需要确认自己的Python版本是否匹配。如果用户的环境是Python3.12,可能需要另一个文件,如引用[4]中的例子,他们修改了文件名以适应版本。所以正确选择whl文件很重要。 然后,conda安装方法在引用[2]中,但命令里的pytorch-cuda=12.1可能对应cu121,而用户需要cu126,也就是CUDA12.6。可能conda源里没有cu126的版本,这时候可能需要使用pip安装。用户需要先检查conda是否提供了该版本,如果没有,就只能用pip。 另外,用户可能需要从官网下载whl,如引用[3]提供的链接。需要指导用户访问正确的URL,然后找到对应的版本。但PyTorch的官方下载页面可能结构比较复杂,用户需要根据自己的环境选择正确的文件。例如,cu126对应的CUDA版本是12.6,而Python版本如3.11、3.12等都要对应。 还有,引用[4]提到安装时遇到的问题,whl文件名和dist-info不匹配。这时候需要重命名文件,将%2B替换为+号,并确保其他部分正确。比如原文件名可能有编码问题,下载后需要手动调整,避免安装失败。 总结步骤应该是:首先确定Python版本和CUDA版本是否匹配,然后选择pip或conda安装。如果使用pip,下载正确的whl文件,可能需要调整名称,最后用pip安装。或者使用conda指定版本,但可能受限于仓库中的可用版本。 用户的问题还可能涉及依赖项,比如需要安装对应的torchvision或torchaudio,这时候是否需要一并安装?引用中的命令有的包含这些库,但用户可能只需要torch。需要建议用户根据需求安装相关组件。 另外,用户可能是在Windows系统下安装,因为whl文件名中有win_amd64,所以需要确认系统是否为64位Windows。如果是Linux,可能需要不同的whl文件。 最后,需要提醒用户验证安装是否成功,通过导入torch并检查版本和CUDA是否可用。例如:import torch; print(torch.__version__); print(torch.cuda.is_available())。 可能还需要处理常见错误,比如版本不兼容、CUDA驱动不支持等问题。例如,CUDA12.6需要相应的NVIDIA驱动版本,用户需要提前安装正确的驱动。</think>### 安装PyTorch 2.6.0+cu126的步骤 #### 方法1:通过pip直接安装whl文件(推荐) 1. **下载对应版本的whl文件** 访问PyTorch官方下载页面: https://download.pytorch.org/whl/ 搜索`cu126`相关文件,根据你的Python版本和操作系统选择对应的文件。例如: - Python 3.11 + Windows系统:`torch-2.6.0+cu126-cp311-cp311-win_amd64.whl` - Python 3.12 + Linux系统:`torch-2.6.0+cu126-cp312-cp312-manylinux1_x86_64.whl` 2. **安装whl文件** 在命令行中执行: ```bash pip install "torch-2.6.0+cu126-cp311-cp311-win_amd64.whl" ``` **注意**:如果文件名包含`%2B`(如从浏览器下载时),需手动将其改为`+`,否则会报错[^4]。 --- #### 方法2:通过conda安装 若conda源中已提供该版本,可尝试: ```bash conda install pytorch torchvision torchaudio pytorch-cuda=12.6 -c pytorch -c nvidia ``` 但当前官方conda频道可能未同步`cu126`版本,建议优先使用pip安装[^2]。 --- #### 验证安装 安装完成后,运行以下代码检查版本和CUDA支持: ```python import torch print(torch.__version__) # 应输出 2.6.0+cu126 print(torch.cuda.is_available()) # 应输出 True ``` --- ### 常见问题解决 1. **文件名不匹配** 如果报错`torch-2.6.0+cu126-cp311-cp311-win_amd64.whl is not a valid wheel filename`,需确保: - 文件名中的Python版本(如`cp311`)与当前Python版本一致; - 将`%2B`替换为`+`。 2. **CUDA驱动不兼容** CUDA 12.6需NVIDIA驱动版本≥535.86.10,可通过`nvidia-smi`命令检查驱动版本。 ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值