深度估计开源项目：Prompt Depth Anything 使用教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00923/article/details/147089037

深度估计开源项目：Prompt Depth Anything 使用教程

PromptDA [CVPR 2025] Prompt Depth Anything 项目地址: https://gitcode.com/gh_mirrors/pr/PromptDA

1. 项目介绍

Prompt Depth Anything 是一个用于4K分辨率准确度量深度估计的开源项目。该项目旨在通过提示深度估计的方法，提高深度估计的准确性和鲁棒性，适用于机器人抓取、3D重建等场景。项目基于深度学习模型，并提供了预训练模型以及相应的训练和推理代码。

2. 项目快速启动

环境搭建

首先，需要克隆项目仓库：

git clone https://github.com/DepthAnything/PromptDA.git
cd PromptDA

然后，安装项目所需的依赖：

pip install -r requirements.txt
pip install -e .

此外，还需要安装ffmpeg以生成视频结果：

sudo apt install ffmpeg

预训练模型

项目提供了两个预训练模型：Prompt-Depth-Anything-Large 和 Prompt-Depth-Anything-Small。可以从以下链接下载：

使用示例

以下是一个简单的使用示例，加载模型并对图像进行深度估计：

from promptda.promptda import PromptDA
from promptda.utils.io_wrapper import load_image, load_depth, save_depth

DEVICE = 'cuda'
image_path = "assets/example_images/image.jpg"
prompt_depth_path = "assets/example_images/arkit_depth.png"

image = load_image(image_path).to(DEVICE)
prompt_depth = load_depth(prompt_depth_path).to(DEVICE)

model = PromptDA.from_pretrained("depth-anything/prompt-depth-anything-vitl").to(DEVICE).eval()
depth = model.predict(image, prompt_depth)

save_depth(depth, prompt_depth=prompt_depth, image=image)

3. 应用案例和最佳实践

自定义数据捕获

可以使用 Stray Scanner App 捕获自定义数据。Stray Scanner App 需要iPhone 12 Pro或更新的Pro型号，或iPad 2020 Pro或更新的Pro型号。以下是测试步骤：

使用 Stray Scanner App 捕获场景。
使用 iPhone Files App 将捕获的数据压缩成zip文件并传输到计算机。
运行以下命令来推断模型并生成视频结果：

export PATH_TO_ZIP_FILE=data/your_zip_file.zip
export PATH_TO_SAVE_FOLDER=data/your_results_folder

python3 -m promptda.scripts.infer_stray_scan --input_path ${PATH_TO_ZIP_FILE} --output_path ${PATH_TO_SAVE_FOLDER}
python3 -m promptda.scripts.generate_video process_stray_scan --input_path ${PATH_TO_ZIP_FILE} --result_path ${PATH_TO_SAVE_FOLDER}
ffmpeg -framerate 60 -i ${PATH_TO_SAVE_FOLDER}/%06d_smooth.jpg -c:v libx264 -pix_fmt yuv420p ${PATH_TO_SAVE_FOLDER}.mp4