深度估计开源项目:Prompt Depth Anything 使用教程
PromptDA [CVPR 2025] Prompt Depth Anything 项目地址: https://gitcode.com/gh_mirrors/pr/PromptDA
1. 项目介绍
Prompt Depth Anything 是一个用于4K分辨率准确度量深度估计的开源项目。该项目旨在通过提示深度估计的方法,提高深度估计的准确性和鲁棒性,适用于机器人抓取、3D重建等场景。项目基于深度学习模型,并提供了预训练模型以及相应的训练和推理代码。
2. 项目快速启动
环境搭建
首先,需要克隆项目仓库:
git clone https://github.com/DepthAnything/PromptDA.git
cd PromptDA
然后,安装项目所需的依赖:
pip install -r requirements.txt
pip install -e .
此外,还需要安装ffmpeg以生成视频结果:
sudo apt install ffmpeg
预训练模型
项目提供了两个预训练模型:Prompt-Depth-Anything-Large 和 Prompt-Depth-Anything-Small。可以从以下链接下载:
使用示例
以下是一个简单的使用示例,加载模型并对图像进行深度估计:
from promptda.promptda import PromptDA
from promptda.utils.io_wrapper import load_image, load_depth, save_depth
DEVICE = 'cuda'
image_path = "assets/example_images/image.jpg"
prompt_depth_path = "assets/example_images/arkit_depth.png"
image = load_image(image_path).to(DEVICE)
prompt_depth = load_depth(prompt_depth_path).to(DEVICE)
model = PromptDA.from_pretrained("depth-anything/prompt-depth-anything-vitl").to(DEVICE).eval()
depth = model.predict(image, prompt_depth)
save_depth(depth, prompt_depth=prompt_depth, image=image)
3. 应用案例和最佳实践
自定义数据捕获
可以使用 Stray Scanner App 捕获自定义数据。Stray Scanner App 需要iPhone 12 Pro或更新的Pro型号,或iPad 2020 Pro或更新的Pro型号。以下是测试步骤:
- 使用 Stray Scanner App 捕获场景。
- 使用 iPhone Files App 将捕获的数据压缩成zip文件并传输到计算机。
- 运行以下命令来推断模型并生成视频结果:
export PATH_TO_ZIP_FILE=data/your_zip_file.zip
export PATH_TO_SAVE_FOLDER=data/your_results_folder
python3 -m promptda.scripts.infer_stray_scan --input_path ${PATH_TO_ZIP_FILE} --output_path ${PATH_TO_SAVE_FOLDER}
python3 -m promptda.scripts.generate_video process_stray_scan --input_path ${PATH_TO_ZIP_FILE} --result_path ${PATH_TO_SAVE_FOLDER}
ffmpeg -framerate 60 -i ${PATH_TO_SAVE_FOLDER}/%06d_smooth.jpg -c:v libx264 -pix_fmt yuv420p ${PATH_TO_SAVE_FOLDER}.mp4
4. 典型生态项目
目前,Prompt Depth Anything 项目的生态圈尚在发展之中,但是已经有了一些与之相关的项目和应用,例如:
- 机器人抓取:利用深度估计结果进行更精确的机器人抓取。
- 3D重建:结合深度估计数据进行高质量的三维模型重建。
未来,随着项目的不断发展和完善,预计会有更多的应用场景和生态项目涌现。
PromptDA [CVPR 2025] Prompt Depth Anything 项目地址: https://gitcode.com/gh_mirrors/pr/PromptDA
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考