深度估计开源项目:Prompt Depth Anything 使用教程

深度估计开源项目:Prompt Depth Anything 使用教程

PromptDA [CVPR 2025] Prompt Depth Anything PromptDA 项目地址: https://gitcode.com/gh_mirrors/pr/PromptDA

1. 项目介绍

Prompt Depth Anything 是一个用于4K分辨率准确度量深度估计的开源项目。该项目旨在通过提示深度估计的方法,提高深度估计的准确性和鲁棒性,适用于机器人抓取、3D重建等场景。项目基于深度学习模型,并提供了预训练模型以及相应的训练和推理代码。

2. 项目快速启动

环境搭建

首先,需要克隆项目仓库:

git clone https://github.com/DepthAnything/PromptDA.git
cd PromptDA

然后,安装项目所需的依赖:

pip install -r requirements.txt
pip install -e .

此外,还需要安装ffmpeg以生成视频结果:

sudo apt install ffmpeg

预训练模型

项目提供了两个预训练模型:Prompt-Depth-Anything-Large 和 Prompt-Depth-Anything-Small。可以从以下链接下载:

使用示例

以下是一个简单的使用示例,加载模型并对图像进行深度估计:

from promptda.promptda import PromptDA
from promptda.utils.io_wrapper import load_image, load_depth, save_depth

DEVICE = 'cuda'
image_path = "assets/example_images/image.jpg"
prompt_depth_path = "assets/example_images/arkit_depth.png"

image = load_image(image_path).to(DEVICE)
prompt_depth = load_depth(prompt_depth_path).to(DEVICE)

model = PromptDA.from_pretrained("depth-anything/prompt-depth-anything-vitl").to(DEVICE).eval()
depth = model.predict(image, prompt_depth)

save_depth(depth, prompt_depth=prompt_depth, image=image)

3. 应用案例和最佳实践

自定义数据捕获

可以使用 Stray Scanner App 捕获自定义数据。Stray Scanner App 需要iPhone 12 Pro或更新的Pro型号,或iPad 2020 Pro或更新的Pro型号。以下是测试步骤:

  1. 使用 Stray Scanner App 捕获场景。
  2. 使用 iPhone Files App 将捕获的数据压缩成zip文件并传输到计算机。
  3. 运行以下命令来推断模型并生成视频结果:
export PATH_TO_ZIP_FILE=data/your_zip_file.zip
export PATH_TO_SAVE_FOLDER=data/your_results_folder

python3 -m promptda.scripts.infer_stray_scan --input_path ${PATH_TO_ZIP_FILE} --output_path ${PATH_TO_SAVE_FOLDER}
python3 -m promptda.scripts.generate_video process_stray_scan --input_path ${PATH_TO_ZIP_FILE} --result_path ${PATH_TO_SAVE_FOLDER}
ffmpeg -framerate 60 -i ${PATH_TO_SAVE_FOLDER}/%06d_smooth.jpg -c:v libx264 -pix_fmt yuv420p ${PATH_TO_SAVE_FOLDER}.mp4

4. 典型生态项目

目前,Prompt Depth Anything 项目的生态圈尚在发展之中,但是已经有了一些与之相关的项目和应用,例如:

  • 机器人抓取:利用深度估计结果进行更精确的机器人抓取。
  • 3D重建:结合深度估计数据进行高质量的三维模型重建。

未来,随着项目的不断发展和完善,预计会有更多的应用场景和生态项目涌现。

PromptDA [CVPR 2025] Prompt Depth Anything PromptDA 项目地址: https://gitcode.com/gh_mirrors/pr/PromptDA

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

穆继宪Half-Dane

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值