视频分帧,图像crop,拼接,帧合视频

本文介绍了如何使用Python进行视频分帧、图像裁剪、添加边框及拼接等操作,并最终将处理后的图像重新组合成视频的过程。涉及的技术包括OpenCV和PIL库的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

视频分帧

#!/usr/bin/env python2
# -*- coding: utf-8 -*-
"""
Created on Tue Jun 26 17:29:15 2018

@author: jianyuchen
"""

import cv2  
video='/home/jianyuchen/caffe-master/data/ucf101/v_BrushingTeeth_g24_c05.avi'
vidcap = cv2.VideoCapture(video)  
success,image = vidcap.read()  
count = 0  
success = True  
savefile = '/home/jianyuchen/caffe-master/data/ucf101/frames/24little/'
while success:  
  success,image = vidcap.read()  
  res=cv2.resize(image,(160,120),interpolation=cv2.INTER_CUBIC) # resize
  res = cv2.copyMakeBorder(res,60,60,80,80,cv2.BORDER_CONSTANT,value=[255,255,255])#add white margin
  cv2.imwrite(savefile+"%d.jpg" % count, res)     # save frame as JPEG file  
  if cv2.waitKey(10) == 27:                       
      break  
  count += 1  

  #cv2.imshow('res',res)
  #cv2.waitKey(0)

图像crop:

#!/usr/bin/env python2
# -*- coding: utf-8 -*-
"""
Created on Wed Jun 27 21:55:56 2018

@author: jianyuchen
"""

from PIL import Image
import cv2
import numpy

for i in range(217):
    imgfile = "/home/jianyuchen/caffe-master/data/ucf101/frames/24little/"+str(i)+".jpg"
    img=Image.open(imgfile)
    box = (110,90,180,160)
    roi = img.crop(box)
    roi = cv2.cvtColor(numpy.asarray(roi),cv2.COLOR_RGB2BGR) # Image covert to uint8
    roi=cv2.resize(roi,(140,140),interpolation=cv2.INTER_CUBIC) # resize
    roi = cv2.copyMakeBorder(roi,25,25,45,45,cv2.BORDER_CONSTANT,value=[255,255,255])#add white margin
    cv2.imwrite("/home/jianyuchen/caffe-master/data/ucf101/frames/24littlecrop/"+str(i)+".jpg",roi)

这里写图片描述

图像加白边

#!/usr/bin/env python2
# -*- coding: utf-8 -*-
"""
Created on Wed Jun 27 21:11:59 2018

@author: jianyuchen
"""

import cv2



# size = 1920, 1080  

img = cv2.imread('/home/jianyuchen/caffe-master/data/ucf101/frames/24little/0.jpg')  

a = cv2.copyMakeBorder(img,30,30,40,40,cv2.BORDER_CONSTANT,value=[255,255,255])


cv2.imshow('img',img)
cv2.waitKey(0)

cv2.imshow('a',a)
cv2.waitKey(0)

这里写图片描述
图片拼接

#!/usr/bin/env python2
# -*- coding: utf-8 -*-
"""
Created on Tue Jun 26 22:21:52 2018

@author: jianyuchen
"""

from PIL import Image
import matplotlib.pyplot as plt


for i in range(217):
    imgfile = "/home/jianyuchen/caffe-master/data/ucf101/frames/24littlecropcam/"+str(i)+".jpg"
    imgorifile = "/home/jianyuchen/caffe-master/data/ucf101/frames/24littlecrop/"+str(i)+".jpg"
    img=Image.open(imgfile)
    imgori = Image.open(imgorifile)
    imgori=imgori.resize((320,240)) #imgori resize
    box = (56,18,376,258)
    roi = img.crop(box)

    toImage = Image.new('RGBA',(320,480))

    fromImge = imgori
    # loc = ((i % 2) * 200, (int(i/2) * 200))
    loc = ((int(0/2) * 320), (0 % 2) * 240)
    print(loc)
    toImage.paste(fromImge, loc)


    fromImge = roi
    # loc = ((i % 2) * 200, (int(i/2) * 200))
    loc = ((int(1/2) * 320), (1 % 2) * 240)
    print(loc)
    toImage.paste(fromImge, loc)
    toImage.save("/home/jianyuchen/caffe-master/data/ucf101/frames/24littlecroppinjie/"+str(i)+".png")
'''
img=Image.open('/home/jianyuchen/caffe-master/data/ucf101/frames/14cam/0.jpg')  #打开图像
plt.figure("beauty")
plt.subplot(1,2,1), plt.title('origin')
plt.imshow(img),plt.axis('off')

box=(56,18,376,258)
roi=img.crop(box)
plt.subplot(1,2,2), plt.title('roi')
plt.imshow(roi),plt.axis('off')
plt.show()


toImage = Image.new('RGBA',(320,480))

fromImge = Image.open('/home/jianyuchen/caffe-master/data/ucf101/frames/14/frame0.jpg')
# loc = ((i % 2) * 200, (int(i/2) * 200))
loc = ((int(0/2) * 320), (0 % 2) * 240)
print(loc)
toImage.paste(fromImge, loc)


fromImge = roi
# loc = ((i % 2) * 200, (int(i/2) * 200))
loc = ((int(1/2) * 320), (1 % 2) * 240)
print(loc)
toImage.paste(fromImge, loc)

这里写图片描述

帧合视频

#!/usr/bin/env python2
# -*- coding: utf-8 -*-
"""
Created on Tue Jun 26 22:06:15 2018

@author: jianyuchen
"""

import cv2
import os
filenames = []
for filename in os.listdir(r"/home/jianyuchen/caffe-master/data/ucf101/frames/24little4pinjie"):
    filenames.append(int(filename.split('.')[0]))

filenames.sort()

fps = 5   #视频帧率
fourcc = cv2.VideoWriter_fourcc('M','J','P','G')  
videofile='/home/jianyuchen/caffe-master/data/ucf101/frames/24little4.avi'
videoWriter = cv2.VideoWriter(videofile, fourcc, fps, (640,480))   #(1360,480)为视频大小
#for i in range(217):
for i in filenames:
    imgfile =  "/home/jianyuchen/caffe-master/data/ucf101/frames/24little4pinjie/"+str(i)+".png"
    img = cv2.imread(imgfile)
#    cv2.imshow('img', img12)
#    cv2.waitKey(1000/int(fps))
    videoWriter.write(img)
videoWriter.release()
360度非鱼眼视频生成全景图拼接是一个比较复杂的问题,需要涉及到视频处理、图像处理、几何变换、全景图拼接等多个领域。这里我简单介绍一下大致的思路以及实现方法。 1. 首先需要从360度非鱼眼视频中抽取一些关键,一般可以采用视频关键提取算法来实现。关键提取算法可以根据间差异、运动模糊等因素来确定哪些是比较重要的,可以参考一些经典的算法如 SIFT、SURF、ORB 等。 2. 对于每一视频,需要做一些预处理操作,包括去除镜头畸变、对齐、裁剪等。针对去除镜头畸变,可以采用基于一些几何变换的方法,比如将原始视频图像投影到球面上,再将球面图像展开为平面图像,这样就可以去除鱼眼畸变。对于对齐和裁剪,可以采用图像特征匹配算法,找出每一图像中重要的特征点,并将这些特征点对齐,然后再进行裁剪。 3. 将每一图像拼接成全景图。这里可以采用一些拼接算法,比如基于图像特征匹配的拼接算法、基于光流的拼接算法、基于直接图像拼接的算法等。其中最常用的是基于图像特征匹配的拼接算法,具体流程包括:首先找出每张图像中的关键点,并计算出每个关键点的特征描述子;然后对每两张相邻的图像进行特征匹配,找出匹配的关键点对;接着通过计算每个关键点对的变换矩阵,将相邻的图像进行对齐;最后将对齐后的图像进行融即可。 这里给出一个基于 OpenCV 和 Python 的代码示例,实现了从一段 360 度非鱼眼视频中抽取关键、去除镜头畸变、对齐、裁剪和拼接的全流程。 ```python import cv2 import numpy as np from itertools import tee, izip # 视频文件路径 video_path = 'input_video.mp4' # 一些参数设置 keyframe_interval = 30 # 抽取的关键间隔 crop_width = 1280 # 裁剪后的图像宽度 crop_height = 720 # 裁剪后的图像高度 # 定义一个函数,用于将图像投影到球面上 def equirectangular_projection(frame, fov=90): h, w = frame.shape[:2] f = w / (2 * np.tan(fov * np.pi / 360)) K = np.array([[f, 0, w / 2], [0, f, h / 2], [0, 0, 1]]) theta = np.arccos((np.arange(h) - h / 2) / f) phi = np.arange(w) * 2 * np.pi / w phi, theta = np.meshgrid(phi, theta) x = np.sin(theta) * np.cos(phi) * f y = np.sin(theta) * np.sin(phi) * f z = np.cos(theta) * f X = np.stack([x, y, z], axis=-1) X = np.reshape(X, [-1, 3]).T X = np.vstack([X, np.ones([1, X.shape[1]])]) X = np.dot(np.linalg.inv(K), X) X = np.reshape(X[:-1, :], [h, w, 3]) X = cv2.remap(frame, X[..., 0].astype(np.float32), X[..., 1].astype(np.float32), cv2.INTER_LINEAR) return X # 定义一个函数,用于抽取关键 def keyframe_extraction(cap, interval): frames = [] count = 0 while True: ret, frame = cap.read() if not ret: break if count % interval == 0: frames.append(frame) count += 1 return frames # 定义一个函数,用于去除镜头畸变、对齐和裁剪 def preprocess_frame(frame): # 去除镜头畸变 frame = equirectangular_projection(frame) # 对齐 # TODO: 实现图像特征匹配算法对齐图像 # 裁剪 h, w = frame.shape[:2] x = int((w - crop_width) / 2) y = int((h - crop_height) / 2) frame = frame[y:y+crop_height, x:x+crop_width] return frame # 定义一个函数,用于将一组图像拼接成全景图 def stitch_images(images): # TODO: 实现基于图像特征匹配的图像拼接算法 # 将图像拼接成全景图 panorama = np.concatenate(images, axis=1) return panorama # 打开视频文件 cap = cv2.VideoCapture(video_path) # 抽取关键 frames = keyframe_extraction(cap, keyframe_interval) # 预处理每一图像 frames = [preprocess_frame(frame) for frame in frames] # 将一组图像拼接成全景图 panorama = stitch_images(frames) # 显示全景图 cv2.imshow('Panorama', panorama) cv2.waitKey(0) # 释放资源 cap.release() cv2.destroyAllWindows() ``` 需要注意的是,这段代码中的关键提取、图像对齐、图像拼接等部都需要根据具体场景进行改进和调整,只能作为一个大体的参考。另外,这段代码中的图像拼接算法采用的是简单的图像拼接方法,对于一些特殊场景可能会出现拼接不完整、拼接出错等问题,需要根据具体情况进行改进。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值