引自:http://blog.youkuaiyun.com/itcastcpp/article/details/20282667
Depth在kinect中经常被翻译为深度图,指的是图像到摄像头的距离,这些距离数据能让机器知道物理距离有多远。kinect通过两个红外摄像头来实现这个功能的。在这个例子里,就实现了深度图的提取和现实功能。
下面我们来研究下这个例子的代码,让我们对kinect for windows的开发包有个粗浅的认识。
代码结构:
主要的代码是DepthBasic.cpp,这个代码实现了深度图的读取
另外一个主要的代码文件时ImageRenderer,这个代码实现的是,将获取的深度图,展示在窗口上。
main函数:
int APIENTRY wWinMain(HINSTANCE hInstance, HINSTANCE hPrevInstance, LPWSTR lpCmdLine, int nCmdShow)
{
CDepthBasics application;
application.Run(hInstance, nCmdShow);
}
从main函数看,main函数只调用了两个函数,一个是CDepthBasics的构造函数,另外一个是CDepthBasics的Run函数。构造函数只是初始化,我们略过,继续看Run函数。
CDepthBasics::Run函数,解释都在代码中,大家可以看注释
int CDepthBasics::Run(HINSTANCE hInstance, int nCmdShow)
{
MSG msg = {0};
WNDCLASS wc;
// Dialog custom window class win32创建窗口前的准备工作,构造窗口类结构
ZeroMemory(&wc, sizeof(wc));
wc.style = CS_HREDRAW | CS_VREDRAW;
wc.cbWndExtra = DLGWINDOWEXTRA;
wc.hInstance = hInstance;
wc.hCursor = LoadCursorW(NULL, IDC_ARROW);
wc.hIcon = LoadIconW(hInstance, MAKEINTRESOURCE(IDI_APP));
wc.lpfnWndProc = DefDlgProcW;
wc.lpszClassName = L"DepthBasicsAppDlgWndClass";
// 注册窗口类
if (!RegisterClassW(&wc))
{
return 0;
}
// Create main application window 用该窗口类创建对话框
HWND hWndApp = CreateDialogParamW(
hInstance,
MAKEINTRESOURCE(IDD_APP),
NULL,
(DLGPROC)CDepthBasics::MessageRouter,
reinterpret_cast<LPARAM>(this));
// Show window 显示对话框
ShowWindow(hWndApp, nCmdShow);
// 这个用来检测kinect消息的event
const int eventCount = 1;
HANDLE hEvents[eventCount];
// Main message loop windwos消息循环,在这个消息循环里,如果没有kinect,那就是简单的处理窗口消息即可,但是....
while (WM_QUIT != msg.message)
{
// 为什么在这里赋值,相当于每次循环都赋值?因为这个句柄随着消息处理会变化
hEvents[0] = m_hNextDepthFrameEvent;
// 检查kinect事件,第一个参数1表示等待一个句柄,第二个参数是消息数组,第三个参数指示是不是要等数组里的所有消息,参数是false
// 第四个参数是等待多久,INFINITE表示永远,第五个参数呢,因为第四个参数说没有kinect消息这个函数就一直阻塞这里,那么它肯定可能影响正常的windows消息处理
// 所以第五个参数表示说有些情况下也要打断这个等待,QS_ALLINPUT就表示在有windows消息时,该函数也不再阻塞的继续往下执行
DWORD dwEvent = MsgWaitForMultipleObjects(eventCount, hEvents, FALSE, INFINITE, QS_ALLINPUT);
// Check if this is an event we're waiting on and not a timeout or message 返回WAIT_OBJECT_0表示kinect有消息来,否则表示没消息
if (WAIT_OBJECT_0 == dwEvent)
{
// 处理kinect的消息
Update();
}
// 处理windows消息
if (PeekMessageW(&msg, NULL, 0, 0, PM_REMOVE))
{
// If a dialog message will be taken care of by the dialog proc
if ((hWndApp != NULL) && IsDialogMessageW(hWndApp, &msg))
{
continue;
}
TranslateMessage(&msg);
DispatchMessageW(&msg);
}
}
return static_cast<int>(msg.wParam);
}
从Run函数可以看出,对kinect的处理主要在Update函数中,在看Update函数之前,我们要考虑一点,就是对象的初始化,在构造函数中,只是赋值为NULL,像m_hNextDepthFrameEvent这样的对象,它是啥时候被初始化的呢?这个就需要读者对windows窗口机制要有一些了解了,在Run的时候,调用CreateDialogParamW函数时,系统会给对话框发送窗口初始化消息WM_INITDIALOG消息,那么这些句柄的初始化,都是在窗口初始化的时候做的,所以在看Update函数之前,我们先看窗口初始化的处理:
LRESULT CALLBACK CDepthBasics::DlgProc(HWND hWnd, UINT message, WPARAM wParam, LPARAM lParam)
{
switch (message)
{
case WM_INITDIALOG:
{
// Bind application window handle
m_hWnd = hWnd;
// Init Direct2D 初始化DirectX
D2D1CreateFactory(D2D1_FACTORY_TYPE_SINGLE_THREADED, &m_pD2DFactory);
// Create and initialize a new Direct2D image renderer (take a look at ImageRenderer.h)
// We'll use this to draw the data we receive from the Kinect to the screen 创建图片展示对象
m_pDrawDepth = new ImageRenderer();
// 初始化展示对象,这里用到了窗口,用到了DirectX对象,以及宽度高度参数
HRESULT hr = m_pDrawDepth->Initialize(GetDlgItem(m_hWnd, IDC_VIDEOVIEW), m_pD2DFactory, cDepthWidth, cDepthHeight, cDepthWidth * sizeof(long));
if (FAILED(hr))
{
SetStatusMessage(L"Failed to initialize the Direct2D draw device.");
}
// Look for a connected Kinect, and create it if found,连接kinect设备
CreateFirstConnected();
}
break;
在DlgProc的消息处理函数中我们看到了WM_INITDIALOG的处理,在这里初始化了DirectX和ImageRenderer对象,最后调用了CreateFirstConnected函数去查找和初始化Kinect对象。
下面是初始化Kinect设备代码
HRESULT CDepthBasics::CreateFirstConnected()
{
INuiSensor * pNuiSensor;
HRESULT hr;
int iSensorCount = 0;
hr = NuiGetSensorCount(&iSensorCount); // 获取连接的kinect数量
if (FAILED(hr))
{
return hr;
}
// Look at each Kinect sensor 对每个kinect进行初始化
for (int i = 0; i < iSensorCount; ++i)
{
// Create the sensor so we can check status, if we can't create it, move on to the next
// 获取kinect对象
hr = NuiCreateSensorByIndex(i, &pNuiSensor);
if (FAILED(hr))
{
continue;
}
// Get the status of the sensor, and if connected, then we can initialize it
// 查看kinect状态,有的设备没连接电源,也许有的设备有其他异常
hr = pNuiSensor->NuiStatus();
if (S_OK == hr) // 如果有一台正常的,那我们这个程序的初始化就算完毕了,因为这个例子只用一个kinect而已
{
m_pNuiSensor = pNuiSensor;
break;
}
// This sensor wasn't OK, so release it since we're not using it 如果是不正常的设备,那么Release掉,免得内存泄露
pNuiSensor->Release();
}
// 如果m_pNuiSensor不为空,那表明找到某一个正常的kinect设备了
if (NULL != m_pNuiSensor)
{
// 初始化kinect,用NUI_INITIALIZE_FLAG_USES_DEPTH表示要使用深度图
hr = m_pNuiSensor->NuiInitialize(NUI_INITIALIZE_FLAG_USES_DEPTH);
if (SUCCEEDED(hr))
{
// 创建这个Event,这个Event是kinect和应用程序通信的Event,当kinect有消息时,kinect SDK会通过SetEvent来通知应用程序
// 应用程序则通过WaitObject来等待这个Event,完成通信
m_hNextDepthFrameEvent = CreateEvent(NULL, TRUE, FALSE, NULL);
// Open a depth image stream to receive depth frames
// 打开深度图流,用来接收图像
hr = m_pNuiSensor->NuiImageStreamOpen(
NUI_IMAGE_TYPE_DEPTH, // 表示要打开深度图流
NUI_IMAGE_RESOLUTION_640x480, // 深度图大小
0, // 帧设置,0表示无设置
2, // 缓存多少帧,最大为4
m_hNextDepthFrameEvent, // 用来通信的Event句柄
&m_pDepthStreamHandle); // 用来读取数据的流句柄,要从这里读取深度图数据
}
}
if (NULL == m_pNuiSensor || FAILED(hr))
{
SetStatusMessage(L"No ready Kinect found!");
return E_FAIL;
}
return hr;
}
通过上篇文章,我们了解了在视频图像从kinect开发包传输到应用程序之前的一系列初始化工作,那么这篇文章主要来叙述,如何将一帧图像数据获取到,并显示出来的。
更新窗口是在Run函数消息处理中,当KinectSDK触发了m_hNextDepthFrameEvent之后,上层收到这个Event就调用Update函数去更新窗口了。关键代码如下图,Run函数的全部代码也可以从上一篇博文中找到:
Update函数:
void CDepthBasics::Update()
{
if (NULL == m_pNuiSensor) // 如果pNuiSensor为空,那说明设备还没有初始化
{
return;
}
// 继续判断m_hNextDepthFrameEvent是否有消息,其实这个判断这里可以去掉,但是考虑鲁棒性,还是留着吧
if ( WAIT_OBJECT_0 == WaitForSingleObject(m_hNextDepthFrameEvent, 0) )
{
ProcessDepth(); // 处理
}
}
update函数做了一些错误处理,真正的更新窗口的代码在ProcessDepth中,接下来看ProcessDepth函数
void CDepthBasics::ProcessDepth()
{
HRESULT hr;
NUI_IMAGE_FRAME imageFrame;
// 通过kinect对象,从m_pDepthStreamHandle中获取图像数据,还记得m_pDepthStreamHandle么,是在初始化kinect设备时创建的深度图流
// 在这里调用这个代码的意义是:将一帧深度图,保存在imageFrame中
hr = m_pNuiSensor->NuiImageStreamGetNextFrame(m_pDepthStreamHandle, 0, &imageFrame);
if (FAILED(hr))
{
return;
}
BOOL nearMode;
INuiFrameTexture* pTexture;
// Get the depth image pixel texture,通过imageFrame把数据转化成纹理
hr = m_pNuiSensor->NuiImageFrameGetDepthImagePixelFrameTexture(
m_pDepthStreamHandle, &imageFrame, &nearMode, &pTexture);
if (FAILED(hr))
{
goto ReleaseFrame;
}
NUI_LOCKED_RECT LockedRect;
// Lock the frame data so the Kinect knows not to modify it while we're reading it,锁定数据
pTexture->LockRect(0, &LockedRect, NULL, 0);
// Make sure we've received valid data
if (LockedRect.Pitch != 0)
{
// Get the min and max reliable depth for the current frame
int minDepth = (nearMode ? NUI_IMAGE_DEPTH_MINIMUM_NEAR_MODE : NUI_IMAGE_DEPTH_MINIMUM) >> NUI_IMAGE_PLAYER_INDEX_SHIFT;
int maxDepth = (nearMode ? NUI_IMAGE_DEPTH_MAXIMUM_NEAR_MODE : NUI_IMAGE_DEPTH_MAXIMUM) >> NUI_IMAGE_PLAYER_INDEX_SHIFT;
// 将m_depthRGBX的首地址保存在rgbrun,方便赋值
BYTE * rgbrun = m_depthRGBX;
const NUI_DEPTH_IMAGE_PIXEL * pBufferRun = reinterpret_cast<const NUI_DEPTH_IMAGE_PIXEL *>(LockedRect.pBits);
// end pixel is start + width*height - 1
const NUI_DEPTH_IMAGE_PIXEL * pBufferEnd = pBufferRun + (cDepthWidth * cDepthHeight);
// 对m_depthRGBX也就是rgbrun赋值
while ( pBufferRun < pBufferEnd )
{
// discard the portion of the depth that contains only the player index
USHORT depth = pBufferRun->depth;
// To convert to a byte, we're discarding the most-significant
// rather than least-significant bits.
// We're preserving detail, although the intensity will "wrap."
// Values outside the reliable depth range are mapped to 0 (black).
// Note: Using conditionals in this loop could degrade performance.
// Consider using a lookup table instead when writing production code.
BYTE intensity = static_cast<BYTE>(depth >= minDepth && depth <= maxDepth ? depth % 256 : 0);
// Write out blue byte
*(rgbrun++) = intensity;
// Write out green byte
*(rgbrun++) = intensity;
// Write out red byte
*(rgbrun++) = intensity;
// We're outputting BGR, the last byte in the 32 bits is unused so skip it
// If we were outputting BGRA, we would write alpha here.
++rgbrun;
// Increment our index into the Kinect's depth buffer
++pBufferRun;
}
// Draw the data with Direct2D 最后将m_depthRGBX保存的图片,显示在窗口上
m_pDrawDepth->Draw(m_depthRGBX, cDepthWidth * cDepthHeight * cBytesPerPixel);
}
// We're done with the texture so unlock it,解锁和释放纹理
pTexture->UnlockRect(0);
pTexture->Release();
ReleaseFrame:
// Release the frame 释放帧
m_pNuiSensor->NuiImageStreamReleaseFrame(m_pDepthStreamHandle, &imageFrame);
}
从以上代码可以看到处理Depth数据的流程,获取一个深度图帧,然后经过转换成RGB格式,最后通过ImageRenderer::Draw函数将其画出来。但是ImageRenderer的功能和Kinect关系不大,不是我们学习的重点,因此我们可以先忽略它。那么深度图的获取详细过程就到这里,在下一篇文章中,我们来总结一下这两篇文章所提到的一些Kinect SDK中的函数,并详细了解熟悉这些函数的参数,更进一步的学习Kinect SDK。
这篇文章我们将总结一下,之前两篇文章中提到的Kinect SDK的函数接。
函数接口:
NuiGetSensorCount: 获取连接的Kinect设备个数
原型:_Check_return_ HRESULT NUIAPI NuiGetSensorCount( _In_ int * pCount );
解释:KinectSDK支持多个Kinect设备连接,这个函数能获取到Kinect设备个数。
返回值:返回S_OK是成功,其他失败,其中E_POINTER表示pCount是空指针错误。
NuiCreateSensorByIndex:通过索引创建INuiSensor对象
原型:_Check_return_ HRESULT NUIAPI NuiCreateSensorByIndex( _In_ int index, _Out_ INuiSensor ** ppNuiSensor );
解释:通过指定的下标,获取对应的KinectSensor对象
返回值:返回S_OK是成功,其他失败,错误码有:E_INVALIDARG(index是负数),E_NUI_BADINDEX(index超出范围),E_POINTER(ppNuiSensor是空指针)
NuiStatus:获取Kinect设备状态,它是INuiSensor的成员函数
原型:virtual HRESULT STDMETHODCALLTYPE NuiStatus( void) = 0;
解释:当获取到INuiSensor对象时,应该调用这个函数查看Kinect设备状态,如果状态不对,也是不能使用的。
返回值:返回S_OK是正常,其他失败,错误码如下:
S_NUI_INITIALIZING | The device is connected, but still initializing.设备初始化中 |
E_NUI_NOTCONNECTED | The device is not connected.设备未连接 |
E_NUI_NOTGENUINE | The device is not a valid Kinect.不是一个正常的Kinect |
E_NUI_NOTSUPPORTED | The device is an unsupported model.模式不支持 |
E_NUI_INSUFFICIENTBANDWIDTH | The device is connected to a hub without the necessary bandwidth requirements.插到usb hub中产生的问题 |
E_NUI_NOTPOWERED | The device is connected, but unpowered.没插电 |
E_NUI_NOTREADY | There was some other unspecified error.未知错误 |
NuiInitialize:初始化Kinect设备
原型:virtual HRESULT STDMETHODCALLTYPE NuiInitialize(
/* [in] */ DWORD dwFlags) = 0;
参数:指定初始化模式
Constant | Description |
---|---|
NUI_INITIALIZE_DEFAULT_HARDWARE_THREAD | This flag was deprecated in version 1.5; it is no longer used. |
NUI_INITIALIZE_FLAG_USES_AUDIO | Initialize the sensor to provide audio data. |
NUI_INITIALIZE_FLAG_USES_COLOR | Initialize the sensor to provide color data. |
NUI_INITIALIZE_FLAG_USES_DEPTH | Initialize the sensor to provide depth data. |
NUI_INITIALIZE_FLAG_USES_DEPTH_AND_PLAYER_INDEX | Initialize the sensor to provide depth data with a player index. |
NUI_INITIALIZE_FLAG_USES_SKELETON | Initialize the sensor to provide skeleton data. |
解释:一个设备只有第一次调用这个函数时候会成功,其他应用程序再调用这个函数会失败,也就是说一个设备只能给一个程序用。
返回值:S_OK成功,其他失败
NuiImageStreamOpen:打开Kinect流
原型: virtual HRESULT STDMETHODCALLTYPE NuiImageStreamOpen(
/* [in] */ NUI_IMAGE_TYPE eImageType, // 类型
/* [in] */ NUI_IMAGE_RESOLUTION eResolution, // 分辨率
/* [in] */ DWORD dwImageFrameFlags, // 帧事件选项
/* [in] */ DWORD dwFrameLimit, // kinect缓存的帧数量
/* [in] */ HANDLE hNextFrameEvent, // 手动reset的event,当下一帧数据到来时,kinect会reset它
/* [out] */ HANDLE *phStreamHandle) = 0; // 数据流句柄
返回值:S_OK表示成功,其他失败
Error | Description |
---|---|
E_FAIL | An unspecified error occurred. |
E_INVALIDARG | The value of the dwFlags parameter is NULL. |
E_NUI_DEVICE_NOT_READY | Kinect has not been initialized. |
E_OUTOFMEMORY | The allocation failed. |
E_POINTER | The hNextFrameEvent parameter is an invalid handle. |
NuiImageStreamGetNextFrame:取一帧数据
原型:virtual HRESULT STDMETHODCALLTYPE NuiImageStreamGetNextFrame(
/* [in] */ HANDLE hStream, // 数据流
/* [in] */ DWORD dwMillisecondsToWait, // 等待时间
/* [retval][out] */ NUI_IMAGE_FRAME *pImageFrame) = 0; // 保存数据的指针
返回值:S_OK成功,其他失败
Error | Description |
---|---|
S_FALSE | The waiting timeout expired before a frame was available and hStream was opened using the NUI_IMAGE_STREAM_FLAG_SUPPRESS_NO_FRAME_DATA flag. |
E_INVALIDARG | The value of the hStream parameter is NULL. |
E_NUI_FRAME_NO_DATA | The waiting timeout expired before a frame was available. |
E_POINTER | The value of the pImageFrame parameter is NULL. |
NuiImageFrameGetDepthImagePixelFrameTexture:将深度图转化成纹理
原型:virtual HRESULT STDMETHODCALLTYPE NuiImageFrameGetDepthImagePixelFrameTexture(
/* [in] */ HANDLE hStream, // 数据流
/* [in] */ NUI_IMAGE_FRAME *pImageFrame, // 帧数据
/* [out] */ BOOL *pNearMode, // 近模式,如果kinect离物体比较近,一般就会选择近模式
/* [out] */ INuiFrameTexture **ppFrameTexture) = 0; // 输出参数,转换后的纹理
返回值:S_OK成功,其他失败
LockRect:锁住矩形区域数据,让Kinect不要修改那些数据
原型:virtual HRESULT STDMETHODCALLTYPE LockRect(
UINT Level, // 必须为0
NUI_LOCKED_RECT* pLockedRect, // 传出参数,记录矩形
RECT* pRect, // 该参数暂时不用
DWORD flags) = 0; // 该参数暂时不用
返回值:S_OK成功,其他失败
Error | Description |
---|---|
E_INVALIDARG | The Level parameter is not zero. |
E_OUTOFMEMORY | The texture buffer could not be allocated. |
E_POINTER | The pLockedRect parameter is NULL or the texture has zero height. |
UnlockRect:解锁
原型:HRESULT UnlockRect(UINT level); // Level参数必须为0
返回值:S_OK成功,其他失败,可能的错误码为E_INVALIDARG(level参数不为0)
Error | Description |
---|---|
S_FALSE | The waiting timeout expired before a frame was available and hStream was opened using the NUI_IMAGE_STREAM_FLAG_SUPPRESS_NO_FRAME_DATA flag. |
E_INVALIDARG | The value of the hStream parameter is NULL. |
E_NUI_FRAME_NO_DATA | The waiting timeout expired before a frame was available. |
E_POINTER | The value of the pImageFrame parameter is NULL. |