距离变换及其数学推导

距离变换

假设二值图像I,其中有前景点集F,背景点集B。则由通过距离变换可以得到距离图D。
其中

D(p)=min(d(p,q)),pF,qB

由这个简单的想法我们可以得到距离变换的实现代码

double ComputeEuDistance(Point2i x1, Point2i x2)
{
    return norm(x1 - x2);
}
Mat BruteForceDistanceTransform(Mat binary_img)
{
    vector<Point2i> foreth;
    vector<Point2i> background;

    for (size_t i = 0; i < binary_img.rows; i++)
    {
        for (size_t j = 0; j < binary_img.cols; j++)
        {
            if (binary_img.at<uchar>(j, i))
                foreth.emplace_back(j, i);
            else
                background.emplace_back(j, i);
        }
    }
    Mat result = Mat::zeros(binary_img.rows, binary_img.cols, CV_8U);
    for (auto& pf : foreth)
    {
        double mind = INFINITY;
        for (auto& bf : background)
        {
            auto d = ComputeEuDistance(pf, bf);
            mind = min(mind, d);
        }
        result.at<uchar>(pf) = mind;
    }
    double minimal, maximum;
    minMaxLoc(result, &minimal, &maximum);
    result = (result - minimal) * (255.0 / (maximum - minimal));
    return result;
}

L1-norm和L∞-norm下的加速

显然,上述算法时间复杂度过高,消耗的时间往往是不能接受的。

实际实现的时候,我们可以利用图像在空间上的连续性和在存储上的离散性进行加速。

在1-范数和∞-范数下(也就是所谓的街区距离和棋盘距离),我们可以通过相邻像素点的空间关系得到线性时间复杂度的算法。

1-范数下,我们可以通过对图像进行一次从左上到右下的遍历和一次相反方向的遍历来计算距离变换。第一次遍历的时候对当前前景点p,和它左边与上边的点q0,q1,我们有D(p)=min(D(q0),D(q1))+1。

第二次遍历的时候对当前前景点p,和它右边与下边的点q2,q3,我们有D(p) = min(D(p),min(D(q2),D(q3))+1)。

由此得到如下代码:

Mat L1DistanceTransform(Mat binary_img)
{
    Mat result = binary_img.clone()/255;
    for (size_t i = 1; i < result.rows; i++)
    {
        for (size_t j = 1; j < result.cols; j++)
        {
            if (result.at<uchar>(j, i))
            {
                result.at<uchar>(j, i) = min(result.at<uchar>(j - 1, i), result.at<uchar>(j, i - 1)) + 1;
            }
        }
    }
    for (int i = result.rows - 2; i >=0; i--)
    {
        for (int j = result.cols - 2; j >=0; j--)
        {
            if (result.at<uchar>(j, i))
            {
                result.at<uchar>(j, i) = min((int)result.at<uchar>(j, i),
                    (min(result.at<uchar>(j + 1, i), result.at<uchar>(j, i + 1))+1) );
            }
        }
    }
    double minimal, maximum;
    minMaxLoc(result, &minimal, &maximum);
    result = (result - minimal) * (255.0 / (maximum - minimal));
    return result;
}

对于L-norm可以用类似的方法得到距离变换。在此就不展开。

L2-norm下的加速

使用棋盘距离和街区距离可以得到线性复杂度的算法,然而问题是这两种距离都没有旋转不变性,也不符合人类直觉。在许多场合欧氏距离进行变换可以得到更好的效果。

好在使用类似的思路,我们也可以对欧氏距离下的距离变换进行加速。假设前景一点p和它周围的一点q,假设已经算出了q的距离变换且离q最近的点为r,d(p,r)>d(q,r),我们有D(p)2=d(p,r)2=d(q,r)2+Δ

于是有

D(p)2=minid(qi,r)2+Δ

其中

Δ=2(qr)x+12(qr)y+12((qr)x+(qr)y+1)qpqpqp

同样的,通过两次遍历我们可以得到图像的距离变换,代码如下:
inline int hqp(const int Rx, const int Ry, const int i)
{
    static int G[][2] = { { 1,0 },{ 1,1 },{ 0,1 },{ 1,1 },{ 1,0 },{ 1,1 },{ 0,1 },{ 1,1 } };
    return G[i][0] * (2 * Rx + 1) + G[i][1] * (2 * Ry + 1);
}

//EDT
Mat EuclidienDistanceTransform(const Mat& binary_img)
{
    /*
    q2 q3 q4
    q1 p  q5
    q8 q7 q6
    */
    pair<Mat, Mat> R{ Mat::zeros(binary_img.rows, binary_img.cols, CV_32S) ,
        Mat::zeros(binary_img.rows, binary_img.cols, CV_32S) };
    Mat result = Mat::zeros(binary_img.rows, binary_img.cols,  CV_32S);
    static int G[][2] = { { 1,0 },{ 1,1 },{ 0,1 },{ 1,1 },{ 1,0 },{ 1,1 },{ 0,1 },{ 1,1 } };
    static int q[8][2] = { { -1,0 },{ -1, -1 },{ 0,-1 },{ 1,-1 },{ 1,0 },{ 1,1 },{ 0,1 },{ -1,1 } };
    int qindex[8];
    const int h = result.rows;
    const int w = result.cols;
    for (size_t i = 0; i < 8; i++)
    {
        qindex[i] = q[i][0] + q[i][1] * w;
    }
    int* result_ptr = result.ptr<int>();
    int* Rx_ptr = R.first.ptr<int>();
    int* Ry_ptr = R.second.ptr<int>();
    const unsigned char* binary_img_ptr = binary_img.ptr<uchar>();

    for (size_t i = 1; i < h - 1; i++)
    {
        int index = w*i;
        for (size_t j = 1; j < w - 1; j++)
        {
            index++;
            if (binary_img_ptr[index])
            {
                int& fp = result_ptr[index];
                fp = INT16_MAX;
                int& Rpx = Rx_ptr[index];
                int& Rpy = Ry_ptr[index];
                for (size_t k = 0; k < 4; k++)
                {
                    int absqindex = index + qindex[k];
                    auto Rx = Rx_ptr[absqindex];
                    auto Ry = Ry_ptr[absqindex];
                    auto hp = result_ptr[absqindex] + hqp(Rx, Ry, k);
                    if (hp< fp)
                    {
                        fp = hp;
                        Rpx = Rx + G[k][0];
                        Rpy = Ry + G[k][1];
                    }
                }
            }
        }
    }
    for (int i = h - 2; i >= 1; i--)
    {
        int index = w*i + w - 1;
        for (int j = w - 2; j >= 1; j--)
        {
            index--;
            if (binary_img_ptr[index])
            {
                int& fp = result_ptr[index];
                int& Rpx = Rx_ptr[index];
                int& Rpy = Ry_ptr[index];
                for (int k = 4; k < 8; k++)
                {
                    int absqindex = index + qindex[k];
                    auto Rx = Rx_ptr[absqindex];
                    auto Ry = Ry_ptr[absqindex];
                    auto hp = result_ptr[absqindex] + hqp(Rx, Ry, k);
                    if (hp < fp)
                    {
                        fp = hp;
                        Rpx = Rx + G[k][0];
                        Rpy = Ry + G[k][1];
                    }
                }
            }
        }
    }

    Mat result1;
    result.convertTo(result1, CV_32F);
    sqrt(result1, result1);
    double minimal, maximum;
    minMaxLoc(result1, &minimal, &maximum);
    //cout << minimal << " " << maximum << endl;
    result1 = (result1 - minimal) * (255.0 / (maximum - minimal));
    Mat rr;
    result1.convertTo(rr, CV_8U);
    return rr;
}
Radon变换是一种将图像从空间域转换到投影域的数学工具,其核心思想是通过积分操作提取图像在不同方向上的投影信息。假设有一个二维连续函数 $ f(x, y) $,表示图像的灰度分布,Radon变换定义为该函数在所有可能直线上的线积分。设某条直线可以表示为: $$ x \cos \theta + y \sin \theta = s $$ 其中,$ s $ 是从原点到该直线的垂直距离,$ \theta $ 是该直线与 $ x $ 轴之间的夹角。 Radon变换数学表达式为: $$ R(s, \theta) = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f(x, y) \delta(x \cos \theta + y \sin \theta - s) \, dx \, dy $$ 其中,$ \delta $ 是Dirac delta函数,用于描述图像在直线 $ x \cos \theta + y \sin \theta = s $ 上的积分值 [^1]。 Radon变换推导过程可以从线积分的几何意义出发。首先,将笛卡尔坐标系中的图像函数 $ f(x, y) $ 转换为极坐标系下的表示形式。对于任意给定的角度 $ \theta $,可以通过旋转坐标系的方式将图像变换到新的坐标系中,其中 $ s $ 表示投影的坐标轴方向。此时,图像函数在该方向上的投影可以表示为沿 $ s $ 轴的积分: $$ R(s, \theta) = \int_{-\infty}^{\infty} f(s \cos \theta - t \sin \theta, s \sin \theta + t \cos \theta) \, dt $$ 该公式表示图像在方向 $ \theta $ 上的投影,即沿该方向的所有点的灰度值积分 [^1]。 为了进一步理解Radon变换与傅里叶变换之间的关系,可以引入中心切片定理(Central Slice Theorem)。该定理指出,图像的二维傅里叶变换在某一方向上的切片等于该图像在相同方向上的Radon变换的一维傅里叶变换。具体而言: $$ \mathcal{F}_2\{f(x, y)\}(\omega \cos \theta, \omega \sin \theta) = \mathcal{F}_1\{R(s, \theta)\}(\omega) $$ 其中,$ \mathcal{F}_2 $ 和 $ \mathcal{F}_1 $ 分别表示二维和一维傅里叶变换。这一关系为Radon反变换推导提供了理论基础,即可以通过傅里叶域的方法实现图像重建 [^1]。 Radon反变换数学表达式可以表示为: $$ f(x, y) = \int_{0}^{\pi} \int_{-\infty}^{\infty} R(s, \theta) \frac{1}{\sqrt{x^2 + y^2 - s^2}} \, ds \, d\theta $$ 在实际应用中,为了提高图像重建的精度,通常采用滤波反投影(Filtered Back-Projection, FBP)方法。该方法利用Radon变换的傅里叶性质,将投影数据在频域中进行滤波处理,然后执行反投影操作。滤波函数通常为 $ |\omega| $,用于补偿Radon变换过程中引入的模糊效应 [^1]。 ### 示例代码:使用MATLAB实现Radon变换及其变换 ```matlab % 定义图像和投影角度 I = phantom(256); % 生成Shepp-Logan仿真头模图像 theta = 0:180; % 投影角度范围 % 执行Radon变换 [R, xp] = radon(I, theta); % 执行Radon反变换(滤波反投影) I_recon = iradon(R, theta, 'linear', 'none', 1.0); % 显示原始图像和重建图像 figure; subplot(1, 2, 1); imshow(I); title('原始图像'); subplot(1, 2, 2); imshow(I_recon, []); title('重建图像'); ``` 上述代码展示了如何在MATLAB中使用内置函数 `radon` 和 `iradon` 实现Radon变换及其变换,并对重建结果进行可视化展示。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值