从图片中提取曲线坐标数据--基于MATLAB

本文介绍了一种使用MATLAB从图片中提取曲线数据的方法。通过灰度转换、二值化等图像处理步骤,配合手动标定,实现了从图表图片中准确获取坐标数据的功能。文章详细解释了处理过程中的关键步骤,包括散点处理、异常点排除和数据拟合。
该文章已生成可运行项目,

在这里插入图片描述
转载: https://zhuanlan.zhihu.com/p/52112012
0.引言
在读文献的时,经常遇到这样的情况:文章里提出的方法好有趣啊,好想拿文中用的数据来试试看看能不能得到相近的结果,可是文中只有根据原始数据绘制的曲线图,没有数据。如下图所示。
在这里插入图片描述

此时,如果能从文中把这幅图截取下来,输入到一个函数中去,最后能返回从图片中提取到的曲线的坐标数据,岂不美哉。

2.MATLAB程序

MATLAB源代码如下所示,和以往的风格一样,提供了详细的注释

% 提取图片中的曲线数据
clear,clc,close all
%% 图片与曲线间的定标
im=imread('tu1.jpg');%读入图片(替换成需要提取曲线的图片)
im=rgb2gray(im);%灰度变化
thresh = graythresh(im);%二值化阈值
im=im2bw(im,thresh);%二值化
set(0,'defaultfigurecolor','w')
imshow(im)%显示图片
[y,x]=find(im==0);%找出图形中的“黑点”的坐标。该坐标是一维数据。
y=max(y)-y;%将屏幕坐标转换为右手系笛卡尔坐标
y=fliplr(y);%fliplr()——左右翻转数组
plot(x,y,'r.','Markersize', 2);
disp('请在Figrure中先后点击实际坐标框的两个顶点(左上点和右下点),即A、B两点. ');
[Xx,Yy]=ginput(2);%Xx,Yy——指实际坐标框的两个顶点
min_x=input('最小的x值');%输入x轴最小值
max_x=input('最大的x值');%输入x轴最大值
min_y=input('最小的y值');%输入y轴最小值
max_y=input('最大的y值');%输入y轴最大值
x=(x-Xx(1))*(max_x-min_x)/(Xx(2)-Xx(1))+min_x;
y=(y-Yy(1))*(min_y-max_y)/(Yy(2)-Yy(1))+max_y;
plot(x,y,'r.','Markersize', 2);
axis([min_x,max_x,min_y,max_y])%根据输入设置坐标范围
title('由原图片得到的未处理散点图')
%% 将散点转换为可用的曲线
%需处理的问题与解决思路
%(1)散点图中可能一个x对应好几个y <---> 保留mean()-std()到mean()+std()之间的y值 并取平均处理
%(2)曲线的最前端和最后段干扰较大 <---> 去掉曲线整体的前(如5%)和后5%
%(3)曲线的最顶端和最底段干扰较大 <---> 去掉曲线整体的上10%和下10%

%参数预设
rate_x=0.08;%曲线的最前端和最后段删除比例
rate_y=0.05;%曲线的最顶端和最底段删除比例

[x_uni,index_x_uni]=unique(x);%找出有多少个不同的x坐标

x_uni(1:floor(length(x_uni)*rate_x))=[];%除去前rate_x(如5%)的x坐标
x_uni(floor(length(x_uni)*(1-rate_x)):end)=[];%除去后rate_x的x坐标
index_x_uni(1:floor(length(index_x_uni)*rate_x))=[];%除去前rate_x的x坐标
index_x_uni(floor(length(index_x_uni)*(1-rate_x)):end)=[];%除去后rate_x的x坐标

[mxu,~]=size(x_uni);
[mx,~]=size(x);
for ii=1:mxu
    if ii==mxu
        ytemp=y(index_x_uni(ii):mx);
    else
        ytemp=y(index_x_uni(ii):index_x_uni(ii+1));
    end
    %删除方差过大的异常点
    threshold1=mean(ytemp)-std(ytemp);
    threshold2=mean(ytemp)+std(ytemp);
    ytemp(find(ytemp<threshold1))=[];%删除同一个x对应的一段y中的异常点
    ytemp(find(ytemp>threshold2))=[];
    %删除距顶端和底端较近的点
    thresholdy=(max_y-min_y)*rate_y;%y坐标向阈值
    ytemp(find(ytemp>max_y-thresholdy))=[];%删除y轴向距离顶端与底端距离小于rate_y的坐标
    ytemp(find(ytemp<min_y+thresholdy))=[];
    %剩下的y求均值
    y_uni(ii)=mean(ytemp);
end
%此时很多x_uni点处对应的y_uni为空,即NAN,要进一步删去这些空点
x_uni(find(isnan(y_uni)))=[];
y_uni(find(isnan(y_uni)))=[];
%画图
figure,plot(x_uni,y_uni),title('经处理后得到的扫描曲线')
axis([min_x,max_x,min_y,max_y])%根据输入设置坐标范围
% 将最终提取到的x与y数据保存
curve_val(1,:)=x_uni';
curve_val(2,:)=y_uni;
%% 对提取出的数据进行拟合(按实际情况进行修改)
[p,s]=polyfit(curve_val(1,:),curve_val(2,:),4);%多项式拟合(为避免龙格库塔,多项式拟合阶数不宜太高)
[y_fit,DELTA]=polyval(p,x_uni,s);%求拟合后多项式在x_uni对应的y_fit值
figure,plot(x_uni,y_fit),title('拟合后的曲线')
axis([min_x,max_x,min_y,max_y])%根据输入设置坐标范围
本文章已经生成可运行项目
从图像中提取曲线坐标数据是科研和工程实践中常见的需求,使用 MATLAB 可以通过多种方法实现这一目标。以下是几种常用的方法和技术要点: 1. **手动点选法** MATLAB 提供了 `ginput` 函数,允许用户通过鼠标手动在图像上选曲线上的点。这种方式适合数据点较少或对精度要求不高的场景。使用方法如下: ```matlab imshow('your_image_file.png'); % 显示图像 [x, y] = ginput; % 手动选点 ``` 此方法简单直接,但依赖人工操作,效率较低且可能存在误差[^2]。 2. **基于图像处理的自动提取法** 如果图像质量较好且曲线颜色与背景对比明显,可以通过图像处理技术自动提取数据点。基本步骤包括: - 将图像转换为二值图像; - 提取曲线像素点; - 将像素坐标转换为实际坐标。 示例代码如下: ```matlab I = imread('your_image_file.png'); % 读图像 I_gray = rgb2gray(I); % 转换为灰度图像 I_binary = imbinarize(I_gray); % 二值化 [y, x] = find(I_binary == 0); % 找到曲线上的点(假设曲线为黑色) ``` 之后,根据图像中坐标轴的实际范围,将像素坐标转换为实际坐标值。这种方式适合处理高质量图像,能够实现较高的精度和效率[^1]。 3. **利用插值函数进行数据拟合** 在获得离散数据点后,可以使用 MATLAB 的插值函数如 `interp1` 或 `pchip` 对数据进行拟合,以获得更平滑的曲线或补充缺失点。例如: ```matlab x_data = [x1, x2, x3, ...]; % 实际坐标x y_data = [y1, y2, y3, ...]; % 实际坐标y xq = linspace(min(x_data), max(x_data), 100); % 插值点 yq = interp1(x_data, y_data, xq, 'pchip'); % 使用pchip插值 plot(xq, yq); ``` 此方法可以有效提升数据点的平滑度和连续性,适用于需要进一步分析的数据集。 4. **使用专门工具或插件** MATLAB 社区及第三方开发者提供了多个用于图像数据提取的工具,例如 `ginput` 的增强版、图像识别插件等,这些工具通常集成了图像处理、自动识别和数据转换功能,能显著提升工作效率。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值