得到数据集中对象的分布——按长、宽和面积

1、统计分布目的

(1)为了对数据集中所要识别对象是大、中还是小目标有整体把握;

(2)便于对模型进行针对性的修改。

2、统计分布方式

长宽各按5%分别进行统计,共计60份(300/5=60);面积按占比5%统计,共计20份(100/5=20)。

3、代码如下

import xml.etree.ElementTree as ET
import cv2
import os
import sys

# 缩图,将图片缩为300*300
def resize(image_path, image_save):
    image_lists = os.listdir(image_path)
    for image in image_lists:
        path = os.path.join(image_path, image)
        save_path = os.path.join(image_save, image)
        image = cv2.imread(path)
        image_resize = cv2.resize(image, (300, 300))
        cv2.imwrite(save_path, image_resize)
# 修改xml,使其与缩减后的图片相对应
def xml_update(xml_path, xml_save):
    xml_lists = os.listdir(xml_path)
    for xml in xml_lists:
        path = os.path.join(xml_path, xml)
        xml_save_path = os.path.join(xml_save, xml)
        # print(xml_path1)
        # 缩xml
        tree = ET.parse(path)
        root = tree.getroot()
        # 在xml里找到描述原图的size
 
### 非均匀数据分布或不规则数据分布的定义 非均匀数据分布是指在特定范围内,某些区域内的数值密度显著高于其他区域的现象。这类分布在统计学和数据分析领域较为常见,在实际应用中可能表现为不同类别样本数量的巨大差异或是连续变量值域内部分区间的高频率出现。 对于离散型数据而言,当各个取值的概率并不相等时即形成非均匀分布;而对于连续型数据来说,则体现为概率密度函数曲线下的面积不是平坦状态而是存在峰谷变化的情况[^2]。 ### 类型 #### 1. 数据分布不平衡问题 所谓不平衡指的是不同类别的样本量差异非常大,或者少数样本代表了业务的关键数据(少量样本更重要),需要对少量样本的模式有很好的学习。这主要出现在分类相关的建模问题上: - **大数据分布不均衡**:整体数据规模较大,但某类别样本占比较小。例如在一个含有10,000,000条记录的数据集中,仅有50,000条属于某个特殊分类。 - **小数据分布不均衡**:不仅总体样本数目较少,而且其中某一类目的实例更加稀缺。比如总共只有100个观测对象的情况下,A类仅占有20个案例而B类则占据了剩余80%的比例。 #### 2. 时间序列中的不规则采样 在处理时间序列数据时,如果采集的时间戳并不是按照固定周期排列的话,那么这样的数据集就被认为具有不规则特性。例如利用MATLAB进行插值操作来扩展有限度的时间序列至更密集的形式,期间所涉及的就是如何合理填补这些缺失时刻点上的估计值的问题[^4]。 ```matlab xx = randperm(500); x = sort(xx(1:100)); ``` 上述代码片段展示了创建一个由随机整数组成且未经排序的向量`xx`,接着从中选取前一百个最小元素并对其进行升序整理得到新的有序集合`x`用于后续分析工作。 #### 3. 可视化工具支持下的异常检测 像ECharts这样强大的图表库允许开发者轻松绘制带有复杂属性如倾斜角度、宽度高度各异柱状图甚至热力地图等形式多样的图形界面组件。当中涉及到的一个重要概念就是怎样有效地表示那些不符合常规线性增趋势的数据系列——即将原始输入经过适当转换后再呈现给用户查看以便更好地理解潜在规律所在[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值