SparseArrayT with Extract_words

本文介绍了一种使用C++模板实现的稀疏数组数据结构,该结构能够高效地存储和检索大量稀疏分布的数据。文章详细解释了稀疏数组的内部机制,包括节点的双向链表实现,以及如何通过索引快速查找元素。此外,还提供了一个从文本中提取单词并存储到稀疏数组中的示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

SparseArray.h

#pragma once
#include<memory>
#include<iostream>
#include<iomanip>

using std::shared_ptr;
using std::make_shared;
using std::cout;
using std::setw;
using std::endl;

template<typename T>
class SparseArrayT
{
public:
	class Node {
	public:
		size_t index{};
		T* pObject;
		shared_ptr<Node> pPrevious;
		shared_ptr<Node> pNext;
	public:
		Node(size_t index) :index{ index }, pObject{ new T }{}
		Node(const Node& a) :index{ a.index }, pObject{ new T(*a.pObject) }{}
		void show() { cout << *pObject << " "; }
		~Node(){ delete pObject; }
	};
private:
	shared_ptr<Node> pFirst;
	shared_ptr<Node> pLast;
public:
	SparseArrayT() = default;
	SparseArrayT(const SparseArrayT&);
	SparseArrayT& operator=(const SparseArrayT&);
	T& operator[](size_t);
	bool element_exists(size_t);
	void list(bool flag = true);
};

template<typename T>
SparseArrayT<T>::SparseArrayT<T>(const SparseArrayT<T>& a) {
	if (a.pFirst) {
		pFirst = pLast = make_shared<Node>(*a.pFirst);
		shared_ptr<Node> pTemp;
		shared_ptr<Node> pCurrent = a.pFirst;
		while (pCurrent = pCurrent->pNext) {
			pTemp = pLast;
			pLast = make_shared<Node>(*pCurrent);
			pTemp->pNext = pLast;
			pLast->pPrevious = pTemp;
		}
	}
}

template<typename T>
SparseArrayT<T>& SparseArrayT<T>::operator=(const SparseArrayT<T>& a) {
	if (this == &a)
		return *this;
	if (a.pFirst) {
		pFirst = pLast = make_shared<Node>(*a.pFirst);
		shared_ptr<Node> pTemp;
		shared_ptr<Node> pCurrent = a.pFirst;
		while (pCurrent = pCurrent->pNext) {
			pTemp = pLast;
			pLast = make_shared<Node>(*pCurrent);
			pTemp->pNext = pLast;
			pLast->pPrevious = pTemp;
		}
	}
	return *this;
}

template<typename T>
T& SparseArrayT<T>::operator[](size_t index) {
	shared_ptr<Node> pCurrent = pFirst;
	while (pCurrent) {
		if (pCurrent->index == index)
			return *pCurrent->pObject;
		if (pCurrent->index > index)
			break;
		pCurrent = pCurrent->pNext;
	}
	shared_ptr<Node> pNode = make_shared<Node>(index);
	if (pCurrent) {
		if (pCurrent->pPrevious) {
			pCurrent->pPrevious->pNext = pNode;
			pNode->pPrevious = pCurrent->pPrevious;
			pNode->pNext = pCurrent;
			pCurrent->pPrevious = pNode;
		}
		else {
			pCurrent->pPrevious = pNode;
			pNode->pNext = pCurrent;
			pFirst = pNode;
		}
	}
	else {
		if (pLast) {
			pLast->pNext = pNode;
			pNode->pPrevious = pLast;
			pLast = pNode;
		}
		else {
			pFirst = pLast = pNode;
		}
	}
	return *pNode->pObject;
}

template<typename T>
void SparseArrayT<T>::list(bool flag) {
	size_t count{};
	size_t perline{ 5 };
	if (flag) {
		shared_ptr<Node> pCurrent = pFirst;
		while (pCurrent) {
			pCurrent->show();
			pCurrent = pCurrent->pNext;
			if (++count % perline == 0) cout << endl;
		}
		if (count % 5) cout << endl;
	}
	else {
		shared_ptr<Node> pCurrent = pLast;
		while (pCurrent) {
			pCurrent->show();
			pCurrent = pCurrent->pPrevious;
			if (++count % perline == 0) cout << endl;
		}
		if (count % 5) cout << endl;
	}
}

template<typename T>
bool SparseArrayT<T>::element_exists(size_t index) {
	shared_ptr<Node> pCurrent = pFirst;
	while (pCurrent) {
		if (pCurrent->index == index) return true;
		pCurrent = pCurrent->pNext;
	}
	return false;
}

main.cpp

#include"SparseArrayT.h"
#include<string>

using std::string;

void extract_words(SparseArrayT<string>& words, string& text) {
	string separators{ " ,;:.\"!'\n" };
	size_t start{ text.find_first_not_of(separators) };
	size_t end;
	size_t count{};
	while (start != string::npos) {
		end = text.find_first_of(separators, start + 1);
		if (end == string::npos) 
			end = text.length();
		words[count++] = text.substr(start, end - start);
		start = text.find_first_not_of(separators, end + 1);
	}
}

int main() {
	SparseArrayT<string> words;
	string text;
	std::getline(std::cin, text, '#');
	extract_words(words, text);
	words.list(false);
	return 0;
}
数据集介绍:淋巴细胞、中性粒细胞与鳞状细胞癌检测数据集 一、基础信息 数据集名称:淋巴细胞、中性粒细胞与鳞状细胞癌检测数据集 数据规模: - 训练集:5,205张医学图像 - 验证集:240张医学图像 - 测试集:220张医学图像 病理分类: - Lymphocytes(淋巴细胞):免疫系统核心细胞,参与病毒防御与肿瘤监控 - NE(中性粒细胞):急性炎症标志物,反映感染与组织损伤 - SCC(鳞状细胞癌):常见上皮组织恶性肿瘤,需早期精准识别 标注规范: - YOLO格式标注,支持目标检测模型训练 - 包含多边形坐标标注,适配病理切片分析需求 二、核心应用 数字病理诊断系统: 支持开发白细胞亚型自动分类系统与鳞癌检测算法,辅助显微镜图像分析,提升病理科工作效率。 血液病辅助诊断: 通过淋巴细胞/中性粒细胞比例分析,为白血病、淋巴瘤等血液疾病提供AI辅助判断依据。 癌症筛查研究: 包含鳞状细胞癌阳性样本,适用于皮肤癌、头颈癌等上皮源性肿瘤的早期筛查模型开发。 医学影像教学: 提供标注规范的病理图像数据,适用于医学院校的细胞形态学教学与AI医疗交叉学科实训。 三、核心优势 临床病理学深度适配: 涵盖血液系统关键细胞类型与高发癌症类别,标注经病理专家双重校验,确保医学准确性。 多场景检测能力: 同时支持血涂片细胞分类与组织切片癌变区域检测,满足复合型医疗AI产品开发需求。 数据分布专业化: 按医学研究标准划分训练集/验证集/测试集,包含典型病例与边缘案例,强化模型鲁棒性。 跨任务兼容性: YOLO标注格式可直接用于目标检测训练,同时支持转换为分类、实例分割等扩展任务。
数据集介绍:自动驾驶交通障碍物目标检测数据集 一、基础信息 数据集名称:自动驾驶交通障碍物目标检测数据集 数据规模: - 训练集:10,627张图片 - 验证集:1,298张图片 - 测试集:1,272张图片 分类类别: - Car(汽车):道路主要交通工具,包含多种车型 - Motorbike(摩托车):两轮机动车辆及骑行者 - Person(行人):道路行人及动态行为 - Pole(杆状物):路灯杆、交通标志杆等垂直障碍物 - Reflective_cone(反光锥):道路施工警示标识 - Truck(卡车):大型货运车辆及特殊运输车 标注格式: YOLO格式标注,包含边界框坐标与类别编码,适配YOLOv3/v5/v8等主流检测框架 二、适用场景 自动驾驶感知系统开发: 训练车载摄像头实时识别道路障碍物,支持ADAS系统进行碰撞预警和路径规划 交通监控系统优化: 提升电子警察系统对复杂交通元素的识别准确率,支持违章行为分析 机器人视觉导航: 为服务机器人/AGV提供室外环境感知能力,实现动态障碍物避让 学术研究应用: 支持多目标检测算法研究,包含小目标(反光锥)与大尺度目标(卡车)的检测优化 三、数据集优势 场景适配性强: 覆盖6类道路核心障碍物,包含静态设施(杆状物)与动态目标(行人、车辆)的多样化组合 标注专业化: 采用YOLO工业标准标注规范,坐标精度达小数点后6位,支持像素级检测需求 数据分布均衡: 万级训练样本量配合科学划分的验证/测试集,满足模型开发全流程需求 跨模型兼容性: 原生支持YOLO系列算法,可快速迁移至Faster R-CNN、RetinaNet等检测框架
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值