基于CNN的癌症预测模型构建与评估
1. 数据集处理
首先,为了提高随机性以获得更好的最终结果,会对所有数据集的图像路径(imagePaths)进行打乱操作。接着计算训练集和测试集划分的索引,通过对图像路径进行切片来构建训练集路径(trainPaths)和测试集路径(testPaths)。并且,会进一步对训练集路径进行划分,预留一部分用于验证。
随后,定义一个名为 datasets 的列表,其中包含三个元组,每个元组都包含将所有图像路径组织成训练、验证和测试数据所需的信息。
对所有数据集进行迭代,在循环中会执行以下操作:
1. 创建一个基础输出目录(仅创建一次)。
2. 对当前划分中的所有输入图像进行嵌套循环:
- 从输入路径中提取文件名,并从文件名中提取类别标签。
- 构建标签路径并创建一个标签输出目录(仅创建一次)。
- 将每个文件复制到其目标目录。
运行构建数据集的脚本,使用以下命令:
python build_IDC_dataset.py
之后,可以运行 tree 命令来确认所需的数据集是否按预期构建。
2. CNN模型
本示例中使用的模型主要基于VGGNet风格的模型,不过采用了深度可分离卷积层(depthwise separable convolutional layers),而非标准的卷积层。深度可分离卷积相比传统卷积在计算效率上更高。
这个CNN模型名为Can
基于CNN的癌症预测模型构建
超级会员免费看
订阅专栏 解锁全文
2786

被折叠的 条评论
为什么被折叠?



