昇思25天学习打卡营第4天|oldog
数据集是神经网络训练的必要条件,正所谓“兵马未动,粮草先行”。
昇思提供了数据集下载的接口,但是mindspore.dataset提供的接口目前只支持解压后的数据文件,因此在下载之后需要解压。
昇思给了迭代读取数据的接口,可以用create_tuple_iterator或create_dict_iterator。
数据集的集中操作方式:shuffle(随机打乱)、map(对指定列数据变换)、batch(分装打包)。
昇思支持的可自定义数据集包括可随机访问数据集(类似于数组、矩阵的访问方式)、可迭代数据集(通过迭代方式逐步获取数据)和生成器(关键字 yield 来返回值的函数,也是一种数据类型)。
总结
虽然已经学习人工智能相关的概念,但是很多实操或者细节、具体的工具还是不知道,这次打卡就提供了一次很好地学习和实操的机会。