博主这个系列是根据李沐老师的路线更新,自从看了现在的GPT-4与国内的文心一言对比,博主越来越觉得要接触新技术就需要从国外来了解一手资料就需要阅读英文文献,李沐老师的课正好有这个契机来让我完成这个想法。博主会在其中加入英译汉的版本,基本上就是有四级的水平来锻炼自己的能力。
数据(一)
数据获取
Flow chart for data acquisition(数据采集流程图)
Discover what data is available
-
ldentify existing datasets(数据集)
-
Find benchmark(基准) datasets to evaluate(评价) a new idea
-
E.g.A diverse(不同) set(多样化) of small to medium datasets for a new hyper-parameter tuning algorithm(超参数调优算法)
-
E.g. Large scale datasets for a very big deep neural network(非常大的深度神经网络的大规模数据集)
-
-
Collect new data
-
E.g.driving videos covering different driving scenarios(涵盖不同驾驶场景的驾驶视频)
-
Popular ML datasets
-
MNIST:digits written