初涉kaggle-Google Landmark Recognition Challenge(未完待续)

本文记录了作者首次参与Kaggle竞赛的经历,选择了Google Landmark Recognition Challenge项目,旨在通过计算机视觉技术识别地标。文中详细描述了从项目选择、数据预处理到遇到的问题及解决过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

    2018.2.28. 与某著名外校在读博士“大哥”商讨决定参加一次kaggle竞赛试水,看到Google Landmark Recognition Challenge点击打开链接可以发表CVPR的workshop, 因而选择此项竞赛。随着对这个项目认知的逐渐加深才知道这是个深坑。。。

〇。运行设备

    ——自用Dell xps15 9560笔记本 i5 1050 8G

    ——Finland CSC-IT CENTER FOR SCIENCE

一。数据预处理

    此项目训练图片数据有120w张图片,1.5w个类,350G。由于原始数据并没有分类,我们想出了几种方法进行数据分类。

    ——将同类图片放到相同文件夹                       (×)

    ——将图片重命名为类名 + 序号                      (×)

    ——下载时直接将图片重命名为类名 + 序号     (√)

    由于数据量庞大,急于下载而导致疏忽了数据分类,在历经了十几个小时的下载后(200m网还这么慢)发现数据并没有标签需要自己处理,于是想出第一个方法。实现过程中发现速度过慢需要n个小时,转而考虑重命名,结果依旧缓慢没什么区别。再考虑到搞多线程,发现速度提升很多,但是进行到一定时间发生了内存爆炸的情况。进而只能选择重新下载并重命名。使用CSC-IT CENTER 下载4小时完成。

评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值