最近我部门的校园招聘学生机试试题

本文介绍了一项针对优酷网站的爬虫实践任务,旨在抓取特定用户的上传视频信息并实时监控更新。任务要求包括收集指定用户上传的视频详情,并在出现新视频时迅速通知。此外,还对代码质量、即时学习能力等方面进行了评估。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

由我出的题目,是一道比较考验编码能力和即时学习能力的题。

应聘者普遍是北京各理工科高校的硕士生。

 

机试试题:

 

小明非常喜欢综艺节目,他发现优酷网上有一个用户叫做“琪琪综艺”上传相关的综艺节目特别多。所以他想监控“琪琪综艺”的更新信息。他的需求有:

 

1.       收集“琪琪综艺”所有上传过的影片信息。

2.       若“琪琪综艺”发布了新的影片,需要在尽快通知小明。

3.       影片信息包括两点:影片名 和 播放地址。

如影片 首尔酷旅行20101031 的播放地址是

http://v.youku.com/v_show/id_XMjE5MTQ1NzE2.html

 

请为小明编写这个程序。

 

具体要求:

 

1.       由于时间有限,所以你只需要成功抓到前100个视频信息,就认为你已经完成了“收集所有上传影片”的任务。

2.       将要求1抓取到的影片信息记入文本文件(movies.txt),格式为:每个影片信息一行,包括影片名和播放地址,中间用制表符(/t)隔开。

3.       在要求2完成之后,对于“琪琪综艺”新发布的影片,立即在控制台打印影片信息,并将信息追加到文件movies.txt末尾。

 

小提示:

1.       你可以在http://u.youku.com/user_video/id_UNDM5NjAyNzY=.html获得“琪琪综艺”的所有上传影片。

2.       你有最多4个小时时间进行编码,但提前完成将提高你的最终得分。

3.       你可以任意使用互联网搜索需要的信息,但严禁上网与其他人讨论或在论坛发帖咨询。

 

 

 

 

 

 

目前情况:

 

 

机试的学生普遍情况看来不太理想,一般表现为:

 

集中表现为代码的逻辑性较低,然后是相关知识获取、即时学习的速度(比如正则表达式,网页抓取),最后是异常处理(健壮性),以及审题。

 

 

例如以下是一个学生写的部分代码,其中///<是我给的评价

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值