38、多领域技术探索:从社交图像场地预测到VR交互及手术视频可视化

多领域技术探索:从社交图像场地预测到VR交互及手术视频可视化

1 社交图像场地预测

在社交网络中,用户常拍摄菜品照片上传并在餐厅打卡。但这种情况下,视觉内容往往无法反映特定餐厅的独特特征。

1.1 模型对比

MFTP相较于强大的基线模型FPMC - LR表现更优,可能原因如下:
1. FPMC - LR直接预测特定场地标签,未利用场地类别信息。
2. 虽考虑连续打卡间的过渡模式,但忽略了用户打卡行为的重要周期性模式。
3. 作为兴趣点推荐框架,未利用视觉内容信息。

1.2 示例分析

为深入了解场地预测任务的影响因素,通过几个示例进行观察:
- 示例一 :图像是新加坡著名地标,视觉内容清晰独特,此时视觉内容主导预测。
- 示例二 :图像显示是图书馆,但难以确定具体是哪一个。不过用户上次打卡地点是附近酒吧,这有助于得出正确答案。
- 示例三 :图像是纽约的教堂,但CNN提取的视觉信号误判为音乐厅。好在图像时间戳是周日上午,且用户每周此时定期去教堂,基于时间信号模型能正确预测。

1.3 挑战与展望

特定场地预测在某些情况下是难题,如频繁旅行的用户,预测性能较低。后续可研究纳入GPS信息扩展模型以提升性能。

1.4 总结

研究了社交图像特定场地预测问题,发现连续打卡的过渡模式和场地类别的周期性模式。开发了基于矩阵分解的通用嵌入模型,结合视觉内容和时间模式。实验表明,利用LBSN打卡信

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值