ALIPR+ACQUINE:图像自动标注和审美评价推理
1. ALIPR(Automatic Linguistic Indexing of Pictures-Real Time)是宾夕法尼亚州立大学的Jia Li和James Wang(据说都是国人)开发的图像标注系统,可以对用户上传的自动识别和标注,通过机器学习的方法,对图像的像素内容如纹理颜色等分析,以期获得图像的语义含义,以改进当前图像手工标注和当前主流检索中基于关键字和图像相关文本内容的检索方法。
在起始阶段,通过大量已标注图像的训练集,使系统学习,在用户上传图片时,系统根据用户图片的内容信息对内容做基于统计学习的判断,给出相关标注,供用户选择或增加,这样就完成了图像的标注和反馈过程。接下来用户根据标注和标题对当前图像库中的图片进行搜索,并可以根据图像找出与之相似的图片。在网站中,你还可以对图片进行评分(不知道是不是和接下来的审美评价有关),另外还可以根据语言描述故事,来找与之有联系的图片(这个似乎还比较弱。。。)
标注自动识,我们发现一张有猴子头像的咖啡图片,经过识别为以上的关键字,我们选中相关的标签,并可以根据上传内容,增加新的标签。
标注完成后,根据图像内容,会给出图片库中与之相似的图片集。
系统可以根据title和tag检索图片,下面是根据coffee检索到的图片,可以输入多关键字。
其实,就上面的来说,当前看来也不算很有新意的方法,不清楚4,5年前是怎样的状况,在08年获得的专利,06年ACM Multimedia conference上有篇他们的文章(Real-Time Computerized Annotation of Pictures),现在试试他们的系统,虽然明显还是实验阶段,离商用还有距离了,但是能把产品开发到这种程度,这才是做学问厉害的地方。其实阅读国外的文献的时候,很多情况下,他们做的东西,认真研究研究,也不都是高深莫测,很多都是具有实践性的,甚至看透了理论性似乎也不是那么高不可攀,难得的地方就是能扎实的做下去。反观国内的。。。呵呵,难怪有那么多在国外高校奋斗的华人,当我们在追求指标的时候,却忘了自己起飞的地方是大地。
=========================part 2=========================
2. 在ALIPR上线之后,今年四月,ACQUINE(Aesthetic Quality Inference Engine)也公布于众,这个审美评价推理引擎可以对用户上传的图片基于审美学打分,分数为0-100。它也是对现有的资源机器学习的基础上,对用户图片分析并给出判断。这套系统的好玩之处就是可以让机器评价你的作品,或许以后摄影比赛征选作品就可以用它来筛选了。根据James Z. Wang的描述,这套系统已经达到80%的正确率,接下来还会继续改进。而且他也提到,对图片的审美评价只是人类感情的一方面,在接下来的研究中,他们或许会去努力获取图片激发人们的其他感情。这项研究由国家科学基金(NSF)资助。研究人员之前曾用相似的技术来检测梵高的作品(没说检测结果怎样。。。),我上传了2张照片,第一张感觉还行,第二章觉得很可以了。可是评价分别是9分和22.2分。哎。。。到底是谁的错 :qustion: 所以大家最好不要拿自己的图片来试,嘿嘿,以防打击过重@@ps:上传图片是记录ip的,可以统计你的上传和分数。
转自:http://clfour.com/2009/05/alipr-acquine/