作者:禅与计算机程序设计艺术
1.简介
近年来,越来越多的社会媒体公司开始推出基于机器学习的算法来识别敏感主题(如健康相关信息)在社交平台上的流量。例如,Facebook的面部识别技术、Instagram的拍摄标签自动检测、Twitter的热门话题识别等。但是,这些算法到底有多厉害?它们的准确率如何?为什么会产生这么大的舆论轰炸?本文将对这一热点进行探讨。
2.基本概念术语
2.1 词汇定义
- 活动因子(activity factor):活动因子是一个由0到1之间的数字表示,描述了一个个体和社会关系之间的联系程度。当一个个体与他人的相互影响程度越高时,活动因子的值越高;反之,则越低。它反映了一个个体或群体在特定社会角色中所扮演的角色。常用活动因子包括:信任、能力、合作、资源、权威、熟练性、责任心、风险承受能力等。
- 敏感主题(sensitive topic):敏感主题一般是指涉及个人隐私或国家安全的主题。敏感主题通常需要高度保密并且具有广泛的社会价值。目前国内外许多组织都对健康保健、环境保护、消费者权益、公共卫生、教育、医疗卫生、司法、刑事辩护等敏感主题做了深入研究。
- 机器学习(machine learning):机器学习是一种让计算机具备学习能力从数据中分析并预测未知数据的技术。其目标是借助数据来提升模型的效率和准确性,使得计算机可以更加有效地解决复杂的问题。<