41、在线社区:社交计算视角深度剖析

在线社区:社交计算视角深度剖析

社区挖掘技术

在互联网的海量数据中,许多在线社区显而易见,但也有不少隐匿难寻。为了找出这些隐藏的社区,研究人员开发了一系列计算技术,统称社区挖掘,涵盖搜索、网页抓取、社交网络分析和数据挖掘等。
- 网页抓取 :传统搜索或资源收集算法聚焦特定主题信息,而Kumar等人提出的网页抓取方法独树一帜。它能识别作为社区标志的图结构实例,网络社区被定义为内部链接多于外部链接的网站集合,基于最大流的网页爬虫可沿高相关链接路径逼近社区。此外,Flake等人针对自组织链接结构社区开发了新方法,该方法不依赖文本,识别出的社区可用于推断文本规则,增强基于文本方法的效果。
- 社区网络分析 :每个社区核心都有社交网络,社交网络分析在社区挖掘中潜力巨大。传统社区挖掘方法多假定网络中只有单一关系,且挖掘结果与用户需求偏好无关。Cai等人实现了从单网络、用户无关分析到多网络、用户相关及基于查询分析的转变。同时,Yang等人开发了计算包含正负关系的有符号社交网络的新算法。
- 博客中的社区 :博客由个人撰写,兼具文档和个人属性,连接超文本网络与社交网络。新型博客软件重塑在线社区,博客中虚拟社区的挖掘成为社区挖掘新分支。

计算社区特征

人们加入在线社区后会参与多种活动,计算方法可助力刻画这些活动特征。
- 角色识别 :社区成员各有角色,领导者和专家是核心信息提供者。研究人员开发自动识别方法,如PageRank和HITS等基于网络的排名算法,可评估在线环境下的专业网络,自动确定相对专业度。在

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值