
数据挖掘
文章平均质量分 76
liveway6
这个作者很懒,什么都没留下…
展开
-
A Dynamic Algorithm for Local Community Detection in Graphs--阅读笔记
AbstractIntroductionContributionDefinitions and Related Work静态的贪婪种子集扩展算法Dynamic seed set expansion algorithmMotivationAlgorithm OverviewAlgorithm DetailsAbstract背景:各种大量的数据集都被表示为显示底层连接、趋势和异常的图形原创 2017-10-26 16:21:23 · 887 阅读 · 0 评论 -
Unsupervised Sentiment Analysis with Signed Social Networks--阅读笔记
这篇文章研究了一个在有符号社交网络中进行无监督情感分析的新问题。具体来说,在有符号社交网络中引入了情感信息和隐含情感信号,并将其引入到情感模型中。原创 2018-01-09 12:42:36 · 720 阅读 · 0 评论 -
Unsupervised Personalized Feature Selection--阅读笔记
论文链接 论文来源:AAAI 本文重新整理至知乎专栏AbstractIntroductionUnsupervised Personalized Feature Selection Framework - UPFSOptimization Algorithm for UPFSUpdate Global Feature Weight WWUpdate Local Feature Weigh原创 2017-12-18 19:46:41 · 1004 阅读 · 0 评论 -
Feature Selection: A Data Perspective --阅读笔记2 传统数据的特征选择算法
传统数据的特征选择算法在本节中,我们根据所使用的技术对传统数据的传统特征选择算法进行了广泛的分类: - **基于相似性(Similarity based Methods)**; - **基于信息理论()**; - **基于稀疏学习**; - **基于统计**; - **其他方法**。原创 2017-11-27 17:39:43 · 2034 阅读 · 0 评论 -
Feature Selection: A Data Perspective --阅读笔记1 特征选择的概述
特征选择作为一种数据预处理策略已经被证明在为各种数据挖掘和机器学习问题准备数据(特别是高维数据)方面是有效和高效的。特征选择的目标包括:构建更简单,更易于理解的模型,提高数据挖掘性能,准备清晰,可理解的数据。大数据近期的激增为特色选择带来了一些重大的挑战和机遇。在这次调查中,提供了关于特征选择研究最新进展的综合和结构化概述。原创 2017-11-27 15:30:13 · 3864 阅读 · 1 评论 -
The Proposal of Service Oriented Data Mining System for Solving Real-Life Classification--阅读笔记
分布式数据挖掘(Distributed Data Mining, DDM):在大型数据库中以分布式方式执行机器学习算法,使得在不牺牲实验性能的同时计算时间硬件成本降低。原创 2017-11-03 09:59:58 · 304 阅读 · 0 评论 -
社交网络图挖掘5--图的邻居性质
有向图和邻居图的直径传递闭包和可达性有向图和邻居有向图(directed graph):是指一个包含节点集合和有向边集合的图,每条有向边写成u→vu\rightarrow v,其中uu为有向边的源节点(source),vv为目标节点(target)。所有的无向图都可以用有向图来表示,无向边(u,v)(u,v)可表示为u→vu\rightarrow v和v→uv\rightarrow u。路径原创 2017-10-26 12:17:02 · 3653 阅读 · 0 评论 -
Unsupervised Feature Selection in Signed Social Networks 阅读笔记
论文来源:2017 KDD 论文链接有符号的社交网络中存在正连接(positive links)和负连接(negative links),最近的一些研究指出,负连接具有一些正连接没有的额外信息。因此,本文提出了一个基于有符号社交网络的无监督特征选择框架SignedFS,同时利用正连接和负连接来获取网络特征的潜在表达,从而实现更好的聚类效果。原创 2017-11-12 15:08:10 · 504 阅读 · 0 评论 -
社交网络图挖掘4--三角形计数问题
计算一个随机图中的三角形数目期望值由n个节点和m条边随机构成的图的中:图中总共有(n3)=n3/6\bigl( \begin{smallmatrix} n \\ 3 \end{smallmatrix} \bigr)=n^3/6个三节点集合;在任意给定的两个节点之间加入边的概率为m/(n2)=2m/n2m/{\bigl( \begin{smallmatrix} n \\ 2 \end{smallm原创 2017-10-25 18:59:39 · 4259 阅读 · 1 评论 -
社交网络图挖掘3--重叠社区的发现及Simrank
重叠社区的发现相关知识点关系图模型避免成员隶属关系的离散式变化Simrank带重启的随机游走重叠社区的发现相关知识点社区的本质:一个实体有可能同时属于两个社区,任一社区内的边会十分密集,但是两个社区交集内的边会更加密集,而三个社区交集内的边还要密集。极大似然估计(maximum likelihood estimation,MLE):我们对某种对象(如朋友图)实例的生成过程(即模型)建立某种原创 2017-10-25 16:08:47 · 10208 阅读 · 2 评论 -
社交网络图挖掘2--社区的直接发现和图划分
社区的直接发现相关概念利用完全二部图发现社区图划分图划分的好坏标准归一化割描述图的一些矩阵社区的直接发现通过寻找有很多连边的节点子集直接发现社区的技术。相关概念团(clique):任意两个节点之间都存在边的节点子集。二部图(bipartite graph):是由左右两个节点集合组成的图,每条边连接的都是左集合的一个节点和右集合中的一个节点。例子如下: 完全二部图(complete b原创 2017-10-25 09:58:58 · 5305 阅读 · 0 评论 -
Data Mining with Big Data--阅读笔记
abstractIntroductionBig Data Opportunities and ChallengesLiterature SurveyMethodologyConclusion论文来源:2017 11th International Conference on Intelligent Systems and Control (ISCO)论文链接:http://ieeexp原创 2017-11-01 14:58:17 · 1805 阅读 · 0 评论 -
社交网络图挖掘1--将社交网络看作图及其聚类
将社交网络看成图社交网络的基本概念:社区(community):是指具有非同寻常的强连通性的节点子集,其中节点可以是构成网络的人或者其他实体。局部性(locality):是指社交网络的节点和边趋向于聚为社区的这种性质。社交网络的基本特点:一大堆实体参与了网络的构成;网络实体间至少存在一种关系,且关系要么存在要么不存在,关系也可以表示为度数,其中度数可为离散值和实数值;对于社交网络有一个非原创 2017-10-24 10:49:29 · 12695 阅读 · 0 评论 -
BIBM系列论文阅读笔记
2017 《Detecting Driver Sleepiness from EEG Alpha Wave during Daytime Driving》数据集:5男3女共8人,5个电极,采样率1000hz 2.原创 2018-07-09 15:19:32 · 2404 阅读 · 0 评论