Knowledge Generation Model for Visual Analytics 第二部分

最新推荐文章于 2024-12-31 01:56:32 发布

Evan_Gu

最新推荐文章于 2024-12-31 01:56:32 发布

阅读量840

点赞数 1

分类专栏：综合大数据可视化

综合同时被 2 个专栏收录

114 篇文章

订阅专栏

大数据可视化

32 篇文章

订阅专栏

2.2探索循环（Exploration Loop）

探索循环描述分析师同一个可视化分析系统进行一系列互动行为（Action），如数据准备、建立模型、操控可视化结果等，观察和探索由此产生的反馈，并获得发现（Finding）。分析师的行为应当遵循分析的目标而展开。

2.2.1行为（Action）

Actions可能考虑一方面用户不同的目标和任务，另一方面交互的可视化。根据最近交互分类。

准备工作行为，处理数据采集和数据选择

建模行为，创造模型的行为，跟KDD过程以及配置相关

模型的应用称作 model usage，即类似一个统计计算或者聚类数据的行为

创造数据的可视化，称为Visual mapping

可视化的模型，即model-vis 行为

操作（manipulattion）是可视化改变视口或者高亮兴趣数据区域，而不是改变数据的可视化绘制。这些行为可以被分析者与可视分析系统中间的交互行为观察出。

2.2.2发现（Finding）

在Visulizations 或models中，finding可能是模式，一个明显的模型结果，或者一个系统不正常的行为

2.3验证循环（Verification Loop）

验证循环是在探索循环基础上证实或者提出新的假设。分析师在观察阶段得到发现的结果后，深入分析获得现象背后的洞悉（Insight），会产生新的假设（Hypothesis）并成为进一步调查的动机。洞悉并非知识，而是由弱证据得到的感知等待进一步假设验证。

2.3.1假设（hypothesis）

构成关于问题域中受分析约束的假设。分析者为了获取数据中的知识，尝试找出支持或者反驳这个假说的证据。在这方面假说作为可视分析过程的向导。具体的假说能被统计测试或者数据可视化，当这个数据含有需要的信息。但很不幸，假说通常很模糊，像在问题域中存在不知道的因素影响的假说。在这种情景，一个探索分析策略允许分析者想出更多具体的假说来进行进一步分析。

2.3.2洞悉（insight）

在信息可视化协会，洞悉有多种定义。Saraiya定义洞悉为“参与者提供的个人关于数据的观察报告，一个发现单元”North在其他从其他角度列出了一个洞悉具有的一些重要特征，例如：复杂性，深度，定量的预料之外的，关系，超过个人的数据发现。Yi在进一步并且也考虑到了涉及洞悉的过程，他们集中在人们如何中信息可视化获得洞悉并识别四种洞悉获取过程，然而，他们认为没有共同的洞悉定义。Chang认为两种不同的洞悉：一个是启发瞬间的科学感知的洞悉，一个“ah Ha”瞬间；知识的增长或信息的一个碎片。我们定义这些比较接近后者，分析理解一个发现，通常在先前的知识领域内，为了产生一个信息单元。因此，一个洞悉是非常小，例如意识到几个数据属性之间的关系，可能有着某些更重要的和潜在的意义。所以，洞悉是不同于发现（findings），问题域中洞悉有理解过程，而我们不需要发现什么。例如，一个发现可能支持一个假设，这个假设可能让分析者明白，并导致这个假设是可靠的洞悉。一个分析者通过收集足够的证据获取洞悉，创造关于应用的假设，或者在证据非常有力的某一个情景，甚至是新的可信服的知识。我们认为一个洞悉不可能直接作为知识，因为证据薄弱可能导致一个洞悉需要进一步的验证，并且变成假设。例如，在探索分析中，发现可视化中的一个聚类，可能导致这个洞悉“有不同属性的一个聚类”，但是这东西应该首先被考虑作为一个新的假设或者假说，需要被证实。

2.4知识产生循环（Knowledge Generation Loop）

分析师不断形成和验证假设，当证据足够可信时这一系列的洞察和猜测便衍生出了知识（Knowledge）。知识同样会影响所提出的新假设。

分析师从他们的关于问题域的知识形成假设，并通过在可是分析过程中形成和验证假说来获取新的知识。当分析师相信收集的洞悉，他们获取在该问题域中新的知识，可能也会影响接下来分析过程中新假设的生成。

2.4.1知识（knowledge）

数据分析通常开始与数据，或者一个或多个分析问题。此外，分析师带着他们对于关于该数据的知识，问题域，或者可视分析工具与方法。这个先前的知识决定分析策略和程序。在分析过程中，分析师试图找到证据来证明存在的假设或者学习关于问题域的新知识。一般而言，在可视分析中的知识学习可以被定义为“合理的信任”。可视分析的推理过程，使得分析师从数据中找到的证据，获得关于问题域的知识。这个证据有不同的质量，这个质量直接影响最终知识的可信赖度。这个证据收集的路线也影响这个可信赖度。例如，一个假设的统计测试的一个结果，可能被意识到比一个模式发现更可靠的依据。依赖于证据的收集，一个分析师不得不决定是否收集了足够的证据来信任一个洞悉，并作为知识采纳这个洞悉，或者这个洞悉是否需要进一步检测。例如，不同数据的分析或者领域专家的讨论。评估新知识的可靠性需要一个对整个分析过程从数据获取开始的批评性审查。同样，关于该问题域的新知识，分析师获取关于数据的知识，例如，数据中的模式或者模式的质量。他们也从可视分析系统和方法获取经验。