自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(123)
  • 资源 (4)
  • 收藏
  • 关注

原创 Orange3实战教程:评估---性能曲线

在“测试与评分”组件中运行逻辑回归和随机森林,将结果输入性能曲线组件,对比两者与随机模型的性能。展示真正例比例(例如,患有心脏病的人群)与支持度(预测为正例的实例占比,假设实例按模型预测为正例的概率排序,如某人患病的概率)。性能曲线展示了分析真正例(true positive)数据实例比例与分类器阈值或分类为正例的实例数量之间的关系曲线。显示提升度(预测中真正例占所有预测正例的比例)与正例实例比例之间的比率。显示不同阈值下精确率(正预测中真正例的占比)与召回率(正类中真正例的占比)之间的关系。

2025-05-08 11:35:33

原创 Orange3实战教程:评估---ROC分析

该部件显示测试模型的ROC曲线及对应的凸包,用于比较不同分类模型的性能。表示真实值为0时预测为1的概率)与真阳性率(y轴,即敏感性;表示真实值为1时预测为1的概率)绘制。在给定假阳性和假阴性成本的情况下,部件还可确定最优分类器及阈值。目前,唯一能与ROC分析兼容的信号源是“测试与评分”部件。下图通过“测试与评分”比较决策树(Tree)和朴素贝叶斯(Naive Bayes)分类器,并在ROC分析、Lift曲线和校准图中评估其性能。绘制测试的真阳性率(TPR)与假阳性率(FPR)的关系曲线。

2025-05-08 11:19:25 1

原创 Orange3实战教程:评估---混淆矩阵

例如,4 个鸢尾花-杂色鸢尾(Iris-versicolor)的实例被错误分类为鸢尾花-维吉尼亚鸢尾(Iris-virginica)。最右侧一列显示每个类别的实例总数(每个类别有 50 个实例),最底行显示被分类到每个类别的实例数(例如,48 个实例被分类为维吉尼亚鸢尾)。获取数据,并通过朴素贝叶斯和树模型两种学习算法进行交叉验证或训练-测试流程,生成所有(或部分)实例的类别预测结果。通过选择矩阵中的元素,可将对应的实例传递到输出信号中。小部件提供完整数据,而混淆矩阵仅发送选中数据(如错误分类实例)。

2025-05-08 11:12:13

原创 Orange3实战教程:评估---预测

该部件接收一个数据集和一个或多个预测模型(如已训练的模型,而非学习算法),输出数据及其预测结果。),包含303名胸痛患者数据,目标为判断是否存在血管狭窄(类别变量)。),通过“决策树”部件构建预测模型,再将模型与待预测数据(使用“文件”部件加载心脏病数据集(使用“数据集”部件加载训练数据(展示模型对数据的预测结果。)连接至“预测”部件。

2025-05-08 08:47:01 5

原创 Orange3实战教程:评估---测试与评分

在泰坦尼克数据集中,手动选择“性别”和“舱位”作为特征,测试决策树、SVM和朴素贝叶斯的性能。底部表格显示基于AUC的模型对比:决策树优于SVM的概率接近1,优于朴素贝叶斯的概率为0.001(等效区间阈值为0.1)。例如,若基于AUC指标,数值0.95表示行模型有95%的概率优于列模型。若启用等效区间,下方小数值表示差异可忽略的概率(基于贝叶斯t检验)。例如,对包含3个类的分类器,分别计算每个类作为目标类的指标,最终按类样本量加权平均。选择评分指标和等效区间(ROPE),用于判断模型差异是否可忽略。

2025-05-08 08:43:14 157

原创 Orange3实战教程:模型--加载模型

当需要使用之前保存的自定义模型时,打开「加载模型」组件,通过「浏览」图标选择目标文件。此组件会将现有模型加载至「预测」组件中。注意:与加载模型配合使用的数据集必须包含兼容的特征!从输入文件中加载模型。

2025-05-07 10:16:35 4

原创 Orange3实战教程:模型---保存模型

当需要保存自定义配置的模型(例如逻辑回归模型)时,将数据输入模型后,连接到“保存模型”部件。命名模型后,后续可通过“加载模型”部件在工作流中调用。需注意:加载模型时使用的数据集必须包含兼容的属性。若文件保存至工作流所在目录或其子目录中,部件将记住相对路径。否则,出于安全考虑,部件会存储绝对路径但禁用自动保存功能。:点击浏览图标并输入文件名。将训练好的模型保存到输出文件中。:从之前保存的模型中选择。(一种序列化格式)。

2025-05-07 10:13:59 3

原创 Orange3实战教程:模型---随机梯度下降

随机梯度下降(SGD)部件使用随机梯度下降算法,通过线性函数最小化选定的损失函数。该算法每次仅考虑一个样本以近似真实梯度,并根据损失函数的梯度同步更新模型。对于回归任务,它返回最小化损失和的预测器(即 M 估计量),尤其适用于大规模和稀疏数据集。使用鸢尾花数据集,通过“测试与评分”部件比较 SGD 和决策树的性能。使用房屋数据集,通过“预测”部件对比 SGD、线性回归和 kNN 的预测效果。SGD 可用于特征评分(配合“排序”部件)。通过随机梯度近似法最小化目标函数。:预处理方法(可选)

2025-05-06 14:31:17 647

原创 Orange3实战教程:模型---神经网络

预测任务(仍使用鸢尾花数据)。此工作流演示如何将训练好的神经网络模型输入“预测”部件并观察预测值。神经网络部件基于 scikit-learn 的多层感知机算法,可以学习非线性模型和线性模型。:基于鸢尾花数据集(iris)的分类任务,对比神经网络与逻辑回归的结果。若需禁用默认预处理,可将空的“预处理器”部件连接到学习器。一种使用反向传播的多层感知机(MLP)算法。

2025-05-06 14:27:03 8

原创 Orange3实战教程:模型---曲线拟合

下图是一个使用住房数据集的简单工作流。为简化示例,仅使用单一特征。与其他建模部件不同,曲线拟合需要直接输入数据。我们在“测试与评分”中对比了曲线拟合和线性回归模型的性能。曲线拟合部件将任意函数拟合到输入数据,仅适用于回归任务。:此部件仅支持回归任务,且仅能使用数值型特征进行拟合。:将空的“预处理”部件连接到学习器。

2025-05-06 14:22:14 7

原创 Orange3实战教程:模型---自适应增强模型

AdaBoost(全称“自适应增强”)是一个由 Yoav Freund 和 Robert Schapire 提出的机器学习算法,可通过与其他学习算法结合来提升其性能。:加载鸢尾花数据集,使用 AdaBoost、决策树和逻辑回归,并在“测试与评分”组件中评估模型性能。:加载房价数据集,将数据分别输入 AdaBoost 和决策树模型,并通过“预测”组件输出结果。一种集成元算法,结合弱学习器并根据每个训练样本的“难度”进行调整。若要禁用默认预处理,需将“空预处理器”组件连接到学习器。• 移除目标值未知的样本。

2025-05-06 09:31:25 116

原创 Orange3实战教程:模型---评分卡模型

此部件要求所有特征均为二值化形式,因此预处理流程会将连续特征离散化,并对分类特征进行独热编码。此参数通过筛选最佳特征来控制(减少)生成的特征数量,从而加速训练过程。:指定决策参数可来源于多少原始特征(二值化前)。此参数可用于确保每个参数来自唯一特征,或限制仅使用部分特征。:限制模型中的决策参数数量,平衡复杂性与可解释性。参数越多可能提高准确性,但会降低模型可解释性。范围越大可能提升模型复杂性和准确性,但会降低可解释性。在评估结果中,可查看模型的预测表现。● 模型:训练完成的评分卡模型。

2025-05-06 09:22:59 6

原创 Orange3实战教程:模型---朴素贝叶斯

该小部件有两个选项:用于在其他小部件中显示的名称,以及生成报告。默认名称为"朴素贝叶斯"。修改名称后需点击"应用"生效。一种基于贝叶斯定理的快速且简单的概率分类器,假设特征之间相互独立。朴素贝叶斯从数据中学习一个朴素贝叶斯模型,仅适用于分类任务。如需禁用默认预处理,可将空的预处理器小部件连接到学习器。:将朴素贝叶斯与随机森林模型进行对比。• 将数值型数据等频离散化为4个分箱。● 学习器:朴素贝叶斯学习算法。:评估朴素贝叶斯的预测质量。● 预处理器:预处理方法。• 模型:训练好的模型。• 数据:输入数据集。

2025-04-30 09:30:20 15

原创 Orange3实战教程:模型---逻辑回归

该组件的使用方式与其他分类器组件一致。一种支持 LASSO(L1)或岭(L2)正则化的逻辑回归分类算法。逻辑回归从数据中学习一个逻辑回归模型,仅适用于分类任务。如需禁用默认预处理,可将空的预处理器组件连接至学习器。● 将分类变量连续化(使用独热编码)组件结合用于特征评分,示例请参考。• 移除目标值未知的实例。● 用均值填充缺失值。

2025-04-30 09:25:07 25

原创 Orange3实战教程:线性回归

要查看线性回归的系数,需先构建模型,然后将模型传递至「数据表」组件。此时「系数」输出会自动连接至数据表,您可按系数排序并观察哪些变量与预测结果呈正相关或负相关。线性回归组件通过输入数据构建一个学习器/预测器,用于学习线性函数。我们训练了线性回归和随机森林模型,并通过「测试与评分」组件评估它们的性能。一种支持可选 L1(LASSO)、L2(岭回归)或 L1L2(弹性网络)正则化的线性回归算法。线性回归可与「排序」组件结合用于特征评分。若要禁用默认预处理,需将空预处理器组件连接到学习器。

2025-04-29 09:25:31 20

原创 Orange3实战教程:模型---支持向量机

使用房屋数据集,通过“数据采样器”将数据分为“数据样本”和“剩余数据”。将样本输入 SVM 生成模型,再通过“预测”小部件对剩余数据进行预测。若数据已分为两个文件,可直接用两个“文件”小部件代替“文件-数据采样器”组合。支持向量机(SVM)是一种机器学习技术,通过超平面划分属性空间,最大化不同类别或类值实例之间的间隔。在鸢尾花数据集上训练 SVM 模型,输出支持向量(即学习阶段使用的实例),并通过“散点图”可视化这些实例。若要禁用默认预处理,可将空白的“预处理器”小部件连接到学习器。其估计精度取决于参数。

2025-04-29 08:53:46 558

原创 Orange3实战教程:可视化---诺模图

预测时,每个属性的贡献以“点”衡量,总点数决定概率。下图展示了已知乘客为“头等舱成年男性”的情况:总点数为-0.36,对应未幸存概率约为53%。诺模图能够直观展示分类器(特别是朴素贝叶斯和逻辑回归)的结构,揭示训练数据中属性对类别概率的影响。对于朴素贝叶斯模型,排序选项包括“无排序”“名称”“绝对重要性”“正向影响”和“负向影响”;在多分类任务中,目标类别的概率通过“一对多”(One-vs-All)原则计算(此时概率之和可能不为1)。,连接至朴素贝叶斯(或逻辑回归),并添加诺模图。● 数据:输入数据集。

2025-04-28 08:45:40 14

原创 Orange3实战教程:可视化---评分表查看器

评分表查看器小部件提供了一种简单直观的方式来可视化评分表模型的预测结果。该小部件的输入包括一个训练好的评分表模型和一个可选的(实例)数据集,用于展示预测结果。小部件会生成一个表格,可视化每个特征对最终评分的贡献。每个特征的贡献值可为正或负,分别表示其增加或降低风险的程度。假设从数据表小部件中选择一个实例:其“slope peak exc ST”属性值为“上坡型”,使心脏病风险降低3分;在此示例中,我们首先对数据进行抽样,其中一部分用于训练评分表模型,另一部分输入至表格小部件。

2025-04-28 08:39:20 208

原创 Orange3实战教程:模型---常量模型

使用鸢尾花数据集(Iris)连接至“测试与评分”组件,将常量模型与kNN算法对比,观察kNN相对于基准模型的性能提升。在房价数据集(Housing)中,常量模型的预测结果均为目标变量均值。通过“预测结果”组件可查看所有实例的预测值相同。通过训练集中出现频率最高的类别(分类任务)或均值(回归任务)进行预测。此学习器生成的模型始终预测分类任务中的多数类或回归任务中的均值。修改名称后需点击“应用”生效,或勾选左侧复选框以启用自动更新。此组件通常用作其他模型的性能基准。常量模型不使用任何预处理方法。

2025-04-27 09:00:00 14

原创 Orange3实战教程:模型---CN2 规则归纳

使用动物园数据集(zoo dataset)作为输入,通过 CN2 规则归纳生成模型,并利用“CN2 规则查看器”组件解析模型。CN2 算法是一种分类技术,旨在高效归纳形式为“若条件则预测类别”的简单、易理解的规则,即使在存在噪声的领域中也能适用。:在“测试与评分”组件中对比 CN2 规则归纳与决策树的性能。使用 CN2 算法从数据中归纳规则。:CN2 规则归纳仅适用于分类任务。

2025-04-27 08:59:13 17

原创 Orange3实战教程:模型---校准学习器

我们将逻辑回归作为基学习器,并使用默认设置进行校准(即通过 Sigmoid 优化概率分布,并优化分类准确度)。使用校准学习器的简单示例。我们以泰坦尼克数据集为例(该部件要求二元类别值,本例为“幸存”和“未幸存”)。该学习器生成的模型会校准类别概率分布并优化决策阈值。此部件仅适用于二元分类任务。将另一个学习器与概率校准和决策阈值优化进行封装。对比未校准的逻辑回归模型,校准后的模型表现更优。:使用校准学习器训练的模型。

2025-04-25 08:39:55 16

原创 Orange3实战教程:模型--- KNN(k-近邻算法)

kNN 小部件使用 k-最近邻算法,通过在特征空间中搜索 k 个最近的训练样本,并以它们的平均值作为预测结果。比较 k-最近邻算法与默认的“常量模型”(始终预测多数类)的性能。将 kNN 模型输入“预测”小部件,观察预测值。根据最近的训练实例进行预测。

2025-04-25 08:39:15 13

原创 Orange3实战教程:模型---树算法

树算法通过类别纯度(分类目标变量使用信息增益,数值目标变量使用均方误差)将数据分割为节点。它是随机森林的基础组件。Orange 中的树算法为自主研发,可处理分类和数值型数据集,同时支持分类和回归任务。以上示例使用鸢尾花数据集,但树算法也适用于回归任务(如房价数据集)。通过树查看器选择的节点可在散点图中展示,所选实例的特征将保持一致。一种带有前向剪枝的树算法。树算法不进行任何预处理。

2025-04-24 08:44:57 23

原创 Orange3实战教程:模型---随机森林

在构建单棵树时,每个节点会从随机抽取的属性子集中选择最佳分裂属性(因此称为“随机”)。随机森林是一种集成学习方法,适用于分类、回归等任务。将其连接至“预测”组件,再将“文件”组件连接至“随机森林”和“单棵决策树”,最后观察两种模型的预测结果。:使用房价数据(housing)。在“测试与评分”组件中比较随机森林、线性回归和常数模型的性能。随机森林可与“特征排序”组件结合使用,用于评估特征重要性。如需禁用默认预处理,需将空的“预处理”组件连接至学习器。随机森林既可用于分类任务,也可用于回归任务。

2025-04-24 08:42:52 22

原创 Orange3实战教程:模型---梯度提升

梯度提升是一种用于回归和分类的机器学习技术,它通过集成多个弱预测模型(通常是决策树)来生成预测模型。梯度提升可与“Rank”组件结合用于特征评分(示例见“Learners as Scorers”)。对于分类任务(如心脏病数据集),可通过“测试与评分”组件比较所有可用方法的效果。:将更改同步到其他组件。勾选“自动应用”后,更改将自动生效。使用基于决策树的梯度提升进行预测。:默认名称为“梯度提升”。

2025-04-24 08:41:55 18

原创 Orange3实战教程:可视化---CN2 规则查看器

一个用于展示 CN2 分类规则的组件。若同时连接数据集,选择规则后可分析符合条件的数据实例。选中规则后,可通过系统快捷键(Ctrl+C 或 Cmd+C)复制到剪贴板。选中规则后,输出过滤的数据实例,可在数据表中查看。过滤后的数据:符合所有选中规则的数据实例。数据:用于过滤的数据集。

2025-04-23 08:50:43 13

原创 Orange3实战教程:可视化---毕达哥拉斯森林

毕达哥拉斯森林可展示随机森林中所有学习到的决策树模型。每棵随机构建的树都以毕达哥拉斯树的形式可视化。在可视化界面中,您可以选中某一棵树,并通过“毕达哥拉斯树”组件进一步查看。最佳树的特征是分支最短且颜色最深,这表明其分支通过较少的属性即可有效分割数据。毕达哥拉斯森林非常适合同时可视化多棵已构建的树。下例中,我们使用住房数据集,展示了随机森林生成的 10 棵树。当调整随机森林的参数时,毕达哥拉斯森林的可视化结果也会相应变化。随后,我们在可视化界面中选择一棵树,并通过“毕达哥拉斯树”组件进行详细分析。

2025-04-23 08:47:34 13

原创 Orange3实战教程:可视化---韦恩图

维恩图组件通过显示共同的数据实例(行数)或共享的特征(列数)来展示数据集之间的逻辑关系。选择可视化中的某一部分可输出对应的实例或特征。维恩图也可用于分析不同预测模型的误分类情况。使用维恩图的最简单方式是选择数据子集并在可视化中查找匹配实例。:例如,来自不同数据集的同一文件原始行被视为匹配。在散点图组件中标记的实例。尝试选择不同的维恩图区域。:若所有表包含相同的变量,则按变量值完全匹配。:通过所有表中均存在的字符串变量值进行匹配。用于绘制两个或多个数据子集的维恩图。以观察散点图可视化的动态变化。

2025-04-23 08:43:51 21

原创 Orange3实战教程:可视化---轮廓图

轮廓图部件提供了一种图形化方式来评估聚类的质量。轮廓分数(Silhouette Score)用于衡量一个数据点与其所属聚类之间的相似性,以及与其他聚类的差异。轮廓分数接近1表示该数据点靠近聚类中心,而接近0则表示数据点位于两个聚类的边界。下图展示了在鸢尾花数据集上使用轮廓图的效果。我们选择了轮廓分数较低的数据子集,并将其传递至散点图部件。结果显示,这些子集数据确实位于两个聚类的边界区域,验证了轮廓图的准确性。一种用于展示数据聚类内部一致性的图形化表示方法。:包含新增列(标记数据点是否被选中)的数据集。

2025-04-22 10:05:54 8

原创 Orange3实战教程:可视化---毕达哥拉斯树

毕达哥拉斯树是一种平面分形,可用于表示树状层次结构(基于Fabian Beck及其合作者的论文)。本文中,该结构用于可视化树模型(如分类树或回归树)。两者均可可视化树模型,但毕达哥拉斯树布局更紧凑(即使在小规模鸢尾花数据集上)。两个工具均可通过点击分隔条隐藏左侧控制面板。毕达哥拉斯树支持分类树和回归树的可视化。回归树的唯一区别是无法按类别着色,但可通过均值或标准差着色。毕达哥拉斯树支持交互:点击任意节点(方块)可选中该节点关联的训练数据实例。用于分类或回归树可视化的平面分形结构。:显示输入树的基本信息。

2025-04-22 10:05:18 13

原创 Orange3实战教程:可视化---热力图

通过将类别变量和属性分别置于x轴和y轴,可以观察属性值最强和最弱的区域,从而发现每个类别的典型特征。选择发散型调色板(两端为对比色,中点为中性色如黑/白)时,可设置有意义的中点值(默认为0)。通过列聚类(有序优化),相似表达模式的列被分组,例如右下角显示核糖体基因在特定条件下的低表达。:若行数过多,可通过k-means算法合并为N个簇(默认50)。综合得分为正(白色)表示积极文档,为负(蓝色)表示消极文档。热图中低表达值显示为蓝色,高表达值显示为黄色和白色。:勾选后,每个值显示为正方形(与图比例一致)。

2025-04-21 17:45:12 18

原创 Orange3实战教程:可视化---雷达图

其位置由物理隐喻确定:每个点通过弹簧连接到变量锚点,弹簧的刚度与对应变量的值成正比,最终点的位置由弹簧力的平衡决定。与所有基于点的可视化工具类似,此小部件支持智能数据可视化(VizRank,见 Leban 等,2006)和探索性数据分析功能(如选中图中的数据点)。根据上述定义,上方的 Radviz 图是一个优秀可视化的示例,而下图展示了 VizRank 界面(含“建议特征”按钮),其中列出了基于 3 个属性的可视化选项及其评分,效果相对较差。靠近一组变量锚点的数据实例,其对应变量的值会显著高于其他变量。

2025-04-21 17:40:01 18

原创 Orange3实战教程:可视化---线性投影

以鸢尾花(Iris)数据集为例,初始投影显示萼片宽度和萼片长度能够较好地区分山鸢尾(Iris setosa)与其他两类,而花瓣长度则是区分变色鸢尾(Iris versicolor)和维吉尼亚鸢尾(Iris virginica)的最佳属性。评分基于分类(准确率)或回归(均方误差)的 k-近邻分类器在二维投影上的表现,反映投影中类别的分离程度。“线性投影”组件与其他可视化组件(如“文件”组件)配合使用。该组件用于显示带有类别标签数据的线性投影,支持多种投影类型,如环形布局、线性判别分析和主成分分析。

2025-04-21 17:36:26 13

原创 Orange3实战教程:可视化---FreeViz投影

FreeViz 采用了一种借鉴自粒子物理学的范式:同类数据点相互吸引,不同类数据点相互排斥,产生的力作用于各维度的属性锚点(即每个坐标轴的单位向量)。数据点无法移动(已被投影到投影空间),但属性锚点可以移动。优化的结果可能取决于锚点的初始位置(可设置为圆形、随机或手动调整)。手动调整功能在优化过程中随时可用,建议通过此功能观察锚点位置变化对数据点投影的影响。在线性投影中,若某单位向量的投影长度远小于其他向量,表明其对应属性在当前分类任务中信息量较低。● 数据: 包含新增列(标记点是否被选中)的数据表。

2025-04-21 17:32:33 1580

原创 Orange3实战教程:可视化---马赛克图

马赛克图是二维频率表(列联表)的图形化表示方法,用于可视化两个或多个定性变量的数据。该方法由 Hartigan 和 Kleiner 于 1981 年提出,后由 Friendly 在 1994 年改进和完善。我们加载了泰坦尼克号数据集,并将其连接到马赛克图控件。选择分析三个变量:舱位等级(status)、性别(sex)和生存情况(survival)。通过皮尔逊残差对内部着色,以展示观测值与拟合值的差异。从图中可见,男性和女性的生存率明显偏离拟合值。• 选中的数据:从图中选择的实例。以马赛克图形式展示数据。

2025-04-18 10:24:21 19

原创 Orange3实战教程:可视化---筛状图

在此图表中,每个矩形的面积与期望频率成正比,而观测频率通过矩形中的方格数量表示。观测频率与期望频率之间的差异(与标准皮尔逊残差成比例)通过阴影密度体现,蓝色表示正向偏差(观测值高于期望),红色表示负向偏差(观测值低于期望)。下图展示了泰坦尼克号数据集的筛状图,属性为“性别”和“是否幸存”(后者为该数据集的类别属性)。组件选择最优属性(信息增益、增益比或基尼指数最高的属性),并将其输入筛状图。图中展示了两个最优属性(性别和舱位等级)的筛状图。可以看出,头等舱女性乘客的幸存率极高,而女性船员的幸存率极低。

2025-04-18 09:33:50 16

原创 Orange3实战教程:可视化---柱状图

随后,通过「选择行」筛选出 60 岁以上的患者,并将子集发送至柱状图以高亮显示。结果显示,胆固醇值极高的异常点属于 60 岁以上患者。柱状图部件通过分类变量对数值变量进行可视化比较。该部件适用于观察异常值、组内分布以及类别间的差异。柱状图部件通常紧接在「文件」部件之后,用于比较分类变量。● 数据:包含额外列(标记点是否被选中)的数据。用于可视化离散类别之间的比较。● 选中数据:从图中选中的实例。• 数据子集:实例的子集。• 数据:输入数据集。

2025-04-18 09:25:07 19

原创 Orange3实战教程:可视化---折线图

折线图是标准可视化工具,常用于展示有序数值型数据的轮廓。本例以鸢尾花数据集为例,按“鸢尾花种类”分组显示花瓣长度的折线图。图表显示不同类别的花瓣长度具有明显区分度。若用散点图验证,可进一步确认此结论。花瓣长度(结合花瓣宽度)在折线图中能有效区分不同类别,尤其在分组后更为显著。折线图是一种将数据以点序列显示并通过直线段连接的图表类型。它仅适用于数值型数据,但分类数据可用于数据点的分组。用于数据轮廓(如时间序列)的可视化。:包含标记点是否被选中列的数据表。

2025-04-18 09:18:32 17

原创 Orange3实战教程:可视化---树状查看器

如下方流程图所示,选中数据会以粗体点在散点图中高亮显示,并在数据表中展示子集。需确保将树数据作为子集传递(例如:先将散点图连接到文件组件,再连接到树状查看器)。若查看器与树模型同时打开,任何重新运行树生成算法的操作都会实时更新可视化结果。将数据表连接到查看器,并在组件间设置「数据」而非「选中数据」的链接。此时,完整数据集将附加一列元数据,标记实例是否被选中(「是」或「否」)。本工具支持分类树和回归树的二维可视化。用户可通过选择节点,使工具输出与该节点关联的数据,从而实现探索性数据分析。

2025-04-18 08:46:10 23

原创 Orange3实战教程:可视化---箱线图

按子组相关性排序”会为所有变量(包括二值变量)计算基于方差分析的 p 值,以便统一排序。箱线图(Box Plot)部件用于展示属性值的分布。建议在查看新数据时使用此部件,以便快速发现异常情况,例如重复值(如“gray”和“grey”)、离群值等。可以通过选择条形(例如分类数据的值或数值型数据的分位数范围)进行交互操作。例如,在动物园数据集中,箱线图显示不同动物类型的数量:41 只哺乳动物、13 条鱼、20 只鸟等。:第一分位数(25%)和第三分位数(75%)的值。用于展示属性值的分布情况。

2025-04-18 08:45:38 16

Orange3实战教程:实例-文本分类

Orange3 文本挖掘---文本分类模型

2025-04-09

code-of-learn-deep-learning-with-pytorch.rar

深度学习代码包

2021-07-21

virtualenv部署

主要是介绍virtualenv的服务器端应用部署

2010-04-21

多域名全自动搜索工具

多域名全自动搜索工具多域名全自动搜索工具多域名全自动搜索工具

2009-06-08

py report for openoffice

py report for openoffice

2008-12-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除