自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(312)
  • 资源 (4)
  • 收藏
  • 关注

原创 Orange3实战教程:公平性---加权逻辑回归

加权逻辑回归是支持实例权重的逻辑回归模型,主要用于处理通过重新加权预处理的数据。它保留了标准逻辑回归的所有功能,同时支持权重输入,使其成为目前唯一支持实例权重的学习器。该模型适用于公平性分析等场景,具体应用示例可参考重新加权部件的文档,而标准功能则与普通逻辑回归相同。

2025-08-19 09:08:35 117

原创 Orange3实战教程:公平性---均衡几率后处理

摘要: 均衡几率后处理(Equalized Odds Postprocessing)是一种后处理公平性算法,通过调整分类器预测结果以满足公平性标准。其流程包括:训练初始模型并生成预测,拟合后处理器调整预测结果,最终应用于测试数据。示例中结合线性回归模型,通过连接预处理器、后处理组件及评估模块,实现模型去偏与性能测试。该算法可灵活集成至现有流程,确保模型预测的公平性。(149字)

2025-08-19 09:05:57 67

原创 Orange3实战教程:公平性---对抗性去偏

对抗性去偏技术简介 该技术通过双模型架构(预测器和判别器)实现公平性分类。预测器负责目标变量预测,判别器则检测预测结果中的偏见。核心目标是保持预测准确性的同时消除受保护属性(如性别、种族)的影响。使用前需安装TensorFlow依赖项。典型应用场景包括:连接数据集后,通过调整"对抗损失权重"参数实现去偏效果,最终通过测试评估模型性能和公平性指标。该技术为机器学习中的公平性问题提供了有效解决方案。

2025-08-18 08:44:39 375

原创 Orange3实战教程:公平性---重加权

摘要:重加权组件通过为数据实例分配权重来缓解数据集偏见,优化对代表性不足群体的学习。它可以作为独立预处理器为数据集添加权重属性,或作为学习器的预处理步骤。示例展示了两种使用方式:一是直接预处理数据集用于偏差评估,二是作为学习器预处理链的一部分来改善预测公平性。该技术能有效平衡不同群体在模型训练中的影响力,提升机器学习模型的公平性表现。

2025-08-18 08:36:10 301

原创 Orange3实战教程:公平性---数据集偏差

摘要:数据集偏差小部件用于评估数据集的公平性,计算差异影响和统计奇偶差异指标。理想阈值分别为1.0和0.0,偏离这些值表示存在群体偏差。示例展示了该小部件在Adult数据集上的应用,自动处理缺失值但不支持缺失值分析。使用前需确保数据包含公平性元属性。

2025-08-18 08:33:19 119

原创 Orange3实战教程:公平性---公平性数据转换

摘要 "公平性数据转换"小部件用于为数据集添加公平性元属性(如有利类别值、受保护属性和特权属性值),以支持后续公平性分析。用户可手动指定关键参数,如将性别属性设为受保护属性并标记特权值。示例展示了如何为德国信用数据集添加元属性(如标记"男性"为特权值)。Orange内置的公平性数据集(如成人数据集)已预置这些元属性,无需重复处理。该工具为后续公平性算法提供必要的数据基础。 (字数:150)

2025-08-15 09:17:56 40

原创 Orange3实战教程:解释---ICE(个体条件期望)

ICE(个体条件期望)工具用于可视化机器学习模型中单个实例的预测对特征变化的响应。与部分依赖图不同,ICE为每个实例生成一条独立曲线,展示特征变化时的预测变化。用户可选择目标类别、特征,并设置排序、居中、均值显示等选项。工具支持交互式操作,选中曲线可输出对应实例数据。该工具常用于模型解释,如结合随机森林分析住房数据时,能直观展示不同实例对特征变化的敏感性。

2025-08-15 09:12:52 58

原创 Orange3实战教程:解释---多解释预测

摘要: "解释预测"功能用于分析模型预测结果的关键影响因素。通过输入模型、背景数据及待解释数据集,该功能可识别对预测贡献最大的特征(使用SHAP值量化),正负分数反映特征影响方向。输出包括选定的数据实例、标记选中状态的原始数据,以及各特征的贡献分数,偏差越大表示影响越显著。适用于分类和回归模型的可解释性分析。

2025-08-14 09:20:52 39

原创 Orange3实战教程:解释---预测解释

这篇技术文章介绍了如何使用"预测解释"小部件分析机器学习模型对单个实例的预测结果。该工具通过计算SHAP值,显示各特征对预测的贡献程度:红色特征支持预测结果,蓝色特征则起抑制作用。文章以心脏病数据集为例,演示了如何识别影响预测的关键特征,如"主要血管着色"和"运动后ST段"值。特别说明了分类特征的独热编码表示方式,并展示了特征值对特定类别预测概率的影响。该方法能直观呈现模型决策依据,帮助理解预测结果的形成过程。

2025-08-14 09:16:35 411

原创 Orange3实战教程:解释---解释模型

摘要(140字) "解释模型"小部件利用SHAP方法分析机器学习模型的预测机制。该工具通过可视化展示各特征对特定类别预测的贡献度:水平轴表示SHAP值(正值促进预测,负值抑制),颜色反映特征值高低。用户可指定目标类别、调整显示特征数量,并交互式查看数据实例。示例显示,在心脏病预测模型中,"主要血管数"和"胸痛类型"是影响诊断的关键特征。该工具适用于分类和回归任务,帮助理解模型决策依据,支持不同数据源的解释分析。

2025-08-14 09:12:46 55

原创 Orange3实战教程:解释---特征重要性

摘要: 特征重要性小部件通过排列特征重要性技术分析模型预测的关键因素。该工具需要输入训练好的模型和参考数据集,通过随机打乱特征值来评估每个特征对预测误差的影响,输出特征得分及对应数据实例。用户可自定义评分指标、排列次数和显示特征数量,并通过图表直观查看重要特征排序(如示例中"Major vessels coloured"被识别为最关键特征)。该小部件支持与逻辑回归等模型配合使用,适用于分类和回归任务的分析场景,并能根据选定的特征过滤输出数据集。

2025-08-13 09:14:22 63

原创 Orange3实战教程:联合---关联规则

本文介绍了关联规则挖掘组件的功能与使用方法。该组件采用FP-growth算法实现频繁模式挖掘,支持分类规则生成和分桶优化。用户可设置最小支持度、置信度等参数,并通过前提/结果项数、正则表达式等条件筛选规则。组件支持自动搜索和手动触发模式,并能自动输出匹配实例。典型应用场景是与文件组件配合使用。文中还提供了FP-growth算法和深度优先模式生成的相关文献参考。该组件适用于发现数据集中项目间的关联关系,但需注意大数据集可能影响性能。

2025-08-13 09:09:07 511

原创 Orange3实战教程:联合---频繁项集

频繁项集组件用于从数据集中发现满足最小支持度的项目组合。用户可设置最小支持度阈值、最大项集数量等参数,并支持通过正则表达式和项集大小进行筛选。该工具适用于关联规则挖掘,可自动或手动触发搜索,并能与文件组件配合使用。对于大数据集,建议关闭实时筛选以提高性能,待参数设置完成后再执行搜索。

2025-08-12 09:28:28 37

原创 Orange3实战教程:时间序列---季节性调整

摘要 季节性调整小部件用于分解时间序列数据,将其分离为季节性、趋势和残差成分。该工具支持加法或乘法模型,允许用户指定季节长度(如月度数据为12)。输出包含原始数据及分解后的各成分列,以及经季节性调整的序列。通过可视化分析,用户可直观理解数据中的周期性模式和长期趋势。此功能常用于经济指标分析等需要去除季节因素影响的场景。

2025-08-12 09:20:36 43

原创 Orange3实战教程:时间序列---差分

差分小部件用于将非平稳时间序列转换为平稳序列,提供一阶、二阶差分、变化商和百分比变化等多种计算方式。通过设置偏移量和反转方向,可灵活计算当前值与未来值的差异。示例展示了亚马逊股票最高值的每日变化计算,结果可通过折线图直观展示。该工具常与Moving Transform小部件配合使用,用于预测分析中的序列还原。

2025-08-12 08:50:00 40

原创 Orange3实战教程:时间序列---时间切片

时间切片是一款用于时间序列数据分析和交互式可视化的工具。它支持通过日期/时间选择数据子集,并提供滑动窗口功能,可自定义步长和播放速度。用户可通过拖动界面上的标记或设置起止时间来选择特定时间段的数据,勾选"循环播放"可实现连续重放数据。典型应用场景包括金融数据分析,如通过Yahoo Finance获取股票指数后,配合折线图组件实时观察数据变化。该工具为时间序列分析提供了直观的交互式操作方式。

2025-08-11 09:21:24 150

原创 Orange3实战教程:时间序列---模型评估

本文介绍了时间序列模型的评估方法。通过输入时间序列数据和待评估模型,使用多种指标(RMSE、MAE、MAPE、POCID、R²、AIC、BIC)进行综合评估。重点说明了时间序列交叉验证的参数设置(折数和预测步数)以及样本内外误差的对比分析。文中还提供了相关模型的参考链接和示意图,帮助理解交叉验证过程。评估结果将显示模型在不同误差指标上的表现,为选择最优模型提供依据。

2025-08-11 09:18:07 498

原创 Orange3实战教程:时间序列---VAR模型

VAR模型是一种用于时间序列分析的向量自回归方法,可对多变量时间序列进行建模和预测。该模型接受时间序列数据作为输入,输出拟合的VAR模型、预测值、拟合值和残差。用户可自定义模型阶数、自动优化参数(基于AIC/BIC等准则)、选择趋势项(常数/线性/二次项)以及设置预测步数和置信区间。VAR模型适用于多变量时间序列的联合分析,与ARIMA模型形成互补,常配合模型评估工具使用,为时间序列预测提供灵活解决方案。

2025-08-08 11:05:27 42

原创 Orange3实战教程:时间序列---ARIMA模型

ARIMA时间序列建模摘要 ARIMA模型用于时间序列分析,包含ARMA、ARIMA和ARIMAX三种变体。输入为时间序列数据,可选择添加外生变量(ARIMAX)。输出包括拟合模型、预测值、拟合值及残差。用户可设置p/d/q参数、预测步数和置信区间。示例展示了建模流程,还提供VAR模型和模型评估等扩展功能。该工具适用于各类时间序列预测分析任务。

2025-08-08 11:02:25 48

原创 Orange3实战教程:时间序列---格兰杰因果检验

摘要 格兰杰因果检验用于分析时间序列间的预测关系,通过统计方法确定一个序列是否对另一个序列具有预测能力(格兰杰因果关系)。该检验需要输入时序数据,设置置信水平和最大滞后阶数,输出最小影响滞后阶数及因果关系方向。虽然可作为VAR模型变量选择的参考,但需注意统计上的因果关系不等同于实际因果关系,解释结果时应保持谨慎。

2025-08-07 14:02:30 63

原创 Orange3实战教程:时间序列---螺旋热力图

螺旋热力图是一种可视化时间序列周期性数据的工具,可按照圆周单位(如月份、周数等)和纵轴单位(如分类变量)进行数据展示。支持多种颜色设置和聚合方法,便于分析属性值分布。示例展示了斯洛文尼亚垃圾场数据,通过月份和清理状态分析轮胎占比,发现1月和11月注册的垃圾场轮胎占比偏高。该工具支持数据选择并传递至下游分析,适用于周期性数据的可视化探索。

2025-08-07 13:59:43 51

原创 Orange3实战教程:时间序列---相关图

摘要 相关图是一种可视化时间序列自相关性的工具,可显示自相关系数(ACF)或偏自相关系数(PACF)。通过选择时间序列数据并设置95%显著性区间,用户可以直观分析数据的周期性特征和显著性相关关系。示例展示了雅虎财经中亚马逊股票6年数据的自相关图分析。该工具常与周期图等其他时间序列分析工具配合使用。

2025-08-07 13:55:50 31

原创 Orange3实战教程:时间序列---周期图

周期图分析工具摘要 周期图(Periodogram)是用于分析时间序列周期性和季节性的可视化工具。它能够识别时间序列中最显著的周期性特征。该工具支持两种数据处理方式:直接读取文件数据或接收"转为时间序列"小部件的输出。对于非等间距时间序列,采用Lomb-Scargle方法进行计算。应用示例展示了如何使用雅虎财经数据绘制亚马逊股票6年期的周期性图表,帮助用户直观理解数据中的周期性规律。相关功能还可参考"相关图(Correlogram)"小部件。

2025-08-06 09:52:17 95

原创 Orange3实战教程:时间序列---折线图

折线图小部件用于可视化时间序列数据,支持折线、阶梯线、柱状图和面积图等多种展示方式。用户可添加多个图表,选择线性或对数Y轴,并筛选显示的时间序列。该工具还能展示预测结果(虚线表示预测值,区间表示置信范围),并支持交互式操作。适用于金融数据分析等场景,帮助观察时间序列趋势和预测效果。

2025-08-06 09:46:58 64

原创 Orange3实战教程:时间序列---移动变换

摘要: 移动变换组件用于对时间序列数据进行多种聚合计算。支持三种数据处理方式:1)滑动窗口平滑,可设置窗口宽度和输出选项;2)连续块聚合,可定义块大小和代表值选择;3)时间段聚合,可按年/月/日等单位或周期性时点分组。提供20余种聚合函数,包括各类均值、极值、统计量和特殊移动平均等。典型应用场景包括股票数据平滑(如5日移动平均线)和跨时间段汇总(如年度数据聚合)。组件可与折线图、数据表等可视化工具配合使用,支持保留原始数据或仅输出计算结果。

2025-08-05 09:19:20 1318

原创 Orange3实战教程:时间序列---插值

摘要: 插值部件用于填补时间序列中的缺失值,支持线性、样条、最近邻和均值四种插值方法。线性插值为默认选项,适合快速处理;样条插值精度高但耗时;端点缺失值固定使用最近邻法填补。输出包含原始序列和插值后的完整序列,满足无缺失值的算法需求。离散序列的缺失值默认用众数填补(除非选择最近邻法)。多变量插值可整体处理二维数据。适用于需完整数据的时间序列分析场景。 (字数:149)

2025-08-05 09:11:49 46

原创 Orange3实战教程: 时间序列---创建时间序列

摘要: "创建时间序列"小部件用于将普通数据表格转换为时间序列格式,以便进行时序分析。用户需指定代表时间变量的属性(连续型)或使用实例顺序隐含时间信息。输入数据可来自任何提供表格的部件(如"文件"部件),但需注意若经过其他处理(如列选择),需重新应用此转换以保持时间序列结构。该功能为时序分析提供基础数据准备。

2025-08-04 10:05:46 236

原创 Orange3实战教程:时间序列---雅虎金融

该组件通过Yahoo Finance获取股票/指数历史数据,输出包含OHLC价格、成交量和调整收盘价的时间序列表格。用户需输入股票代码(如GOOG)、日期范围和时间粒度(日/周/月/股息数据)。输出为结构化数据表,可连接各类数据分析工具进行后续处理。示例展示了该功能在时间序列分析中的实际应用场景。

2025-08-04 09:48:08 47

原创 Orange3实战教程:教育---随机数据

摘要: 随机数据组件支持生成多种统计分布的数据集,包括正态、伯努利、二项等常见分布。用户可自定义变量参数(如均值、方差、概率等)和样本量,通过Scipy的stats模块实现。组件提供直观的界面添加/删除分布,并支持生成多变量数据集(如双变量正态)。典型应用场景包括创建含正态变量和二分类目标变量的模拟数据。生成结果可通过数据表和分布组件进行可视化验证。(149字)

2025-08-04 09:42:07 29

原创 Orange3实战教程:教育---饼图

摘要: 饼图组件用于展示离散属性分布,但主要目的是证明其作为可视化工具的局限性。用户可选择展示属性、拆分依据,并设置饼块分离效果。示例使用泰坦尼克号数据集,通过性别和生存状态展示分布,虽能呈现部分信息(如男性在未幸存者中占比较高),但仍建议采用箱线图等更有效的可视化方式。该组件强调饼图的信息传达效率低下,仅供演示其缺陷使用。

2025-08-01 11:34:27 39

原创 Orange3实战教程:教育---多项式分类

摘要: 多项式分类小部件是一个可视化教学工具,用于展示二维空间中的分类效果。它支持交互式探索多项式扩展(可调次数)和正则化对分类边界的影响。默认使用逻辑回归算法,用户可自定义学习器(如调整正则化强度)。通过颜色梯度与等高线直观呈现分类概率,轮廓线表示真实类别,填充色显示预测结果(支持二元/多元分类)。典型应用包括观察多项式次数变化对决策边界的影响,以及正则化强度调整对模型泛化能力的调节效果。示例展示了从简单二元分类到复杂三分类场景的可视化分析过程。

2025-08-01 11:28:19 36

原创 Orange3实战教程:教育---多项式回归

多项式回归工具通过交互式界面展示不同回归模型的拟合效果。用户可选择自变量、因变量和多项式扩展次数(1为线性回归),并支持多种回归算法。工具提供可视化结果、模型系数和报告生成功能。示例展示了从线性回归到3次多项式扩展的拟合效果提升,以及替换为树学习器的不同表现。该工具适用于数据探索和模型比较场景,帮助用户直观理解回归模型的拟合特性。

2025-07-31 09:31:58 58

原创 Orange3实战教程:教育---梯度下降

摘要: 梯度下降小部件是一个教育工具,用于可视化展示逻辑回归或线性回归中的梯度下降算法。它能根据数据类型自动选择回归类型(离散类别用逻辑回归,连续类别用线性回归),并允许用户交互式调整参数如学习率、步长,通过步进/回退功能观察算法收敛过程。小部件支持数据可视化、模型预测和结果导出功能,可用于教学演示和算法理解。示例展示了在Iris数据集上执行逻辑回归梯度下降,以及在Housing数据集上进行线性回归的完整流程。

2025-07-31 09:27:22 448

原创 Orange3实战教程:教育---交互式 k-均值聚类

摘要:该交互式k-均值聚类组件通过可视化方式展示算法运行过程,支持用户手动调整质心位置、设置聚类数量,并实时观察数据点分配与质心移动。用户可通过逐步操作或自动运行模式理解算法收敛过程,适用于教育演示和数据分析。组件支持从文件导入数据,并提供结果输出功能,便于后续分析。示例以鸢尾花数据集展示了从初始化到最终聚类的完整操作流程。

2025-07-31 09:21:33 70

原创 Orange3实战教程:教育---EnKlik Anketa 组件说明

摘要:EnKlik Anketa组件可从1ka.si平台导入在线调查数据。用户需在问卷后台生成公共链接并粘贴至组件界面,支持设置5秒至5分钟的自动刷新频率。组件提供属性类型修改、元信息查看和手动/自动提交功能,特别适合实时监测调查结果。典型应用场景中,组件可自动识别问卷问题类型,配合Edit Domain组件可优化冗长的属性名称,使数据分析更高效。使用示例展示了如何将41份包含8个问题的问卷数据导入系统,并通过属性重命名提升数据可读性。

2025-07-30 09:19:38 56

原创 Orange3实战教程:教育---谷歌表格插件

谷歌表格插件可从Google Sheets电子表格中读取数据。用户只需共享表格链接并粘贴至插件URL栏即可加载数据,支持实时更新功能。插件提供自动/手动提交选项,可将数据传输至下游处理。示例展示了如何加载包含动物健康数据的表格,并支持通过数据表查看具体内容。术语表提供了中英文对照说明。

2025-07-30 08:50:49 56

原创 Orange3实战教程:GEO地理---地理坐标转换

摘要:地理坐标转换组件用于将地理坐标数据在不同大地测量系统间转换。该工具使用pyproj库,通过设置经纬度属性和目标坐标系(默认为WGS 84),实现精确转换。示例中,安提基特拉考古数据集因使用UTM 34N坐标系导致地图显示异常,经转换至WGS 84系统后,数据正确显示在Geo Map上。转换过程通过识别原始坐标系并提交转换完成,有效解决了坐标系统不匹配问题。(149字)

2025-07-29 09:42:11 636

原创 Orange3实战教程:GEO地理---等值区域图

摘要:等值区域图(Choropleth Map)是一种通过颜色深浅展示统计数据的专题地图,适用于分析地理区域内的数值分布。其核心功能包括:支持国家/省/县等多级区域划分,提供计数、均值、中位数等聚合方法,允许调整分箱宽度、透明度及图例显示。用户可交互式选择数据,并通过地理编码匹配坐标信息。典型应用场景如全球预期寿命可视化(按国家着色)或地区建筑废料比例分析(按市县聚合),通过颜色梯度直观呈现空间差异。(150字)

2025-07-29 09:38:02 390

原创 Orange实战教程:GEO地理---GEO地图

地理地图部件可在地图上可视化空间数据,支持WGS 84格式的经纬度坐标。用户可设置多种地图类型(如卫星图、地形图等),并通过颜色、形状等属性区分数据点。部件提供缩放、平移、选择和自适应缩放等交互功能,支持自动或手动提交数据变更。典型应用如用不同颜色标记某城市各类犯罪事件的地理分布,直观展示犯罪热点区域。该工具适用于需直观呈现地理分布特征的数据分析场景。

2025-07-28 09:31:42 272

原创 Orange3实战教程:GEO地理---地理编码

地理编码小部件可将地区名称转换为经纬度坐标,或反向解析坐标为地区名称。它支持多种标识符类型(ISO代码、城市/国家名称),并能扩展附加区域信息。用户可通过未匹配标识符编辑器手动处理识别失败的情况。典型应用场景包括为地图可视化准备数据,例如从国家名称提取经纬度后在地理地图小部件中绘制。该工具支持自动或手动应用更改,并提供数据预览功能。

2025-07-28 09:26:26 36

Orange3实战教程:实例-文本分类

Orange3 文本挖掘---文本分类模型

2025-04-09

virtualenv部署

主要是介绍virtualenv的服务器端应用部署

2010-04-21

code-of-learn-deep-learning-with-pytorch.rar

深度学习代码包

2021-07-21

py report for openoffice

py report for openoffice

2008-12-31

多域名全自动搜索工具

多域名全自动搜索工具多域名全自动搜索工具多域名全自动搜索工具

2009-06-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除