Orange是一个基于组件的机器学习库,可通过可视化编程或Python 脚本进行数据挖掘,对初学者和专家都适用,并且可通过扩展运用到生物信息学和文本挖掘方面。
Orange是由斯洛文尼亚的卢布尔雅那大学(University of Ljubljana)计算机与信息科学学院的人工智能实验室开发生产的,是通过GNU 通用公共许可认证下的开源软件。
Orange号称的特性:
Orange是一个由卢布尔雅那大学开发的开源数据挖掘工具,适用于初学者和专家,提供可视化编程和Python接口。它拥有丰富的工具箱,支持多种操作系统,并在生物信息学和文本挖掘中有广泛应用。在使用Orange进行数据挖掘前,需要将数据转换为特定的.tab格式。此外,还介绍了Orange中的离群点挖掘功能,通过计算样本间的平均距离和z-score来识别离群点。
7750