Igel机器学习工具使用指南:零代码实现模型训练与预测

Igel机器学习工具使用指南:零代码实现模型训练与预测

igel a delightful machine learning tool that allows you to train, test, and use models without writing code igel 项目地址: https://gitcode.com/gh_mirrors/ig/igel

什么是Igel

Igel是一款创新的机器学习工具,旨在让用户无需编写代码即可完成机器学习模型的训练、评估和预测。它通过简单的YAML配置文件来描述机器学习任务的所有细节,使机器学习流程变得异常简单。

安装与基本使用

首先确保你已经安装了Igel工具。安装完成后,可以通过以下命令查看帮助信息:

igel --help
# 或简写
igel -h

建议初学者仔细阅读帮助信息,这将帮助你快速掌握Igel的核心功能。

快速开始

初始化配置文件

Igel提供了便捷的初始化命令来创建配置文件模板:

igel init -type "classification" -model "NeuralNetwork" -target "sick"

这个命令会创建一个igel.yaml文件,其中包含了基本的配置模板。你也可以直接运行igel init创建空模板,然后手动编辑。

配置文件详解

一个典型的Igel配置文件如下所示:

model:
    type: classification
    algorithm: RandomForest
    arguments:
        n_estimators: 100
        max_depth: 30

target:
    - sick

在这个例子中,我们使用随机森林算法(RandomForest)来解决一个分类问题(预测某人是否患病),并设置了两个超参数:决策树数量(n_estimators)和最大深度(max_depth)。

完整工作流程

1. 模型训练

使用以下命令训练模型:

igel fit -dp 'path_to_dataset.csv' -yml 'path_to_yaml_file.yaml'

训练完成后,Igel会自动创建一个model_results文件夹,其中包含训练好的模型和相关描述文件。

2. 模型评估

训练完成后,可以使用以下命令评估模型性能:

igel evaluate -dp 'path_to_evaluation_data.csv'

评估结果会保存在evaluation.json文件中。

3. 模型预测

对新的数据进行预测:

igel predict -dp 'path_to_test_data.csv'

预测结果会保存在predictions.csv文件中。

一键式实验

Igel还提供了experiment命令,可以一次性完成训练、评估和预测:

igel experiment -DP "train_data.csv eval_data.csv test_data.csv" -yml "config.yaml"

高级功能

数据预处理

Igel支持多种数据预处理操作,可以在配置文件中指定:

dataset:
    split:
        test_size: 0.2
        shuffle: True
        stratify: default
    preprocess:
        missing_values: mean
        encoding:
            type: oneHotEncoding
        scale:
            method: standard
            target: inputs

这段配置表示:

  • 将数据按80:20的比例分割为训练集和测试集
  • 分割时打乱数据顺序
  • 用均值填充缺失值
  • 使用独热编码(oneHotEncoding)处理分类变量
  • 对输入特征进行标准化处理

模型导出

可以将训练好的scikit-learn模型导出为ONNX格式:

igel export -dp "path_to_trained_model"

Python API

虽然Igel主要设计为命令行工具,但也提供了Python接口:

from igel import Igel

params = {
    'cmd': 'fit',
    'data_path': 'path_to_dataset.csv',
    'yaml_path': 'path_to_config.yaml'
}

Igel(**params)

实际案例

糖尿病预测案例

以下是一个完整的糖尿病预测案例配置:

model:
    type: classification
    algorithm: DecisionTree
target:
    - sick

使用流程:

  1. 训练模型:igel fit -dp diabetes.csv -yml config.yaml
  2. 评估模型:igel evaluate -dp diabetes_test.csv
  3. 进行预测:igel predict -dp new_patients.csv

总结

Igel通过简化的YAML配置和命令行界面,大大降低了机器学习的使用门槛。它的主要特点包括:

  1. 零代码:无需编写任何Python代码即可完成完整机器学习流程
  2. 灵活配置:支持多种算法和丰富的预处理选项
  3. 完整流程:覆盖从数据准备到模型部署的全过程
  4. 跨平台:支持模型导出为ONNX格式

无论是机器学习初学者还是希望快速验证想法的专业人士,Igel都是一个值得尝试的工具。通过合理的配置,你可以在几分钟内完成从数据到预测的完整流程。

igel a delightful machine learning tool that allows you to train, test, and use models without writing code igel 项目地址: https://gitcode.com/gh_mirrors/ig/igel

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

高慈鹃Faye

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值