Python 机器学习与数据分析实战
1. scikit-learn 简介
scikit-learn 是最广泛使用和值得信赖的通用 Python 机器学习工具包之一。它包含了大量标准的有监督和无监督机器学习方法,同时具备模型选择与评估、数据转换、数据加载以及模型持久化等工具。这些模型可用于分类、聚类、预测等常见任务。
安装 scikit-learn 可使用 conda 命令:
conda install scikit-learn
2. Titanic 数据集实战
以 1912 年泰坦尼克号乘客生存率的经典数据集为例,使用 pandas 加载训练集和测试集:
import pandas as pd
train = pd.read_csv('datasets/titanic/train.csv')
test = pd.read_csv('datasets/titanic/test.csv')
查看训练集前 4 行:
train.head(4)
输出结果如下:
| PassengerId | Survived | Pclass | Name | Sex | Age | SibSp | Parch | Ticket | Fare | Cabin | Embarked |
| — | — | — | — | —
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



