数据可视化与理解:从岩石与地雷到鲍鱼年龄预测
1. 岩石与地雷数据集可视化
1.1 可视化的重要性
可视化有时能让我们洞察数据,而这些洞察在数字表格中很难发现。不同类型的可视化方法在分类问题和回归问题中会有不同的形式。
1.2 平行坐标图可视化
对于具有多个属性的问题,平行坐标图是一种有用的可视化方法。它通过绘制每行属性数据的每个属性值与属性索引的关系,将整个数据集的每行属性用一条线表示。基于标签进行颜色编码可以帮助我们看到属性值和标签之间的系统关系。
以下是绘制岩石与地雷数据集平行坐标图的代码:
__author__ = 'mike_bowles'
import pandas as pd
from pandas import DataFrame
import matplotlib.pyplot as plot
target_url = ("https://archive.ics.uci.edu/ml/machine-learning-"
"databases/undocumented/connectionist-bench/sonar/sonar.all-data")
#read rocks versus mines data into pandas data frame
rocksVMines = pd.read_csv(target_url,header=None, prefix="V")
for i in range(208):
#assign color based on "M" or "R" labels
if rocksV
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



