先对数据进行处理,用了Lagrange插值法进行了缺失值处理,然后对文本数据进行了转数字处理
enumerate()函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合 为一个索引序列,同时列出数据和数据下表,一般用在for循环当中, enumerate(sequence, [start=0]) sequence -- 一个序列、迭代器或其他支持迭代对象。 start -- 下标起始位置。






用模型对训练集进行预测(LM)

用模型对测试集进行预测(LM)

用模型对训练集进行预测(CART)

用模型对测试集进行预测(CART)

两种模型roc曲线比较

可能是因为数据集比较小,每次结果都不太一样。。。。。
本文介绍了使用Lagrange插值法处理数据缺失值的方法,并对文本数据进行了数字化转换。通过enumerate()函数辅助数据处理流程。此外,还利用两种模型(LM和CART)对训练集和测试集进行了预测,并对比了它们的ROC曲线。
2459

被折叠的 条评论
为什么被折叠?



