Tensorflow读取pandas数据训练DNN模型（心脏病预测（仅做深度学习训练参考，不可当成医学参考））

最新推荐文章于 2024-11-12 08:45:53 发布

原创最新推荐文章于 2024-11-12 08:45:53 发布 · 580 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #tensorflow #pandas

该文展示了如何利用Python的TensorFlow库和Pandas数据处理库对心脏病数据集进行预处理，包括数据读取、类别编码，然后将数据转化为tf.data.Dataset。接着，构建了一个包含输入层、隐藏层和输出层的神经网络模型，用Adam优化器和二元交叉熵损失函数进行编译，并进行了15轮的训练。

部署运行你感兴趣的模型镜像

本案例使用Python的tensorflow、jupyternotebook、pandas进行训练学习
1.使用Pandas读取数据

import pandas as pd
import tensorflow as tf
df=pd.read_csv("./datas/heart/heart.csv")
df.head()

在这里插入图片描述

df.dtypes

在这里插入图片描述

#把thal列变成数字编码
df['thal']=pd.Categorical(df['thal'])
df['thal']=df['thal'].cat.codes
df.head()

在这里插入图片描述
2.将数据加载到tf.data.Dataset

#要预测的目标，这是一个二分类问题
target=df.pop('target')
df.head()

在这里插入图片描述

target.head()

在这里插入图片描述

df.head().values

在这里插入图片描述

df.shape
target.head().values
#构建dataset,其实是把pandas数据转换成numpy数组进行转换的
dataset=tf.data.Dataset.from_tensor_slices((df.values,target.values))
for features,label in dataset.take(5):
    print('Features:{},Label:{}'.format(features,label))

在这里插入图片描述

#Shuffle and batch the dataset
train_dataset=dataset.shuffle(len(df)).batch(1)

3.创建并训练模型

model=tf.keras.Sequential([
    tf.keras.layers.Dense(10,input_shape=(df.shape[1],)),
    tf.keras.layers.Dense(10,activation='relu'),
    tf.keras.layers.Dense(1)
])
model.compile(optimizer='adam',
             loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
             metrics=['accuracy'])
 model.summary()

在这里插入图片描述