异常检测与生产就绪的入侵检测系统
异常检测
异常检测是许多应用中常见的问题。传统的浅层机器学习算法解决异常检测问题时,特征生成通常是手动任务,即特征工程。而深度学习的优势在于能够以无监督的方式自动学习智能的数据表示,这有助于检测模型发现异常。下面我们通过心电图脉冲检测的例子,详细介绍如何使用自编码器进行异常检测。
心电图脉冲检测
数据加载与准备
我们使用 H2O 提供的心电图时间序列数据,该数据包含 20 个正常心跳的心电图时间序列和 3 个异常心跳的心电图时间序列,每个样本有 210 列按顺序排列的值。以下是加载数据并划分训练集和测试集的代码:
import h2o
h2o.init()
ecg_data = h2o.import_file("http://h2o-public-test-data.s3.amazonaws.com/smalldata/anomaly/ecg_discord_test.csv")
train_ecg = ecg_data[:20, :]
test_ecg = ecg_data[:23, :]
数据可视化
我们定义一个函数来堆叠和绘制时间序列:
import pandas as pd
import matplotlib.pyplot as plt
def plot_stacked_time_series(df, title):
stacked = df.stack()
stack
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



