SenseGen: A Deep Learning Architecture for Synthetic Sensor Data Generation论文解读

SenseGen采用生成对抗网络思想,由UCLA团队提出,旨在生成逼真传感器数据,保护用户隐私,维持数据分析质量。该模型由LSTM、全连接层和MDN构成,单独训练生成与判别网络,用于合成保持真实分布特性的传感器数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、论文概述

SenseGen这篇论文是17年发表在PerCom Workshops上的一篇论文,来自加州大学洛杉矶分校(University of California at Los Aneles,UCLA)网络与嵌入式系统实验室(Netoworked & Embedded Systems Laboratory,NESL),最早作者是放在arXiv上。SenseGen借鉴生成对抗网络的思想训练生成器,进而生成逼真的传感器数据,但是由于生成器最顶层采用了通过高斯混合模型(Gaussian Mixture Model,GMM)构建的混合密度网络(Mixture Density Network,MDN),不能把判别网络的误差反向传播给生成网络,所以只能单独训练生成网络和判别网络。因此,SenseGen本质上只是单一的训练一个生成模型来合成逼真的传感器数据,并不是传统意义上的生成对抗网络模型。

整体而言,细究本文存在很多的细节性描述漏洞和不足,但在生成对抗网络广泛应用于图像、视频、文本的研究背景下,SenseGen在一定程度上可以说是初步开启了探索生成对抗网络思想在传感器数据合成方面的研究。

 

二、研究背景

考虑到大数据分析的背景下的用户隐私问题,通过SenseGen生成模型来合成逼真的传感器数据用来替代用户的真实数据,合成的传感器数据能够在保护用户隐私的同时维持与真实数据相同的统计特性,进而保证数据分析的可用性质量。

众所周知,评价合成传感器数据的生成模型的性能是比较困难的,主要原因有:(1)很难找到一种评价传感器数据生成效果、逼真度好坏的标准;(2)同时,还必须要避免生成模型对原始传感器数据的过拟合,避免其输出对原始传感器数据的简单记忆

 

三、方法

SenseGen的目的就是训练一个能够生成逼真且保持真实分布特性的生成网络

(一)生成网络

3层LSTM + 2层全连接神经网络 + 1层MDN构建的,

核心在于最后一层混合密度网络(Mixture Density Network,MDN),是高斯混合分布于神经网络的结合。

最后一个全连接神经网络的72维输出被平均分为三个部分,每个部分的维度为24,

1~24:每个高斯分布在混合分布中的权重\pi,即24个高斯模型组成的混合分布

25~48:每个高斯分布的参数\mu

49~72:每个高斯分布的参数\sigma

输出结果的概率分布表示为:pr(x_{x+1}|\pi_{t},\mu_{t},\sigma_{t})=\sum_{k=1}^{24}\pi_{t}^{k}(x_{1...t})*\mathcal{N}(x_{x+1};\mu_{t}^{k}(x_{1...t},\sigma_{t}^{k}(x_{1...t})))

预测值:x_{x+1}\sim pr(x_{x+1}|\pi_{t}(x_{1...t}),\mu_{t}(x_{1...t}),\sigma_{t}(x_{1...t}))

生成网络的训练优化策略为:RMSProp

成本函数(cost function):\mathcal{F}^{\mathcal{G}}(\theta_{\mathcal{G}})=-\sum_{t=1}}^{T}\log{(pr(x_{x+1}|\pi_{t}(x_{1...t}),\mu_{t}(x_{1...t}),\sigma_{t}(x_{1...t})))}

(二)判别网络

为了能够评估生成的传感器数据与真实传感器数据之间的相似度,构建了一个判别网络来区分生成数据和真实数据

1层LSTM + 1层全连接网络构建,如上图所示

分别含有64个和16个单元

激活函数:sigmoid

输出值代表输入数据来自真实数据的概率:D(x_{test})=Pr(x_{test}\in \mathcal{X}_{true}),即真实输入数据的输出结果目标为1,合成输入数据的输出结果目标为0。

每个mini-batch有m个样本,每个样本包含400个采样点

判别网络的训练目标为交叉熵损失:\mathcal{L}^{D}(\theta_{\mathcal{D}})=-\left(\sum_{i=1}^{m}\log{\mathcal{D}(\mathcal{X}_{true}^{(i)})}+\log(1-\mathcal{D}(\mathcal{X}_{gen}^{(i)}))\right)

 

四、实验及效果

训练阶段生成网络负对数似然损失的(Negative Log likelihood cost,NLL )

判别网络鉴别真假数据的精度效果图:

真实加速数据与SenseGen生成的加速度数据效果对比图:

五、总结

SenseGen借鉴生成对抗网络的思想来训练生成网络合成逼真的传感器数据,但是并不是真正利用生成对抗网络的思想,(1)生成网络和判别网络单独训练,生成网络的训练并不依赖于判别网络的误差反向传播;(2)生成网络直接学习原始传感器数据,而不是学习随机噪声分布到真实数据分布之间的映射关系。而且SenseGen文中很多描述与公开的源代码之间对应不起来,细究论文一些内容也存在很多漏洞,但整体的思想还是可以借鉴用于传感器数据生成研究中。

 

 

 

 

内容概要:《2024年中国城市低空经济发展指数报告》由36氪研究院发布,指出低空经济作为新质生产力的代表,已成为中国经济新的增长点。报告从发展环境、资金投入、创新能力、基础支撑和发展成效五个维度构建了综合指数评价体系,评估了全国重点城市的低空经济发展状况。北京和深圳在总指数中名列前茅,分别以91.26和84.53的得分领先,展现出强大的资金投入、创新能力和基础支撑。低空经济主要涉及无人机、eVTOL(电动垂直起降飞行器)和直升机等产品,广泛应用于农业、物流、交通、应急救援等领域。政策支持、市场需求和技术进步共同推动了低空经济的快速发展,预计到2026年市场规模将突破万亿元。 适用人群:对低空经济发展感兴趣的政策制定者、投资者、企业和研究人员。 使用场景及目标:①了解低空经济的定义、分类和发展驱动力;②掌握低空经济的主要应用场景和市场规模预测;③评估各城市在低空经济发展中的表现和潜力;④为政策制定、投资决策和企业发展提供参考依据。 其他说明:报告强调了政策监管、产业生态建设和区域融合错位的重要性,提出了加强法律法规建设、人才储备和基础设施建设等建议。低空经济正加速向网络化、智能化、规模化和集聚化方向发展,各地应找准自身比较优势,实现差异化发展。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值