基于深度学习的脑电图识别 综述篇(二)数据采样及处理
更多技术干货第一时间送达











使用随机高斯噪声,在 SEED 和 MAHNOB-HCI 数据集上,LeNet 和 ResNet 的准确率都有了很大的提升;其最佳精度为使用 0.2 的标准偏差,并通将数据增加到原始大小的30倍;
利用条件深卷积生成对抗网((cDCGAN)在 BCI 图像数据集上生成人工脑电图信号,可以发现数据扩充有助于将运动图像分类的准确率从 83% 提高到 86% 左右;
通过在 CAPSLPDB 数据集上生成原始脑电图数据的傅里叶变换(FT)来明确针对代表性不足的睡眠阶段的类不平衡问题;
其他的论文中采用的数据扩充方法有:
向 2D 的特征图中增加随机噪声;
使用眨眼、肌肉活动以及高斯白噪声等伪影被用来增强数据并提高鲁棒性;
向输入的特征向量中加入高斯噪声;
使用重叠窗口,即通过生成更多的具有较小移位的训练样本,性能有了显著提高;
cropped training,即不规则训练,保证每个窗口只训练一次;
加大共享信息窗口分类不一致时的惩罚项;
交换左右电极;
复制样本并只保留一种模态的值,同时将另一种模态的值设置为0,反之亦然;
利用在预处理阶段向下采样脑电图时经常丢弃的数据,即在下采样参数为 N NN 时允许数据扩充 N NN 倍;
为每个类别单独训练 GAN 生成新数据;
统计数据如下(N/M 是在研究中未提及):

预处理:
通常的预处理方式有:下采样、带通滤波和滑窗;
有的研究提出,需要对脑电图试验进行修剪,将数据采样到 512 Hz 和 64 个电极,识别噪声通道,计算平均参考线,去除线噪声,并对从 1 Hz 开始的数据进行高通滤波;
有的关于睡眠的研究则下采样到 256 Hz 并移除噪声通道,从 2 Hz 开始进行滤波;
人工处理:
人工处理用于移除特定的噪声,比如眼部和肌肉的伪影,从而学习的负担从潜在的噪声信号转移到神经网络上;
有些研究采用了基于人类知识的方法,如振幅阈值化、人工识别高方差段、基于高振幅 EOG 段处理与眨眼相关的噪声等;
许多其他文章支持不太依赖人工干预的技术,比如盲源分离技术,例如,ICA(独立成分分析)被用来从脑电图数据中分离眼部成分;
为了研究在使用深度神经网络时去除脑电伪迹的必要性,本文将选取的论文分为三类,特征工程是传统脑电信号处理管道中要求最严格的步骤之一46% 的论文没有使用伪迹处理方法,24% 的论文使用了这种方法,31% 的研究没有提及是否需要人工处理来达到他们的结果;
特征工程是传统脑电信号处理系统中要求最严格的步骤之一;
虽然一些研究表明,使用深度信念网络(DBNs)可以接受原始数据输入,但是也有相当比例的评论论文使用人工设计的特征作为其深度神经网络的输入;
例如,可以使用通过快速傅里叶变换(STFT)获得的脑电图的时频域表示来检测二进制用户偏好(喜欢与不喜欢);也有研究使用 STFT 作为二维 EEG 表示,用于在 CNN 中使用癫痫 预测;
脑电图学界广泛采用的特征是约1 Hz~40 Hz的经典频带的功率谱密度(PSD);
还有一些研究采用了多种特征的组合,如使用PSD特征,以及熵、峰度、分形分量等作为提出的 CNN 输入,用于缺血性脑卒中检测;
尽管如此,仍有 49% 研究使用了 EEG 的原始数据作为输入;
作者博客
https://blog.csdn.net/weixin_44936889/article/details/104686542
