思影科技脑电机器学习数据处理业务

2020-05-12

为更好地帮助到想要利用脑电图技术开展科研的朋友们,拓展思影科技的业务范围,思影科技推出脑电机器学习数据处理业务,如感兴趣请联系杨晓飞siyingyxf18983979082(微信号)进行咨询,电话:18580429226.

 

一、数据质量检查和预处理

  数据质量检查包括:检查是否存在坏的导联、Marker信息是否完整、信号是否有过大的波动或漂移等。

  数据预处理包括:数据导入(格式转换)、定位电极、滤波、重参考、分段、手工去除伪迹(坏段、坏导联)、伪迹校正(基于ICA去眼电等)。

       注:预处理步骤可根据实际实验任务加以调整。

 

二、EEG基础指标计算

1)计算ERP波幅。对于事件相关的实验数据,通过叠加平均的方式,计算特定刺激诱发的ERP波幅。

2)计算功率谱。对于静息态实验数据,通过傅里叶变换,计算各波段(delta ~ gamma)的功率谱密度(PSD)。

3)计算时频特征。通过短时傅里叶变换(或小波变换),计算时频图(power)。

4)计算功能连通性(脑网络)。对于静息态实验数据,计算通道之间的功能连通性,所有通道之间的功能连通性可构成脑网络。功能连通性的计算方式可选:相干(Coherence)、相位锁定值(PLV)等。


三、   特征构建与特征筛选3.1 特征构建

1.ERP特征。计算感兴趣通道的ERP幅值后,每个时间点的ERP幅值可以作为一个特征。

2. 功率谱特征。计算各区域(或各通道)在每个波段(delta ~ gamma)的功率谱。单一区域(或通道)的某波段的平均绝对/相对功率谱密度(PSD/rPSD),可以作为一个特征。区域的分辨率可调节(如按照10-510-20系统选择通道)。


图示.各组别各波段的功率谱密度分布。

  3.信息论特征。计算各区域(或各通道)的排列熵,Kolmogorov复杂度等指标,每个区域(或通道)的信息论指标可以作为一个特征。    

4.地形图特征。计算时域或频域幅值的地形图,使用地形图或其衍生指标(如GFPGlobal Field Power)作为特征。   

   5.脑网络。将每个通道视为一个节点,节点之间的联系(功能连通性)视为一条连边,每条连边即为一个特征。


图示. 频谱、信息论、功能连通性等多种特征的组合。

  6.RQA特征。对于各通道的静息态数据,基于相位空间构建递归图,进行递归量化分析(Recurrence quantification analysis),提取递归率(RR)、决定论(DET)、熵(ENTR)、分层性(LAM)等作为特征。 

3.2 特征筛选    

1.相关法。计算每个特征与量表的相关性(如皮尔逊相关),保留相关值高的特征。    

2.参数检验法。对不同组别人群的特征做假设检验(比如对两组人群的特征做双样本T检验),保留通过假设检验的特征。    

3.主成分分析(PCA)法。将所有特征分解成一系列主成分,保留排名靠前的主成分作为特征。   

4.递归特征消除法。循序渐进地删除影响最小的特征,直至保留特定数目的最重要的特征为止。注:我们可以提供的特征构建、特征筛选方法包括但不限于上述描述,您可以选择其中一种或多种进行组合。
三、机器学习模型    

1.K近邻k-Nearest NeighborKNN)。K近邻是一个比较基础的分类算法,该算法计算测试样本与已知样本之间的距离,并将测试样本判定为与其距离最近的类别。   

2.决策树Decision Tree)。该模型选用一些特征作为决策变量,基于特定的阈值形成决策分支,最终形成树状的决策链条。    

3.支持向量机SVM)。在许多情况下,支持向量机都是二分类模型的首选。通过使用核函数,即使基于线性不可分的数据,也可获得较好的分类精度。引入投票机制后,亦可将该模型应用于多分类场景。

图示.使用SVM进行训练的过程。

 4.集成学习。当单一的分类器性能不良时,可以考虑集成多个弱分类器,形成一个强分类器。可选的集成学习模型有随机森林等。

图示.随机森林分类过程。

 

  5回归模型。回归模型主要用于预测连续变量(如量表得分)。可选的回归模型有线性回归(GLM)、多项式回归等,也包含其变种,如LASSO回归、岭回归、Elastic Net等。   

6.神经网络。当没有良好的手工选择的特征时,可以考虑选用深度神经网络(主要基于CNN来实现)模型。该模型可以自动从原始数据中提取特征,用于后续的预测任务。

图示.一种卷积神经网络架构。

 

7.聚类。当数据没有标签时,可以选择无监督学习算法,如K-means聚类。

 注:思影可以提供的机器学习模型包括但不限于以上内容。其他模型如朴素贝叶斯(Naive Bayes)、线性判别分析(LDA)、主成分分析(PCA)、或上述模型的变种,亦可根据需求实现。您可以选择其中的一种或多种进行尝试。

 

一、结果汇报&可视化 

    结果汇报内容包括:

   1)对于分类模型,可汇报敏感性、特异性、总精度、曲线下面积等精度指标;

   2)对于回归模型,可以汇报相关值、MSEMAE等精度指标;

   3)置换检验的结果,如p值。


图示.精度结果可视化案例。

图示.ROC曲线可视化。

结果可视化内容包括:   

1)对于分类模型,可绘制ROC曲线图;   

2)对于回归模型,可绘制相关图;   

3)对于模型训练过程中发现的贡献较大的特征,可绘制曲线图、矩阵图、圈状图、地形图等。

图示.频谱特征结果可视化案例。

五、定制化服务

图示.工程师在讨论。 

  1.分析方法可定制。思影科技可根据您提供的模板文献,基于您的实验数据,实现文献中使用的数据分析方法。此外,未列出的分析方法,只要在思影科技的能力范围内,尽力实现您的想法。

  2.分析代码可定制。在没有现有的软件适用于您的数据分析需求时,思影科技会与您协商,通过编写代码实现您的想法,并提供代码的完整实现。

  3.可视化方案可定制。如果您有特殊的可视化方案要求,也可与我们协商实现。

客户与思影确定合作意向以后,思影会指定专门的工程师全程与客户对接项目着手该项目数据处理,思影额外还将指派另一名工程师对项目全程进行检查,审核,把关,确保数据处理质量,思影将全程对客户数据保密。



微信扫码或者长按选择识别关注思影



如对思影课程感兴趣也可微信号siyingyxf或18983979082咨询。觉得有帮助,给个转发,或许身边的朋友正需要。请直接点击下文文字即可浏览思影科技其他课程及数据处理服务,欢迎报名与咨询,目前全部课程均开放报名,报名后我们会第一时间联系,并保留名额。


更新通知:第二十八届磁共振脑影像基础班(重庆,已确定)



更新通知:第十届脑影像机器学习班(已确定)


更新通知:第十二届磁共振弥散张量成像数据处理班(已确定)



第六届任务态fMRI专题班(预报名,南京)






眼动数据处理班(预报名)

数据处理业务介绍:



招聘及产品: