Translational Psychiatry
将PTSD症状映射到脑网络:一项机器学习的研究
本文的第一作者是
Jennifer Barredo,通讯作者是
Amin Zandvakili,解读者为
季善玲。本文于2020年6月18日发表在
Translational Psychiatry期刊上,影响因子为
6.222。本文主要利用机器学习的方法,选取了100个位于默认网络、突显网络、执行网络和情感网络等PTSD相关的脑功能网络的感兴趣区(ROIs)用于功能连接分析,进而探究数据驱动-连接模式与个体化创伤后应激障碍(PTSD)症状之间的新关系,并依此建立个体化水平-脑功能连接模式来表征PTSD的不同症状,以期为医务人员提供个体化治疗PTSD的科学的途径和方法。
欢迎参加我们的文献解读团队,每篇解读的文章我们均会支付一定的稿酬。
点击此处可查看招募链接
摘要
创伤后应激障碍(PTSD)是一种普遍的、使人致病的精神障碍,具体表现形式复杂多变。虽然不同的PTSD症状之间(闯入、回避、认知/情绪、唤醒/反应)具有高度相关性,但这些症状的重要性往往因患者而异。在这项研究中,我们使用机器学习的算法来探究不同PTSD症状患者的大脑功能连接是否存在差异。我们采集了PTSD患者(N = 50)的静息状态磁共振成像,并使用第五版《精神障碍诊断与统计手册》(DSM-5)中创伤后应激障碍检查表(PCL-5)评估患者的PTSD症状。我们比较了100个属于默认网络、突显网络、执行网络和情感网络下的皮质和皮质下脑区之间的连接,并使用主成分分析和最小角度回归(LARS)来探究PTSD症状严重程度和脑网络之间的关系。我们发现脑区间的连通性可以预测患者的PTSD症状。PCL-5总分的拟合优度(R
2)为0.29,闯入、回避、认知/情绪和唤醒/反应症状的R
2分别为0.33、0.23、-0.01和0.06。该模型在预测PCL-5总分(p = 0.030)以及闯入和回避得分(p = 0.002和p = 0.034)方面的性能显著优于随机评分。该模型不能预测认知和唤醒得分(p = 0.412和p = 0.164)。虽然这项研究的结果有待重复验证,但这些结果表明,不同的PTSD症状与神经网络连接模式是存在联系的。该研究为PTSD的数据驱动-诊断评估和使用计算方法识别个体化-脑网络病理探索迈出了重要的一步,为个体化治疗的发展提供了科学依据。
引言
创伤后应激障碍(PTSD)是一种高度流行的慢性精神疾病,其特征是暴露创伤事件之后出现的闯入性想法/回忆,回避相关刺激,过度兴奋,异常情绪和认知障碍。在美国,PTSD的终生患病率约为7%,这一概率在退伍军人中更高。目前的循证治疗(包括精神药理学和心理疗法)的疗效往往十分有限。除了症状本身造成的痛苦,PTSD还与患者的功能不良、残疾、常见疾病及较差的生活质量有关。
尽管PTSD给患者带来的影响已被大量证实,但其症状表现形式却各不相同。由于PTSD与其他精神疾病高度共病,且不同的患者可能有不同的症状,使得诊断通常变得十分困难。不同的诊断和疾病分类模型均在努力去识别PTSD症状——尤其是第五版《精神障碍诊断与统计手册》(DSM-5)标准。该标准将症状分为四个症状群:闯入(标准B);回避(标准C);认知和情绪(标准D);唤醒和反应性(标准E)。该症状分组是基于在观察性研究中它们频繁共现,或通过数据驱动的方法(如因素分析)来确定的。找到生物标记物可以帮助临床诊断并减少在临床实践过程中可能发生的偏差和不确定性。由于PTSD表现的多样性和异质性,即临床症状中存在不同的生物亚型,为PTSD寻找一个统一的生物标志物显得比较困难。
在科学研究中,一种发现PTSD客观标记物的新方法是通过使用功能性神经成像的神经环路来探究与症状相关性生物标记物。人类大脑由不同的神经网络组成,且最近的研究发现PTSD患者在这些网络中存在着多种异常变化。例如,PTSD患者表现为额顶网络(FPN)连接降低、突显网络(SN)连接增加和默认网络(DMN)连接中断。在fMRI研究中,通常使用对创伤事件的暴露与想象的方法探究PTSD症状群与脑网络之间的联系。其他影像学研究则使用拓扑学方法来描述PTSD对神经网络的影响。最近的研究表明,机器学习方法可以用于预测和识别PTSD的风险人群。这一研究领域已经极大地推动了精神病和药物滥用的研究。机器学习目前可以基于大脑的病理学和个性化的治疗法来识别患者。
目前,关于神经成像和机器学习相结合的方法是否能建立起PTSD的病理神经环路(在本文中指脑区之间的连接)和个体化的症状之间的联系尚不清楚,但这是表征PTSD异质性的神经基础重要一步。如果成功,PTSD症状的潜在客观标记物可能成为未来基于脑环路进行个性化干预的靶点。虽然颅磁刺激可以减少PTSD症状,但某些症状比较严重的患者对该疗法的反应并不理想。因此,为了治疗效果最大化,研究者很有必要确定新的靶点或环路。在本研究中,
我们应用了一种机器学习方法来识别与自我报告的PTSD症状相关的脑功能网络,并初步假设我们的模型能够识别出基于数据驱动-连接模式与个体化PTSD症状之间的新关系。
患者与方法
概况
获得患者的知情同意书后,50个PTSD患者于布朗大学进行了rs-fMRI扫描(3T)。该研究经过了普罗维登斯退伍军人医院中心和巴特勒医院机构审查委员会的批准,并在两个地点使用相同的审核流程。本研究所使用的数据是之前研究中的预处理数据(即基线)。
核磁共振数据的采集和预处理
结构和功能MRI数据由布朗大学MRI收集,使用的机器为西门子3T核磁共振扫描仪(德国Erlangen):TimTrio(n=13)或 Prisma (n=37) 扫描方式,使用32通道头线圈。为每个患者收集结构T1加权图像:(TR = 1900 ms,TE = 2.98 ms,FOV = 2562 mm,160 层,体素大小 = 1.0 mm isotropic)。在每次结构扫描之后,使用T2加权回声平面成像(EPI)序列采集基于血氧水平依赖的功能MRI(TR = 2500ms,TE = 28ms,FOV = 1922 mm,42 层,体素大小 = 3.0 mm isotropic,192个时间点)。在扫描采集过程中,患者被要求注视黑色前景上的白色十字符号,同时尽可能保持静止。
使用CONN Toolbox 预处理静息态fMRI数据。标准的fMRI预处理步骤包括:时间层校正,头动校正,将图像配准到标准空间—MNI空间。结构MRI数据进行组织分割和标准化到MNI空间。fMRI预处理包括回归以下协变量:1)使用CompCor方法回归来自于脑脊液和白质的非神经元信号;2)使用CONN中的Artifact Detection Toolbox识别出较大运动(translational>0.5,rotational>.005)或者具有较高的全脑信号方差(>3 SD)的时间点;3)6 列头动参数及其对应的时间导数。最后,将数据进行带通滤波(0.008 - 0.1 Hz)。
患者与评估
在本研究中,PTSD患者(N = 50)年龄为48.84±11.78岁,其中38% (N = 13)为女性。所有患者均符合DSM-5中的PTSD诊断标准。患者使用PCL-5(PTSD Checklist for DSM-5)自评PTSD的症状。PCL-5有20个问题,得分在0-80之间,评估PTSD的严重程度。此外,PCL-5得分可分为四个分量表,对应于上述四个PTSD症状。由于PTSD与抑郁症有较高的共病性,大多数患者也有重度抑郁症,并且绝大多数患者正在接受药物治疗。我们尽可能地使所有患者都接受了至少6周的治疗(如药物和心理治疗)后再进行磁共振成像扫描。
纳入/排除标准
患者年龄为18-75岁的成年人,符合DSM-IV或DMS-5标准创伤后应激障碍;并通过与具有PTSD诊断经验的精神科医生的面谈得到确诊。额外的纳入标准有:在纳入研究前6周内服用稳定剂量的精神药物,能够独立阅读和理解研究中的评估手段和说明。
排除标准有:处于怀孕、哺乳期或在未来三个月内计划怀孕、无法接受磁共振成像(MRI)检查;有严重脑损伤史(即损伤导致意识丧失超过10分钟或有证据证明由此造成脑损伤);当前或过去严重的神经系统疾病(如癫痫发作、中枢神经系统原发性或继发性肿瘤、中风、脑动脉瘤);目前患有双相I型障碍、酒精和/或物质依赖障碍;强烈的自杀意图或计划。患者的基本信息见补充表1。
补充表1 被试的人口学信息
感兴趣区(ROI)的选择
我们选择了100个包括皮层脑区和皮层下脑区的感兴趣区(ROI)用于功能连接分析。基于先前的研究结果,这些ROIs位于PTSD相关的脑功能网络中(表1;补充图1):默认网络(DMN)、突显网络(SN)、执行网络(FPN)和情感网络(AN)。ROIs使用Human Connectome Project Multimodal Atlas; 杏仁核和海马ROIs使用 probabilistic atlas of Mazziotta,而纹状体ROI来自Choi等人的7个网络功能分区。ROI的选择降低了特征的数量,使得计算易于处理。
表1 纳入研究的感兴趣区(ROI)
补充图1 研究中纳入的感兴趣脑区
个体水平的ROI-to-ROI功能连接分析
我们从每个患者的预处理后的fMRI数据中提取每个ROI的时间序列,并计算其功能连接,得到了4950个皮尔逊相关系数r。之后,我们使用r的绝对值作为功能连接的度量。
机器学习
首先采用主成分分析法对功能连接矩阵进行降维。我们选择了在功能连接矩阵中的第一个主成分(累积代表90%变异性),将连接矩阵的4950个维度压缩到39个(前39成分占据了90%变异性,补充图 2)。然后我们在这个降维数据集上使用最小角回归(LARS)来预测每一个维度PCL-5分量表:标准(B)闯入;(C)回避;(D)认知/情绪;(E)唤醒/反应。当预测变量的数量很大时,LARS算法为有效预测响应变量提供了一个简约的回归模型。我们利用完全迭代留一交叉验证来评估模型的性能,并计算决定系数(R
2)测试回归模型预测症状的能力,使用的公式如下:

其中SS
res为残差平方和,SS
tot为总平方和。注意,以这种方式计算的R
2可以允许存在负值(当交叉验证数据的拟合优度小于零斜率拟合时,即回归的零假设)。
补充图2 不同的功能连接成分所代表的变异比例
为了评估模型预测结果的显著性,并确保所得出的结果并非过拟合,我们重新在一个随机排列的数据集上进行了相同的分析。为此,我们打乱了PCL-5值(重新采样,不进行替换),打乱了PCL-5和fMRI数据之间的关系,并重新运行分析。这个过程重复了5000次迭代,从而评估了模型预测噪声的能力。
最后,我们将回归权重(即beta系数)从主成分分析空间映射回ROI-ROI功能连接空间,以确定涉及的ROI-ROI之间的连接。在这里,我们使用了Haufe等人提出的将解码参数转换为编码参数的方法,使权重系数具有可解释性。为了作图方便,我们将其中的前1%最强的权值(50个连接)呈现在连接体图中。
本研究的分析代码是用Python 3.7.1编写的,使用scikit-learn 0.20.1机器学习库。连接组图使用Circos 0.69-640 软件生成。
结果
症状评分
患者人群的PCL-5评分的中位数在中等范围内(中位= PCL-5 46.5; 95%置信区间为24 - 71)。如预期所料,PCL-5各子量表之间具有高度且显著的相关性(表2,皮尔逊相关系数r,范围在0.38到0.51之间)。
表2 PCL-5 子量表之间的相关性
机器学习结果
机器学习算法利用特征选择和LARS回归能够预测PCL-5总得分以及闯入和回避分量表的得分(通过决定系数R
2量化)。PCL-5总分的R
2值为0.29。闯入、回避、认知和唤醒的R
2分别为0.33、0.23、−0.01和0.06。该模型在预测PCL-5总分(p = 0.030)以及闯入和回避分量表(p = 0.002和p = 0.034)方面的表现显著优于随机预测。该模型不能预测认知和唤醒分量表的得分(p = 0.412和p = 0.164,见图1)。该模型对PCL-5总分的预测性能如图2所示。
图1. 模型预测性能
图2. 自评与预测的PTSD症状严重程度(PCL-5总分)
脑功能连接预测PTSD症状
对于PCL-5总分、闯入和回避症状,我们绘制了50个(总4950个)具有
最高预测权重的连接(图 3)。
图3. 与PTSD严重程度相关的功能连接
在PCL-5总分和闯入得分均较高的患者中,我们观察到了右侧前扣带吻侧 (Human connectome atlas region a24;DMN)与左边是眶部(Human connectome region 47l;FPN)之间正连接增强,以及DMN - AN功能连接减弱。DMN内较低的正连接可能是闯入和回避症状的一个特征。在闯入和回避得分较高的患者中,DMN、SN和FPN之间的跨网络连接出现中断。
本研究结果表示,有
两个主要特征区分了闯入和回避特征:DMN内部连接较弱与更严重的闯入症状相关,而FPN内部连接较强则与更严重的回避症状相关。SN - FPN低连接也是高回避患者的特征。FPN - DMN连接中断是闯入和回避的一个特征。
讨论
在这项研究中,我们采用了一种新的两步机器学习算法,能够从静息状态的功能连接预测个体水平的自我报告的PTSD症状。我们的结果将不同PTSD症状的严重程度与脑功能网络模式建立了联系。这是确定PTSD生物学诊断标准的重要的第一步。目前,有一个迫切需要解决的问题是PTSD症状的异质性对临床诊断带来的挑战。我们的算法采用了一种有监督学习的方法,建立在先前的临床观察之上,能够在中等规模的数据集中识别有临床意义的生物模式。
随着科学技术的进步,研究者可以收集到更复杂、更大的神经生物学数据集。在心理健康研究中使用数据科学技术进行高维数据分析已得到普及。这些研究主要使用“无监督”机器学习方法在没有外部/临床检验员反馈的情况下在复杂数据中找到模式。不幸的是,数据复杂性会对统计和机器学习工具的性能产生负面影响,而这一点通常通过使用大量被试来解决。尽管无监督技术可能是强大的,但样本量的要求和相关的成本限制了它们在临床人群中的可行性。
在设计机器学习算法时,我们试图平衡分析高维、复杂数据集的挑战和临床研究的实际考虑。我们采用了以前在视觉处理和人脸识别研究中使用的方法。视觉图像数据由许多像素组成,因此是高维的。为了提高模型性能,视觉处理的机器学习研究经常在模型训练前采用降维变换(例如,PCA)。类似地,在正则化回归之前,我们将PCA应用于连接值的ROI矩阵,使我们能够在大多数临床研究的典型数据集中利用机器学习的力量。除此之外,我们还限制了分析中包含的ROI的数量。我们从可能的376个ROI中选出100个。这样做,我们就偏离了纯粹的“数据驱动”方法,但这却大大减少了我们的特征数量(14折,4950 vs. 70500),并使我们的样本量分析和计算上易于处理。
我们的分析结果表明,不同的症状类别映射到不同的皮层网络。该模型成功地预测了PTSD的总体症状严重程度、闯入和回避症状,并与功能连接的独特变化相关联。腹外侧PFC的DMN脑区和眶额皮质的情感脑区之间的功能连接降低与这三个评分均存在相关性。闯入症状和回避性症状被DMN内部弱连接和FPN内部强连接所区分。尽管这些结果有待重复,考虑到DMN与自我反思和反刍的关联性以及FPN在认知控制中的作用,这些网络和症状之间的表面效度(face validity)为研究者提供了丰富的信息。虽然较强的认知控制可能在精神障碍中看起来有点矛盾之处,但是PTSD的回避症状可能代表一种适应不良的控制策略。这与其他领域的研究一致,表明
不适当的认知控制是抑郁症和PTSD患者自杀的潜在危险因素。
虽然本研究结果为使用基于生物学的数据驱动的诊断方法提供了初步支持,但我们承认该模型对唤醒和认知/情绪症状的预测是不成功的。较低的预测性能可能是算法为了优化某些症状的检测而牺牲其他症状而造成的假象,也可能是由于我们的样本量不大,也可能是由于我们的样本中症状出现的差异造成的。患者同时患有抑郁障碍也会复杂化PTSD特有的症状分类,但却反映了真实世界的患者症状概况。另一种解释是,认知/情绪和觉醒症状可能是广泛分布的大脑功能异常导致的,而不是少数离散的脑网络的变化所导致的。例如,如果SN(与PTSD 超警惕性相关)的紊乱是一个PTSD的核心特征,那么病理性的威胁监测可能会引起初级感觉和联合控制网络的变化,同时也阻碍了对唤醒症状的特异性生物特征的识别。将来的研究需要在更大的样本中进行进一步的探索。
这项研究的主要局限性为非大样本量、横断面设计和缺乏健康对照的二次神经成像分析。由于样本量的原因,这里给出的结果可能反映了过拟合,在这种情况下,算法学习的是数据中的趋势,而这些趋势是不能推广到其他样本的。我们试图通过使用少量先验定义的ROI来缓解这个问题,并实现一个包含
降维、正则化(限制模型复杂性)、交叉验证和置换检验的数据处理流程。我们的样本也是独一无二的,因为他们大部分都被纳入了脑刺激治疗研究,因此可能不能代表一般的PTSD患者,而且几乎所有(86%)患者同时接受药物治疗。此外,我们的研究并没有跟踪患者从健康状态到PTSD的转变,因此,所呈现的结果可能与PTSD症状的易感性有关,而不是症状本身。尽管如此,这项研究还是开创了一个先例,并引入了一种可以进一步探索的方法。
总之,我们成功地建立了个体化水平-脑功能连接模式来表征PTSD的不同症状。如果这些结果可以被重复验证,我们的方法可以为基于个性化-客观的大脑特征与自我报告PTSD的症状之间的关系提供重要的信息。这项工作的扩展可能会对这种疾病的临床异质性产生新的见解,并可能有助于医务人员针对某一PTSD症状的减少进行个体化干预。
如果您对本篇文章感兴趣,想获取原文的话,可以添加微信:13362142709进行获取,另外,如果您对fMRI的其他课程感兴趣,请点击以下链接了解。
第04期:大标度网络静态与动态连接模式的识别与应用-基础训练营(2021.12.08-2021.12.12)
第05期:多角度解析静息态脑瞬态活动-基础训练营(2021.12.15-2021.12.19)
第06期:基于图论的拓扑指标及其形态学分析-基础训练营(2021.12.22-2021.12.26)
第07期:DTI数据分析-基础训练营(2021.12.29-2022.01.02)
第08期:基于脑影像数据的元分析技术-基础训练营(2022.01.05-2022.01.09)
第09期:任务态激活与心理生理交互效应-基础训练营(2022.01.12-2022.01.16)
第10期:静息态fMRI功能连接、局部指标计算与写作思路训练营(2022.01.19-2022.01.23)