2020年02月10日发布 | 1642阅读

新分级量表(Lawton-Young分级系统)在预测脑动静脉畸形结局中的应用丨《Neurosurgery》(中文版)脑血管病分册

彭雍

湘雅二医院

蒋宇钢

中南大学湘雅二医院

今天为大家带来的是选自《Neurosurgery》中文版脑血管病分册并由彭雍编译,宇钢教授审校的:新分级量表(Lawton-Young分级系统)在预测脑动静脉畸形结局中的应用,欢迎阅读、分享。



原文:

The Application of the Novel Grading Scale (Lawton-Young Grading System) to Predict the Outcome of Brain Arteriovenous Malformation


点击此处,即可查看原文


原文作者:

Ahmad Hafez, MD∗ Päivi Koroknay-Pál, MD, PhD∗ Elias Oulasvirta, BM∗ Ahmed Abou Elseoud, MD, PhD Michael T. Lawton, MD§ Mika Niemelä, MD, PhD∗ Aki Laakso, MD, PhD∗ 


作者单位:

∗ Department of Neurosurgery, Helsinki University Hospital, Helsinki, Finland; 

‡ Department of Diagnostic Radiology, Helsinki University Hospital, Helsinki, Finland;

 § Department of Neurosurgery, Barrow Neurological Institute, Phoenix, Arizona


编译:

彭雍


审校:

蒋宇钢


1



景:

作为 SM(Spetzler-Martin,SM)系统的改进版,2010 年提出了补充分级量表[Spetzler-Martin 补充分级(Supplemented Spetzler-Martin grade,Supp-SM)],致力于提高脑动静脉畸形(arteriovenous malformations,AVMs)的术前风险预测能力。


目的:

确定 Supp-SM 分级量表预测手术结局的能力。


方法:

回顾性研究在 2000 年至 2014 年间于赫尔辛基大学医院就诊的 200 例患者。采用受试者工作特征曲线下面积(area under the receiver operating characteristic,AUROC),对术前、术后早期(3~4 个月)以及术后研究终点的改良Rankin 量表(Modified Rankin Scale, mRS)的评分进行分析,比较 Supp-SM 与 SM 评级系统的有效性。


结果:

在早期随访(3~4 个月)中,Supp-SM 的效能优于 SM 分级量表:SM 的 AUROC = 0.57[95%  置信区间(Confidence interval,CI):0.49~0.65];Supp-SM  的 AUROC = 0.67(95% CI:0.60~0.75)。Supp-SM  的效能在晚期随访中持续优于 SM:SM  的 AUROC = 0.63(95% CI:0.55~0.71);Supp-SM  的 AUROC = 0.70(95% CI:0.62~0.77)。穿支动脉供血未包含于两个分级系统中,但对早期随访结局(P = 0.008;比值比:2.95;95% CI:1.32~6.55)和晚期随访结局(P < 0.001;比值比:5.89;95% CI:2.49~13.91)都有重要影响。


结论:

Supp-SM 分级系统可提高治疗结局的预测准确性并可成为 SMS 的替代系统,还可应用于高级别AVMs 占比较高的病例组中。然而,穿支动脉对治疗结局有重要影响。


长期以来,Spetzler-Martin 分级量表(Spetzler-Martin grading scale,SMS) 被用于预测脑动静脉畸形(arteriovenous malformation,AVM)患者的手术结局[1] 。基于病变大小(小:0~3 cm;中:3~6 cm;大:> 6 cm)、深部静脉引流以及位于功能区, SMS 将 AVMs 分为 5 级。SMS 对于预测手术结局确实非常有效,但自身仍存在一些局限, 并且未考虑其他潜在影响结局的因素。2010年,Lawton 及其同事[2] 提出一个新的分级量表,以改善患者选择及更准确地预测手术风险。Spetzler-Martin 补充分级(Supp-SM) 在经典 SMS 的基础上增加了新的变量,包括年龄、出血史和血管巢类型。

自 2010 年提出 Supp-SM 以来,很少有研究比较 SMS 与 Supp-SM 预测手术结局的效能[3,4]  。我们分析了接受手术治疗的脑AVMs 患者的相关资料,比较 Supp-SM 与SMS 的预测价值。为了评估新分级量表的预测能力,我们分别比较二者各自的预测效能;将每个分级量表单独置于基于改良 Rankin 量表(modified Rankin Scale,mRS)的临床预后模型中。我们假设,Supp-SM 预测脑 AVM 手术结局的效能优于 SMS。

方 法


研究对象


本研究为开放队列的回顾性研究,纳入了在 2000 年 1 月至 2014 年 12 月期间连续入院,并在赫尔辛基大学医院神经外科接受手术治疗的 AVM 患者(该医院是所在地区的唯一可提供神经外科治疗服务的医院,服务人群约 200 万)。基于血管造影及组织学检查诊断 AVM。脊髓 AVMs、硬脑膜动静脉瘘及Galen 静脉畸形的患者未纳入本研究。本研究的对象均为接受了神经外科手术切除的 AVM 患者,其中 200 例有完整的人口统计学、影像学及临床资料。赫尔辛基大学医院伦理委员会批准了本项研究。参与本研究的所有患者均签署了知情同意书。
 

研究变量


收集接受 AVM 显微切除术的 200 例 AVM 患者的数据, 比较 SMS 评分与 Supp-SM  评分的预测效能。研究变量包括SMS 的构成(AVM 大小、静脉引流方式以及位于功能区)和Supp-SM 的构成(手术时的年龄、手术前是否出血以及 AVM 血管巢的弥散度)[3] 。使用术前 mRS、3~4  个月的 mRS  以及 2016 年最终 mRS 来评估结局。
 

统计学分析


统计学分析采用 Social Science 软件统计分析包第 24 版(SPSS,IBM Inc,Armonk,New York),而 ROC  曲线比较采用 MedCalc 软件第 18 版(MedCalc Software,Ostend,Belgium)。我们在单变量分析中采用卡方检验比较分类特征的组间差异, 在多变量分析中采用 logistics 回归分析影响术后 mRS 的因素。采用 Hanley & McNeil 法比较 ROC 曲线[5] 。P < 0.05 被认为有统计学意义。术前、术后的 mRS  评分差异被认为是评估结局的指标。术后 mRS 无变化或改善视为结局良好。

比较 SMS 和 Supp-SM 分级量表对应的手术前后 mRS 差异所生成的受试者工作特征(receiver operative characteristic, ROC)曲线下面积,评估两种量表的预测能力。ROC 曲线下面积取值为 0.5 表示无差异,取值为 1 表示完全不同。分别计算术后随访 3~4 个月(早期结局)及随访结束(2016 年,晚期结局) 时的 SMS 与 Supp-SM 评分系数。

我们进行 10 折交叉验证,并用 10 折验证集数据估计ROC 曲线下面积,以使模型估算更为准确。
 

结 果


本研究共纳入 200 例患者。患者的人口统计学信息及AVM  特征见表 1。在所有患者中,38% 的患者行显微切除术前接受过栓塞治疗,3% 的患者行显微切除术前接受过放射外科治疗。在 200 例患者中,138  例(69%,mRS  评分0~2)患者术后获得了良好结局。133 例(67%)患者的术后 mRS 评分无变化或改善。在首次(3~4 个月)随访时,7 例(3%)患者死亡,而在末次随访时(2016 年),23  例(11%)死亡,其中 16 例死于 AVM 相关原因。9 例死亡患者术前 mRS 评分为 5 分。高龄、AVMs 未破裂以及弥漫性AVM 血管巢的患者更可能出现不良结局。然而,深部穿支动脉供血与不良结局有显著相关性(P < 0.001)。而在大型 AVMs 患者中却未显示显著差异(P = 0.470)。



患者特征的详细信息以及与结局相关的因素见表 2。神经功能结局按 SMS 与 Supp-SM 分级排列。在 SMS  及Supp-SM 分级系统中级别越高,患者结局越差,在长期结局中尤为明显。然而,在我们的病例中(表 1)SM 分级为IV 或 V 的患者比例较高(28%),导致分级与结局的相关性较为均衡。


单因素分析确认年龄(P < 0.001)、穿支动脉供血(P = 0.030)以及合并动脉瘤(0.046)是早期结局(随访 3~4 个月) mRS 较差的显著预测因素。病变位于功能区边界有显著意义(P = 0.063)。

关于晚期结局,单因素分析确认年龄(平均 > 40 岁;P = 0.001)、功能区病变(P = 0.006)、弥漫性血管巢(P = 0.001)、穿支血管供血(P < 0.001)、深部静脉引流(P =0.014)以及无出血表现(P = 0.049)是结局不良的显著预测因素(表 3)。


通过比较术前 mRS 评分与术后早期(< 4 个月)mRS 评分,以及术前 mRS 评分与术后晚期 mRS 评分,判断mRS 评分为改善、无变化或变差,将结局分为良好与不良两类。为了确定两类结局的独立预测因素,采用 Wald 法(首先将变量加入模型然后分阶段倒推排除)建立二元 logistic 回归模型。早期不良结局的显著预测因素包括:年龄 > 40 岁[P < 0.001;比值比(odds ratio,OR)= 5.9]  和穿支血管供血(P = 0.008;OR = 2.9;表 4)。晚期不良结局的显著预测因素包括,年龄 > 40 岁(P = 0.002;OR = 3.2)、AVM 大小> 30 mm(P = 0.047;OR = 0.4)、弥漫性血管巢(P = 0.001;OR = 5.7)、深部穿支供血(P < 0.001;OR = 5.9)以及无出血表现(P = 0.045;OR = 0.4;表 5)。



ROC 曲线下面积显示了 SMS 与 Supp-SM 模型评估早期结局的准确性,Supp-SM 比 SMS 的 ROC 曲线下面积更大(分别为 0.67 与 0.57,P < 0.0001)。对于晚期结 局,Supp-SM 也比 SMS 的 ROC 曲线下面积更大(分别为 0.70 0.63,P = 0.0072;如图)。


讨 论


在本研究中,我们为 Supp-SM  的预测能力提供了更多证据。自 2010 年提出 Supp-SM 以来[2] ,鲜有研究显示其优于传统 SMS[3,4,6] 。

为了将切除术的风险最小化,我们需要研究术前的相关因素。影响结局的因素有 AVM 病理的多样性、个体化因素、团队的手术能力和技术支持以及最重要的是对手术患者的选择。

神经外科医生对于以前的 AVM 分级系统非常熟悉,这些系统有助于预测手术风险以及制定处理决策。SM 分级系统是神经外科医生最为熟知的、实用的系统,它包括以下变量:AVM  的大小(< 3、3~6  以及 > 6 cm)、静脉引流(深部或浅部)以及病变是否位于功能区。这些变量组合会产生 5 个不同的级别。最近,SM  分级系统经过改良,重新命名为 Spetzler-Ponce 分级系统[7] ,简化为 3 个不同的等级。A 级包括 SM 分级的 I 级和 II 级,B 级包括 SM 分级的 III 级, C 级包括 SM 分级的 IV 级和 V 级。这种分级的目的是改进治疗决策。

I 级和 II 级 AVM 推荐进行手术,而 IV 级和 V 级则不建议治疗。然而,对于 B 级的处理推荐,存在较大程度的不确定性[8-11] ,因此,对于确实需要治疗的病例,通常推荐多种模式的治疗方式。多种模式可包括栓塞结合手术、手术结合放射外科、栓塞结合放射外科以及结合 3 种方法的综合治疗。
 
为了增强分级系统预测 AVM 治疗的效能,多伦多团队的分级系统增加了 1 个新的因素[12]  。这个因素是 AVM 血管巢的弥散度。这个系统采用 AVM 血管巢的类型替代了AVM 大小这一变量。深部静脉引流为 2 分,血管巢的弥散度为 3 分,以及功能区病变为 4 分。这个分级系统并没有像SM 系统那样得到广泛的接受。但是,从手术的角度和对结局的重要影响,都证明血管巢弥散度的概念是一个重要的因素。

AVM 的出血表现是其自然病史中一个重要的风险预测因子[13-15]  。既往出血史是AVMs 出血的最大风险[16] 。然而, 出血增加 AVM 周围死腔并有利于手术切除,在低级别AVM 中尤其如此[17,18]  。同时,AVMs 破裂的患者由于出血性卒中,治疗前已存在神经功能缺损,与之相比,AVMs 未破裂的患者治疗前通常没有神经功能缺损,因此术后更易出现新的功能缺损。Lawton 等[2] 提出 3 个新的影响因素:年龄、出血及血管巢弥散度[2] 。新系统与 SM 系统有相似的特性。年龄可分为 3 个组别 :20 岁以下得 1 分,20~40 岁得2 分,超过40 岁得3 分。未破裂得1 分,血管巢弥散得1 分。

Supp-SM 分级系统有 9 个不同的级别(2~10)。在这一系统中,6 级被认为是能否接受手术风险的分界点[3] 

新的分级系统具有随时间推移而改变的灵活性。年龄和出血情况是可变因素。并且,血管巢形态和 AVM 大小可因放射外科和栓塞的治疗而改变。因此,Supp-SM 被证明是一个动态的分级系统,并可被其他治疗方式修正,尤其是血管内治疗。

根据AVM 的亚型,SM 分级中的III 级病例有不同亚型, 其死亡率和发病率不尽相同。因此,Lawton 等[3] 进一步分类为 III+ 级、III 级、III- 级以及 III* 级;III* 级是一种非常罕见的情况,大型 AVM 有浅部静脉引流并位于非功能区, 例如右额极。位于功能区则将 III 级升为 III+ 级,这在我们的经验中也得到了验证。

在补充分级中,年龄得分为 1~3 分,有其合理性[19-21]  。高风险 AVM 的特征(AVM 相关动脉瘤和静脉畸形)更常出现在成人中。而出血更常见于儿童[15] 。因此,在补充分级中,低龄的自身得分较低,通常合并有出血表现,后者在补充分级中得分为 0,这进一步解释了年轻患者可获得更好的结局。

我们的研究表明,深部穿支动脉供血对于治疗结局有重要影响,但在 Lawton 等的研究中却并非如此[2] 。深部穿支血管会导致风险增加是非常容易理解的。在切除 AVM 时, 这些脆弱的小血管非常难以电凝闭塞,并且常回缩至深部白质,这些白质可能包含有重要功能的长纤维束。大型复杂的AVM 更常见有深部穿支供血,并且这些 AVM  本身即有较高的手术风险。穿支血管在我们的病例中有显著意义的一个可能的解释是,本项研究中 SM 分级为 IV 和 V 级的病例(28%)比例更高,而 Lawton 等[2] 的研究中为 11%。这意味着我们的研究中有更多的大型和深部静脉引流的 AVMs, 这些 AVMs 有更大的可能性包含深部穿支血管供血。本研究中 SM 分级为 IV 和 V 级的比例较高,既反映了我们中心负责诊治的人群(所在服务地区的所有 AVM 患者均由我们治疗),又反映了研究期间的治疗策略。目前,针对 IV 和 V 级的患者,我们倾向于选择更保守的治疗,对于未破裂的病例尤其如此。
 

研究的局限性


我们纳入了足够数量的各级病例,并且应用 Supp-SM 新分级获得了与分级发明人研究的同样结果,因此,根据本研究的结果,我们的策略认为能够证明 Supp-SM 分级的有效性。

血管巢弥散程度的判断依然有一些主观性。然而,高级影像技术能够将弥散血管巢分为更多亚型。

有许多其他因素可对手术结局产生重要影响,包括AVM 相关动脉瘤、随着时间延长在术前破裂的病例,以及穿支血管。

本研究有11 例术前破裂的病例接受了其他治疗模式(10 例栓塞治疗,1 例立体定向放射外科治疗),而不是在起初未破裂时接受显微手术。由于手术是在 AVM 破裂后进行的,这些病例依据 Supp-SM 分级系统归类为破裂 AVM,尽管他们可能与那些未接受治疗便破裂的 AVM 有一些不同的特性。但是,这应该不会影响 2 个分级系统的比较。并且, 由于多模式治疗现在已经非常普及,我们认为,将这些病例均纳入本研究,为研究完整性增加了一定的“真实”价值。
 

结 论


新分级系统有助于理解和预测手术结局。根据最优的分级系统进行选择是AVM手术成功的关键,最为重要的是, Supp-SM分级系统有助于确定什么情况下不应进行手术。随着治疗模式的发展和认知的进步,未来会提出其他新的分级系统,包括其他影响因素,如深部穿支血管。面对AVM这样的有挑战性的疾病,外科医生的决策和技术有至关重要的作用。

声 明




参考文献




评 论


这项研究是单中心手术治疗 AVMs 的回顾性开放队列研究,分析了 2000~2014 年的病例,进一步更新了 Spetzler-Martin AVM 补充分级系统预测手术结局的应用。作者提供了更新的证据,新分级系统增加了年龄、出血情况以及血管巢类型,与经典 Spetzler-Martin 分级相比能够更准确地预测手术结局。研究也表明,未破裂和深部穿支血管供血对于预测结局有重要作用。对于临床治疗决策有争议的 III 级病变,这些因素在临床决策时应该很有帮助。此外,本研究队列也确认,多伦多数据,即弥散性血管巢,是手术治疗的一个危险预兆。未来,我们应该更谨慎地定义有些模糊不清的分类。


治疗 AVM 患者仍然是神经外科最有挑战的工作之一。目前的治疗选择包括手术切除、血管内栓塞以及立体定向放射外科,或者联合使用这些方法。尽管有关 AVM 最佳治疗方式的探讨从未停歇,手术切除仍然是 AVM 确定性治疗的金标准。在过去的 30 年中,SMS 分级量表已被用于预测术前风险以及手术患者的选择[1]。尽管 SMS 没有包括 AVM 或患者的一些基本特征,但是其兼具简易性和实用性,因而得到了广泛的应用[2]。Spetzler 进一步将 5 级分类系统进行简化,并压缩至 3 级分类[3],以提供更为简易的治疗推荐。

通过增加变量而对 SMS 进行修改的尝试,反而会增加其复杂性,从而导致接受度下降。正如这项研究显示,Lawton 等[4]  提出的新补充分级系统(Supp-SM)使手术风险预测的准确度提高。然而,在 SMS 的 3 个因素(血管巢大小、深部静脉引流及位于功能区)的基础上,新分级系统通过增加患者年龄、出血表现和血管巢弥散度,使得级别数量增加至 9 级(2~10)。这些增加似乎是合理的,因为所有这些因素对结局都有显著影响。但是,除了这 3 个新变量,还可能将更多的变量加入量表。比如,根据我们的经验,深部穿支动脉(如A1 起源的内侧豆纹动脉、M1 起源的外侧豆纹动脉、P1 起源的丘脑穿支动脉等)是决定 AVM 手术结果的最重要因素。由于血管壁结构的脆弱,电凝这些血管止血是非常困难的,因此术中如果可行,应该进行近端控制才有利于电凝止血。Yasargil [5,6] 提出的直接引流的静脉窦情况也是决定是否采取保守治疗的另一个非常重要因素。如果缩窄或闭塞直接引流的静脉窦,导致 AVM 静脉引流受损,可能导致 AVM 发生出血的概率增加。因此,如果不存在静脉窦直接引流或仅有低流量引流,外科医生应倾向于选择手术切除。根据我们的经验, 这两个影响因素与 Supp-SM 中的其他因素同样重要。当然, 在进行手术病例选择时,还有其他非常重要的手术因素值得注意。神经外科医生应根据每例患者的情况,对这些变量进行个体化的风险分析,而不是通过增加所有这些因素创造新的、复杂的分级系统。

我们祝贺本文的作者们在如此大样本量的 AVM  病例中获得了好的手术结果。这项研究肯定会帮助神经外科医生进行患者选择并取得更好的治疗结局。我们的目标应该是无论我们的患者患有何种疾病,在他们出现功能缺损前,尽力寻找方法帮助他们而非抛弃他们,同时不应忘记我们能力的局限性。从这个角度来说,分级系统是有帮助的。但是我们应该知道,每一个分级系统都有其局限性,应避免夸大这些分类的用途。给任何病变贴上不可手术的标签都应进行全面的思考,避免为年轻一代的神经外科医生的发展制造障碍。



这是一项设计缜密的回顾性研究,旨在验证 Lawton-Young 分级系统(又称为Spetzler-Martin 补充分级量表) 预测脑 AVM 患者行手术治疗的结局。这项研究与 Lawton 等2010 年提出的方法相似[1] ,确实为 Lawton-Young 分级系统提供了有意义的验证,特别是根据 Spetzler-Martin 分级的 1~5 级, 本组病例的级别分布较为均衡。除了 Lawton 等 2010  年提出的影响因素,如手术时年龄、血管巢弥散度以及出血表现[1], 本次研究还发现深部穿支供血动脉是影响手术结局的重要因素。许多有经验的医生都同意,这些供血动脉是重要的技术因素。高龄可能意味着更高的总体手术风险和更差的恢复能力。弥散血管巢使得 AVM 边界的识别变得具有挑战性,因此, 增加了损伤周围功能区脑组织的可能性。没有出血病史的患者通常无神经功能缺失,因此,如果患者术后出现神经功能障碍则会非常明显。由于深部穿支血管管径细小和解剖扭曲, 栓前栓塞通常难以达到。它们常于手术的最后阶段才在术区深部发现,而且常难以电凝止血,如作者文中提到的,常导致深部白质的额外损伤。

进行一项前瞻性、随机脑 AVM 治疗研究有明显的挑战性。这项回顾性研究提供了新的观点,即在制定 AVM 手术治疗决策时,除了经典的 Spetzler-Martin 预测因素,还应考虑哪些补充因 素。因 此,我 非常支持作者的观 点,除了经典的Spetzler-Martin 预测因素,还应使用补充因素,以获得更好的结局。


作者检验了 200 例手术治疗 AVM  患者应用 Spetzler-Martin 分级系统与 SM 补充分级系统Lawton 等2010 年[1]提出)的预测准确度。主要的新发现是, 深部穿支血管供血与不良的手术结局有显著相关性,而 SM 和 SM 补充分级都没有将该因素包含在内。因此,未来的工作可能是将这个因素加入一个统一的分级系统中,从而在面对具有挑战性的患者时,提高术后结果预测的准确性。



最新评论
发表你的评论
发表你的评论