今天为大家带来的是《Neurosurgery》(中文版)脊柱脊髓与功能分册第四期,由陈斌教授翻译,王振宇教授审校的“手术治疗轻度退变性颈椎病的有效性和安全性:北美AOSpine和国际多中心前瞻性研究结果”,欢迎阅读、分享。
原文:
Efficacy and Safety of Surgery for Mild Degenerative Cervical Myelopathy: Results of the AOSpine North America and International Prospective Multicenter Studies
原文作者:
Jetan H. Badhiwala, MD Christopher D. Witiw, MD MSc Farshad Nassiri, MD Muhammad A. Akbar, MD Alireza Mansouri, MD MSc Jefferson R. Wilson, MD PhD Michael G. Fehlings, MD PhD 作者单位:
Division of Neurosurgery, Department of Surgery, University of Toronto, Toronto, Ontario, Canada
编译:
陈斌
审校:
王振宇
1
评 论
作者针对“轻度”退变性颈椎病(degenerative cervical myelopathy,DCM)的外科治疗进行了一项出色的前瞻性、非随机、非对照、多中心研究,值得赞赏。他们将JOA15~17分定义为轻度“DCM”。尽管纳入研究的193例患者数量够多,但将来扩大研究队列并获得更多数据会更具说服力。该研究似乎是由较年轻的患者队列组成(平均年龄52.4岁),主要是手部功能受影响的主诉,而不是走动问题。疾病累及的节段短,主要局限于C5-6脊髓水平,这也是手灵巧性丧失的原因所在。
有两点值得我们注意:即使患有的是“轻度”脊髓型颈椎病,但患者的生活质量(quality of life,QOL)低于同类人群。换句话说,这种功能障碍对患者来说并不算“轻度”。
第二点是,外科手术干预不仅减缓或阻止脊髓病变的恶化,而且明显改善功能。
因此,脊髓病的问题不在于巴宾斯基征阳性,更重要的是神经功能障碍干扰患者的生活。根据我的经验,手“笨拙”或“手感觉像木头、僵硬、肿胀、关节炎样”症状是诊断评估病情的重要方面。系扣子、佩戴珠宝首饰或手灵巧性等方面出现的简单困难都是最早出现的微妙症状;病变通常位于C5-6-7脊髓水平。
该研究很多数据中的一些问题值得深入探讨或纳入到未来研究中。吞咽困难(5.7%)是否与病变节段、手术节段的数量、手术的持续时间有关?轴性颈部疼痛加重(6.2%)是否与颈椎序列异常、未做融合、术后随访X光片的异常运动有关?
虽然很难评估手术方法是否重要,但如果扩大研究中的注册病例样本量会有利于我们选择更好的治疗方案吗?
在本研究中,脊柱序列(经颈-矢状垂直轴线和其他参数)的作用并没有进行分析。我认为这会影响研究结果的某些方面,包括神经性和轴性颈部疼痛。
总之,应该对作者提供的重要数据表示赞赏,这些数据强烈建议我们应该倾听患者的不适主诉,尤其对手部功能的影响,并考虑手术干预以改善神经功能。我希望继续协同努力以获得更多的数据,使外科医生能够更进一步满足患者对于健康的需求。
本文介绍了纳入来自两项大型研究队列中一组患者的回顾性、多中心、非对照、非随机研究的结果。作者将改良日本骨科协会(modified Japanese Orthopedic Association,mJOA)评分为15~17分的患者定义为轻度症状性脊髓型颈椎病(cervical spondylotic myelopathy,CSM),并进行了手术。对平均术后2年的预后结果与一些患者术前基线结果测量值的平均分进行了比较。在大多数对比中发现了统计学上的显著差异,P值定义为小于0.05。虽然一般QOL评分(SF-36,SF-6D)的平均差异幅度超过了最低临床意义差异(minimally clinically important difference,MCID)阈值,但不清楚Nurick或mJOA评分的平均变化是否也是如此。
本研究提供了一些有关特定亚组患者术后QOL评分变化的有趣信息。如果患者的招募在地理和时间上均匀分布,当然这是不可能的,那么每家中心每年平均只招募1.5例患者。这个数字比较低,可能表明这是一组精挑细选后的患者,或者并非所有符合条件的患者都已入组,或两者兼而有之。此外,这是一个年轻患者的队列(平均年龄52岁),大多数患者的病理机制都与椎间盘相关,并且主要限制在1或2个节段。除髓性体征或症状外,几乎一半患者都有疼痛,然而这些疼痛没有进一步的特点说明。如果这些结果可以推广到其他中心,则应假定它们仅适用于具有相似特征的患者。
Peter D. Angevine
New York, New York
退变性颈椎病(degenerative cervical myelopathy,DCM)是一种进行性退变性脊柱疾病,是全球成人脊髓功能障碍的主要原因[1]。该病的临床病理学包括骨关节炎变性(即颈椎病)和韧带畸变[如后纵韧带骨化(ossification of the posterior longitudinal ligament,OPLL),黄韧带肥大(hypertrophy of the ligamentum flavum,HLF)]。70%以上的60~65岁老年人表现出颈椎退变的病理或放射学改变,其中约1/4的人因机械性神经压迫而出现临床症状[2-4]。美国65岁以上人口发病的比例预计将从2010年的13%增加到2050年的22%[5],这使得DCM的最佳诊断和治疗方式成为公共卫生领域的重要优先事项。
由于有关DCM发展史的报道缺乏统一认识,因此,治疗DCM的策略一直存有争议。该病虽然存在一些个体差异,但大多数患者(范围为20%~60%)在接受非手术治疗时会随着时间的推移而出现神经症状的加重[6-8]。通常情况下,DCM手术减压后可以阻止神经功能障碍的进展并防止病情进一步加重。然而,近期的很多证据表明,DCM的手术干预实际上与脊髓功能和生活质量的改善密切相关[9,10]。因此,手术现已成为具有明显症状DCM患者的标准治疗方式。尽管如此,对仅有轻度症状患者的最佳治疗方式仍然存在争议。最新的临床指南建议,对中、重度DCM患者要进行手术治疗,而对有颈脊髓压迫影像学证据的无症状患者应进行非手术治疗及连续临床随访。对轻度DCM患者,指南建议手术或进行系统性康复,这是比较合理的初始治疗策略;建议的不明确性反映了缺乏对轻度DCM患者手术效果好坏的临床证据[11]。因此,轻度DCM患者治疗策略是外科医生面临的难题。一方面,如果此类疾病仅有轻微症状,那么手术治疗的风险与获益之间可能会弊大于利,甚至得不偿失。相反的观点是,这些患者在病理过程早期通过手术阻止潜在的不可逆神经功能损伤进展,可以使其从干预中获益。此外,即使是“轻度”DCM,也可能与患者的生活质量降低有关。这一点患者是不可接受的,并且可能寻求手术来解决。为此,本研究的目标有两方面:(1)与正常人比较,评估轻DCM的生活质量和(2)评估手术干预对轻度DCM患者的临床预后影响。我们假设,(1)尽管是所谓的“轻度”DCM,但患者的生活质量会有明显的异常和(2)这些患者接受手术治疗会阻止临床症状的进展,并且确实可以改善功能状态和生活质量。
方 法
对象
在5年时间内,将由改良的日本骨科协会(modified Japanese Orthopedic Association,mJOA)评分为15、16或17分[12]的193例患者定义为轻度DCM,并纳入AOSpine CSM North America(CSM-NA)或CSM International(CSM-I)试验。这些都是前瞻性、多中心的队列研究,旨在评估手术减压对DCM患者功能状态、残疾程度和生活质量(quality of life,QOL)的改善效果。根据mJOA量表,这些较大规模的研究将DCM患者分为轻度(mJOA 15~17分)、中度(mJOA 12~14分)和重度(mJOA<12分)3个类别。该分类方案由AOSpine研究人员率先设计和采用,并经过合理验证[12]。这种分组预案允许进行子研究来验证预先假设的合理性,即DCM手术减压的疗效是否随疾病的严重程度不同而不同。
自2005年12月至2007年9月,AOSpine CSM-NA从加拿大1家和美国11家中心招募患者进行研究,而在2007年10月至2011年1月期间,AOSpine CSM-I研究则是从亚洲6家、欧洲5家、拉丁美洲3家和北美2家中心招募患者。经患者知情同意并符合以下入组标准即可入组:(1)年龄18岁或以上;(2)有症状的DCM患者至少有1种脊髓病的临床症状;(3)颈脊髓压迫的影像学证据;(4)既往无颈椎手术史。排除无症状DCM、活动性感染、肿瘤性疾病、类风湿性关节炎、创伤、强直性脊柱炎或伴发腰椎管狭窄的患者。伦理审查由每家中心的内部审核委员会批准。
手术技术
数据采集
采集患者人口统计学(如年龄、性别、种族、体重指数、教育程度、工作状态、合并症等)、临床表现(如症状、体征、致病病理等)和手术资料(如手术入路、手术节段、手术时间等)数据。评估患者术前和手术后6、12和24个月时的功能状态、残疾程度和生活质量。监测手术30天内的术后并发症。
质量保证
外部研究监督人员进行现场和非现场评估以确保数据准确、可靠和完整,并且确保研究遵循研究协议。
预后评价
评估患者术前和术后6个月、1年和2年时的预后情况。通过mJOA量表[13]和Nurick等级评估功能状态[1,14]。这两种方法是研究者经常用于评价DCM患者脊髓神经功能受损的特异性指标。通过第2版健康调查简表-36(Short Form-36 version 2,SF-36v2)[15]评估生活质量,通过颈部残疾指数(Neck Disability Index,NDI)[16,17]评估残疾程度。量表的内容都来源于患者自评,SF-36是一般健康相关的生活质量测评量表,NDI则特定用于颈部功能的衡量。SF-6D效用评分来源于SF-36数据[18]。患者还完成了30米步行测试(30-meters Walking Test,30MWT)[19],根据从坐姿开始步行15米并返回坐姿的步行时间和步数评估DCM患者的残疾程度。
检验效能计算
假设mJOA的标准差为1.8[20],根据配对检验方法对应的检验功效计算,通过193例患者的数据(重复时间点:基线、随访)可检出治疗前后mJOA评分改善1级的检验效能大于99%。
统计分析
计算术前基线描述性统计数据。使用平均值和标准差描述连续变量,通过频率和百分比描述分类变量。我们计算了患者队列在基线时SF-36v2每个模块的平均分。将这些数据与随机选择的9423例25岁及以上生活在加拿大社区的男性和女性正常人群前瞻性调查得出的数据进行比较[21]。通过计算每个模块评分的标准化平均差(standardized mean difference,SMD;Cohen's d)及其相关的95%置信区间(confidence interval,CI),并与正常人群进行对比,从而量化我们队列中患者的生活质量。使用Cohen提出的阈值将SMD的大小解释为:小(0.2)、中(0.5)或大(0.8)[22]。
我们在进行均值的成对比较时,应用Tukey校正了多重比较的问题,以评估mJOA评分、Nurick等、30MWT、SF-36v2的8个模块和2个综合评分、NDI和SF-6D这些指标在基线期、术后6、12和24个月随时间的变化趋势。我们报告了每个时间点每种结果的平均值和95%CI,以及术后2年与术前状态相比的平均差和相关的95%CI。
统计学差异的阈值预先设定为α=0.05。假设数据发生随机丢失,则这些数据不纳入分析。所有统计分析均使用Stata 14(Stata Corp,College Station,Texas)进行。
结 果
本次研究共纳入193例轻度DCM患者(mJOA 15~17分),其中99例(51.3%)来自北美地区,38例(19.7%)来自亚太地区,37例(19.2%)来自欧洲地区,还有19例(9.8%)来自拉丁美洲地区。研究队列的术前基线特征总结见表1。平均年龄为52.4岁。男性126例(65.3%),女性67例(34.7%)。大多数患者为高加索人(140;72.5%),其次是东亚人(38;19.7%)、非裔美国人(8,4.1%)以及其他种族(7;3.6%)。在大多数患者(144;74.6%)中,DCM的病因病理是椎间盘突出症。症状平均持续时间为26.7个月。大多数患者的mJOA评分为15分(86;44.6%),Nurick分级为2级(88;45.6%)。术前基线平均NDI为31.3,SF-36v2躯体模块汇总得分(physical component summary,PCS)为39.7分,SF-36v2心理模块汇总得分(mental component summary,MCS)为42.7分和SF-6D(效用)为0.60。患者最常见的主诉是手麻木(156;80.8%),最常见的检查结果是反射亢进(135;69.9%;表2)。
表3列出了SF-36v2每个模块评分的术前基线平均分、人群平均值和计算的SMD。我们队列中轻度DCM患者的所有生活质量得分显著低于人群平均值,经Cohen's d评估差异是“大”的。对生活质量的最大影响体现在社会功能(SMD-2.33)、躯体功(SMD-2.31)和心理健康(SMD-2.30)模块。
表4总结了研究队列的手术治疗相关信息。大多数患者采用前路手术治疗(143;74.1%)。其中,大多数涉及椎间盘切除术/融合术(140;72.5%),少数患者接受椎体切除术(29;15.0%)。46例患者(23.8%)接受了后路手术治疗,少数患者(3例;1.55%)进行了前后路联合减压。在接受后路手术患者中,仅1例(0.5%)接受椎板切除术,14例(7.3%)接受椎板成形术,以及34例(17.6%)进行椎板切除加器械融合术。大多数病例(145;75.1%)都需要进行多节段减压。
在24个月时,180例患者(93.3%)获得随访数据。患者术前和术后6、12和24个月的功能状态和生活质量测量结果见表3。总体而言,mJOA评分和Nurick分级从基线到2年随访期内得到显著改善(P<0.01)。NDI、SF-6D和SF-36v2的10种评分中的9种(P<0.01)与健康相关QOL均明显改善,其余的一般健康成分有改善趋势。30MWT得分没有改善。
表5列出了手术并发症。最常见的并发症是脊髓病理改变加重,见于13例患者(6.7%),其次是颈部疼痛恶化,见于12例患者(6.2%),以及吞咽困难见于11例患者(5.7%)。
所有出现吞咽困难的患者都接受了前路手术。6例患者(3.1%)发生浅表伤口感染,6例患者(3.1%)发生螺钉错位,4例患者(2.1%)术后出现后凸畸形。59例患者(30.6%)发生至少1种并发症。
讨 论
在一项大规模前瞻性队列研究中,我们发现,与一般人群相比,轻度DCM患者的生活质量显著下降。这些患者的手术与功能改善、残疾程度减轻和生活质量提高密切相关,包括mJOA评分、Nurick分级、SF-36v2评分、NDI和SF-6D效用评分。为了让结果更具有说服力,我们还应考虑轻度DCM的自然发展病史。虽然有文献数据表明,大多数年龄小于75岁患者在没有干预情况下的脊髓功能可以超过3年保持稳定,而且大多学者认为这种长时间的病情稳定是最好的结果,但患者症状其实很少有改善[6,23,24]。而且许多患者经历了典型的脊髓功能缓慢并逐步下降的过程[6]。因此,我们的研究结果更倾向于对轻度DCM患者进行手术干预,因为这些患者生活质量是显著下降的,手术可以实现功能和生活质量的显著提高,而非手术治疗虽然作为替代方案,但最好的结果也仅仅是保持病情稳定。
实际上,有趣的是,尽管本研究中的患者按mJOA量表评定为仅有轻度脊髓病,但患者健康相关的生活质量均受到严重损害。SF-6D是一项有价值且实用的研究指标,因为它提供了对健康状态(即效用得分)的量化评价,使得我们可以对不同健康状况进行比较。我们队列轻度DCM患者的SF-6D评分平均为0.60。为了说明该评分所代表的健康状况好坏,我们查阅文献发现,SF-6D效用评分在哮喘患者为0.76;癌症或恶性肿瘤为0.72;癫痫为0.71;慢性支气管炎为0.66;临床抑郁症为0.64;卒中为0.64;以及充血性心力衰竭为0.60[25]。这就引出了一个问题,尽管只有轻微的DCM,为什么患者的生活质量评分如此之差?研究发现,生活质量的最大变化出现在躯体功能、社会功能和心理健康模块。在我们的患者队列中,最常见的3种症状是手麻木(81%)、无力(65%)和双手动作笨拙(54%)。当考虑到我们的日常生活-工作或休闲-取决于手部功能时,mJOA评分与感知的生活质量之间的明显不一致就变得不足为奇。即使手部功能受到轻微干扰也可能严重损害日常活动中的躯体机能,并延伸影响到社会功能;例如,一个人参加体育运动或其他休闲活动及业余爱好的能力降低。这也会对心理健康造成影响。众所周知,疼痛不仅与生活质量呈显著负相关[26],它同时也是该研究人群的一个重要症状,占我们队列的44%。此外,疼痛的改善已被证明是影响患者颈椎减压术后满意度的一个重要因素[27],这可能是本研究中术后观察到的生活质量改善的关键驱动因素。通过手术干预,在24个月随访时,患者的平均SF-6D评分改善至0.72,改善程度是既往报告的生活质量最小临床意义变化值(minimum clinically important difference,MCID)0.03的4倍左右[28]。同时,SF-36v2 PCS(5.75)、MCS(6.93)和NDI(-12.97)提高的分数均超过了对应的MCID(SF-36v2 PCS和MCS评分为5分[29];NDI为7.5分[16,30])。这些结果提示,我们应该重新调整对DCM患者预后的思考方式,观察治疗中DCM的临床病情稳定不一定是“好的”或可接受的结果。
考虑到研究人群主要是轻度DCM患者,我们没有观察到手术后30MWT时间的改善,这个结果并不令人惊讶。因为只有少数患者(48%)报告有步态困难症状,甚至很少有患者(30%)在检查时具有广泛的、不稳定的步态。此外,考虑到这是一个术前mJOA评分为15、16或17分的队列,任何步态障碍都可能是轻微的,并且简单的步行测试不太可能检测到异常改变。30MWT的心理特性测量已经发现,这种检查仅在严重脊髓病患者的变化中有反应[31]。
在我们的患者队列中,30.6%的患者至少出现过1种并发症。这包括术中和急诊住院事件(例如,硬脑膜撕裂、心肺事件)以及长期并发症(例如,术后畸形、假关节病)。较高的并发症发生率与文献报道一致,根据手术方法不同,报道的并发症发生率从16%到41%不等[32]。此外,研究表明,并发症发生率随着年龄的增长而显著变化,年龄越大并发症的风险越高[32,33]。虽然我们的队列中没有死亡病例,但此前的文献表明,DCM的术后并发症可以延长住院时间、增加死亡率和住院费用[34]。
与一般AOSpine CSM-I研究人群相比[10],我们研究轻度DCM患者队列的平均年龄更轻(52.4 vs. 56.4岁)。许多患者可能正处在进展为中或重度脊髓病之前的早期表现。然而,颈椎发生退变性改变的病理机制在两个群体之间似乎也不同。在我们的队列中,椎间盘突出是最常见的病理表现,发生在75%的患者中。脊柱侧凸(68% vs. 76%)、OPLL(21% vs. 28%)、黄韧带肥大(18% vs. 25%)和半脱位(4% vs. 6%)相对较少。大多数患者(61%)有一或两个节段发病。与AOSpine CSM-I相比,鉴于大部分DCM患者主要表现为局灶性的前方压迫,因此前路手术(74% vs. 58%)比后路手术(24% vs. 40%)更常用。当然,重要的是,我们队列中很大一部分患者(59%)来自AOSpine CSM-I研究。
根据近期文献综述,大多数接受手术治疗的DCM患者都有中至重度神经功能损害;迄今为止,很少有研究关注由mJOA定义为15分及以上的轻度DCM患者[35]。因此,对轻度DCM患者的研究缺陷促使我们进行高质量的前瞻性研究,来比较手术与保守治疗的预后差异。据我们所知,本研究是评估轻度DCM患者接受手术治疗预后情况的最大规模前瞻性研究。本研究纳入的患者来自不同文化背景、多个大洲的多家中心,使得结果可以在各种实践环境中推广。此外,我们评估了一系列经过验证的功能结果指标和生活质量指标,包括mJOA评分、Nurick分级、NDI、SF-36v2和SF-6D。失访率微乎其微(6.7%)。
局限性
我们的研究存在一些局限性。最主要的是缺乏非手术对照组。AOSpine CSM-NA和CSM-I研究在招募轻、中或重度DCM患者时,未招募保守治疗组,因为担心有症状患者在保守治疗中出现神经功能恶化,又未及时进行手术,存在伦理问题。因此,我们没有与非手术患者队列(即自然病史研究)进行研究比较。此外,尽管在所有情况下均实现了脊髓减压,但并未采用标准化的手术方案,且手术方法、手术节段的数量以及器械的使用和类型由治疗的脊柱外科医生决定。还有非常重要的一点是,所使用的一些预后评价指标,包括mJOA和NDI,都具有一定的局限性[36]。由于许多患者仅有轻度DCM,得出的评分往往在这些评价指标的一个上限或下限出现轻微下降,有时很难发现这些轻微变化。因此,这些患者可能正在经历比我们能够观察到的更多改善。另一个值得注意的问题是,我们结果具有均一性。为了让所有参与研究的中心都能够持续纳入患者进行研究,我们做出了很多努力。然而,鉴于治疗方式的选择是由具有DCM管理经验的脊柱外科医生决定,并且5年内仅有193例患者入组,可能患者选择方面至少有一定程度的选择偏倚。此外,任何临床研究都偏向于选择具有资源和基础设施好的学术中心,以完成高质量的前瞻性研究。尽管如此,我们仍然认识到,AOSpine CSM-NA和 CSM-I纳入的患者人数比既往研究都要多,而且这两项研究使用的预后评价数据都经过验证[37]。后一点——缺少应用mJOA、Nurick量表、NDI、SF-36和30MWT进行有关DCM的其他大型研究——限制了我们将本研究结果与其他研究进行横向比较,因而无法评估我们研究结果以外的有效性。
结 论
参考文献