医学统计是临床研究中不可或缺的组成部分。从研究设计、研究实施到结果分析,都需要临床医生与统计学专家精诚合作,以确保研究的科学设计、顺利完成、达成预期目标、获得高质量循证证据。本期,我们特邀高博临床研究中心统计副总监吴旻昉聚焦临床研究者与统计学专家高效协同开展临床研究相关问题展开系统介绍,分享实践体会,以期帮助大家搭建好临床与统计的桥梁。
将数据转化为循证
——不可或缺的统计学
临床常见的统计需求可分为两大类:一是学术类需求,二是临床试验相关需求。学术类主要包括期刊发表论著和学术大会收录研究报告的统计需求,其中期刊发表论著常涉及统计学方法的合理选择(是否能够满足研究目标)、图表的类型选择及制作(是否符合期刊要求)、数据是否充分等问题,不同期刊的要求不尽相同;而学术大会的要求相对比较固定。临床试验相关需求包括研究者发起的研究(IIT)及注册研究,涉及到统计分析所需时间的预估以统筹安排研究进度,当结果不支持原假设时对统计结果的解读等。
欲善其事,先利其器
——常见统计软件
1
SPSS:“综合评分”最高,可满足大多数学术需求
临床医生最熟悉、使用最广泛的统计软件莫过于SPSS系统,能够满足大多数期刊论著发表的统计需求,可提供菜单式操作(包括中文版)、相对更为简易,对操作人员的统计学专业知识要求相对更低;数据录入和整理也非常方便,可将Excel中的数据直接导入,能够负荷的数据量和复杂程度均较理想,且数据处理速度较快,是一款对非统计学专业人员非常“友好”、综合评分很高的统计工具。
但对于一些比较复杂的统计分析,比如竞争生存风险模型、贝叶斯分析等,SPSS系统则可能无法“胜任”、需要选用其他统计软件,这是其主要的局限性所在。其次,SPSS系统输出(output)的结果表格(table)自明性较低,常常令临床医生难以选择和使用;此时可求助于统计学专家解读和转换,建议提前沟通好具体需求,清晰告知疾病种类、分组设置、研究设计等,以便高效达成研究目的。此外,SPSS系统能够制作的图(figure)种类和复杂程度有限,主要视期刊要求来选用。
2
SAS和R软件:各有千秋,按需优选
StatisticalAnalysisSystem(SAS)和R软件也是临床医生应用较多的两款统计工具。不同于SPSS系统可直接菜单式操作,这两款软件均需编程实现、入门较难,但能够分析的模型种类非常多、包括复杂模型。
SAS的特点在于相对闭源,其程序均经监管机构认证、不可随意更改,国家药品监督管理局(NMPA)、美国食品和药品管理局(FDA)等均强制要求递交的临床研究数据采用SAS统计分析。R软件可分析的模型较SAS更为灵活,但其属于开源软件,就注册性临床试验而言,使用该软件不易监管、程序未经官方认证;但R软件可用于学术支持,建议选用同行公认度较高的模型,有利于提高审稿专家对分析结果的认可度。
与SPSS系统相比,SAS生成图表需时更久,因为图表的格式、内容均需通过编程调整,而非人工直接修改,以满足监管需求。R语言的一大突出优势在于更新迭代速度快,这也是开源软件的普遍特点,且完全免费,而SAS有版权限制。同时,相较于SPSS系统和SAS,R软件得益于其灵活性,制作的图表可实现的美化度、复杂度、灵活度明显更高,速度也较快,更适合学术大会报告、期刊论著发表等场景,可作为“加分项”。
3
优选软件、优化流程,提高统计分析效率
不同临床研究,统计分析需时不尽相同,主要取决于数据复杂度、统计需求和软件特性,比如需要编程的软件就尤为耗时。系统性地了解统计分析工作流程(图1),有利于临床研究者提前规划好研究的时间安排并严格按照监管机构的数据审查要求去执行流程、完成分析,以确保顺利通过审查。
图1统计分析工作流程
找准目标,高效推进
——对统计需求达成一致
临床研究者与统计学专家在统计需求方面高效达成共识是研究成功的重要一步。首先需要明确的是,统计检验意义并不完全等同于医学意义。有统计学差异不一定有临床意义,反之,没有统计学差异也不一定没有临床意义。好的临床研究需要兼顾二者、取得最佳平衡。
临床研究者与统计学专家沟通时,最重要的是清楚阐述研究终点及评价标准,并提供收集到的原始数据。研究终点选择也是决定临床研究价值的关键,主要研究者(PI)应把好这一关口、尽量选择业内公认的“金标准”。数据收集应尽量减小偏倚,数据结构应清晰。双方沟通语言都应尽可能直白、通俗,以弱化学科界限、便于理解。
第二,临床试验统计工作与学术统计支持工作也有所差异,统计学专家通常也有相应的主攻方向,研究者可按统计需求类型寻求相应的专家帮助。
细节决定成败
——几个常见的统计问题
1
1、P>0.05就代表研究无意义吗?
随着临床医生对P值认知的广泛,统计学专家被越来越多地问到P值相关的问题,甚至呈现出临床过于注重P值的现象。那么,P值真的是越小越好吗?P>0.05就代表研究白做了吗?答案显然是不能一概而论。P值的解读需要结合模型的基础理论及其他参数、患者的临床获益等全面评价。目前最新的临床研究指导原则也强调,P值的意义应回归到统计学本身,而不应过度解读其临床意义。
P>0.05并不一定没有临床意义,只要有一定的数据结构支撑,也能说明一些临床问题。P>0.05也并不一定代表研究是没有成效的,其影响因素是多方面的,比如样本量不足够、研究设计不够科学等,都可能影响最终的结果。全球医学顶级期刊发表的P>0.05的研究报告并不罕见,充分结合统计学和临床背景也能够阐明重要的临床问题。
2
如何筛选协变量?
临床研究中,既有医学意义也有统计学意义的协变量,才被认为是有效的协变量。不合适的协变量反而可能成为影响主要研究结果的混杂因素。因此,筛选协变量也是需要临床研究者与统计学专家重点沟通的点。
3
统计图的制作
无论是期刊发表论著还是学术大会报告,统计图都是重要的“加分项”。与统计学专家沟通时,建议临床研究者提供想要的示例图(比如目标期刊已发表文章中的图、学术大会既往收录的研究报告中的图),并预留给统计学人员足够的制作时间。
4
研究设计的优化
最后一个重要问题是研究的设计。任何医学统计都应有相应的试验设计,包括回顾性分析,要明确是做病例对照研究、外部对照研究还是单纯的观察性研究等,以确定想要阐明的临床问题。如果研究者难以有清晰的方案,可听取统计学专家的分析和建议。
*本文根据《临床研究生物统计系列课程》吴旻昉统计副总监的授课内容整理。
专家介绍
吴旻昉
高博临床研究中心统计副总监
吴旻昉,高博临床研究中心统计副总监,10多年临床研究工作经验,先后在上海医药临床研究中心有限公司、昆拓信诚医药研发(北京)有限公司从事生物统计分析及团队人员管理工作,并在昆拓信诚医药担任统计经理职位,深入参与多项I~IV期多领域药物临床试验项目,包括执行协议开发、SAR/CSR编写、统计模型开发、团队人员管理及培训有着丰富的经验。近年主要研究方向为细胞疗法,细胞免疫治疗等,在CAR-T细胞项目有丰富的经验。参与多个细胞治疗项目的方案设计,统计分析,监管沟通等工作。