SDTMIG学习总结

更新时间:2024-03-11 05:07:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

CDISC SDTM IG学习笔记

学习心得:

SDTM数据集与一般数据集的区别: 1. 数据集个数不同

按照数据变量的不同来源分为不同的域,而一般的临床试验只有一个或少量几个数据集。

也就是数据不是按照在CRF表中的位置来收集的,而是按不同topic。 2. 个人记录与事件记录

一般数据集每个人一条记录,SDTM数据集每个人的每个事件、每次用药或每次不良反应一条记录。变量的数量减少,记录的条数增多。也就意味着每个受试者每次访视每个时间点可能有许多条观测记录。 3. 由于变量之间存在关联,所以SDTM有关联数据集

4. CDISC的重点是如何确定记录的唯一性,比如多阶段多时间多剂量的试验,就需要有三个变量来区别。

5. 元数据:关于数据的数据,按照一定的标准,从信息资源中抽取出相应的特征,组成一个特征元素集合。包括描述一个具体对象所需要的数据项集合、各项数据语义定义、规则和语法定义。元数据标准的制定为提高数据库建库质量,使诗句加工达到规范化、标准化,促进科学数据标准化,加强数据交流。

6. 作用:变量名标准化,变量取值标准化

7. 并不是所有的域和变量都要使用,根据研究内容来选择

This model describes the contents and structure of data collected during a clinical trial

The purpose is to provide regulatory authority reviewers (FDA) a clear description of the structure, attributes and contents of each dataset and variables submitted as part of a product application

1. 域

1.1 定义:一组具有共同主题并在逻辑上相关的观测结果集合。A domain is defined as a collection of observations that share a common topic.

每个域采用唯一的两字符(英文缩写)代码加以区别,如不良时间域(AE, Adverse Event)

域是SDTM的核心,所有变量按不同的来源被分类到相关的域。比如下图中展示提交的SAS数据集。CM(concomitant and prior medication)伴随用药域、DA(Drug Accountability)药物发放回收记录域和DM(DEMOGRAPHICS)人口学资料域等。

? 域名和变量名是固定不能变的。在所有域中使用SDTM规定的变量标签 ? 研究中只需提交实际采集的域,具体采集哪些数据由研究内容决定,而

不是基于SDTM。

? 扩展内容:如果现有的域不能满足要求,可以创建自定义域(相关内容

未包括)

1.2 域模型

1.2.1 域可以分为五类 Special-Purpose Domains

General Observation Class(3种Interventions,Events, Findings), Finding about, Trial Design

Relationship Datasets。

下图是SDTM vesion3.2中包括的所有域。

1.2.2域模型假设

变量名最长为8个字符

变量筛选:每个域中有各种变量,研究者应按需要选择合适的变量。域中的变量

按照需求的不同可分为必需变量(域中必须有且值不能为空)、预期变量(域中必须有但可以为空值)和许可变量(有数据才提交)

变量顺序:对于General Observation Class中的变量顺序,应先按标识变量、主题变量、修饰语变量到时间变量依次排列,每种变量类型内按照SDTM表中变量描述排序。

扩展内容:域可以被分割,如将调查量表QS域分为临床整体印象(QSCG)、痴呆易于康奈尔量表(QSCS)和细微精神状况检查(QSMM),操作方法不详述。 受试者:在标签或注释中将“病人”或“志愿者”统称为“受试者”。在所有的域数据集中都应该包含唯一的标示符(USUBJID)。一般可用:研究编号、临床中心编号和受试者编号联接起来作为USUBJID。

文本数据大小写:建议大写文字形式递交文本数据(如果是英文的话),长文本或标签文本及已经是大小写的受控术语除外。

缺失值:单个数据项缺失以空来表示,如果有—STAT变量和—REASND变量则还需在—STAT中录入NOT DONE,在—REASND中录入原因。

分类变量:——CAT、——SCAT、——GRPID、——SPID、——REFID ——CAT与——SCAT在采集之前就已知,是固有属性,用于受试者之间分组 ——GRPID通常在数据采集之后由申办者指定,受试者之内分组数据

对各受试者之间具有相同值的数据用——CAT与——SCAT,而对受试者之间具有不同值时用——GRPID

自由文本:其他,请说明。P36页 一个变量的多个取值

受控术语:一个星号*或两个星号**代表相应的变量应该被填入意义明确的一组数值(受控术语)。一个星号表示受控术语来自申办者自定义的值,两个星号表示来自外部已出版的数据源。

? 建议受控术语应大写,除了本来就是小写的或计量单位 ? 放入define.xml ? 不能用数字代码

每个通用观察域必须要有一个主题变量,一个时间变量

主题变量:事件类——TERM,干预类——TRT,发现类——TEST;必须有受控术语

时间变量:国际标准日期时间格式ISO 8601 YYYY—MM—DDThh:mm:ss 年—月—日T小时:分钟:秒 0不能省略,不能有空格。 时间变量的片段名为——DTC。 ? 时间成分缺失:恰当右缺失

中间缺失补充单个连字符。

不确定时间的表示

时间间隔变量——DUR

YYYY—MM—DDThh:mm:ss/ YYYY—MM—DDThh:mm:ss 或者PnYnMnDTnHnMnS或PnW 确定开始时间和间隔

YYYY—MM—DDThh:mm:ss/PnYnMnDTnHnMnS 确定结束时间和间隔

PnYnMnDTnHnMnS/YYYY—MM—DDThh:mm:ss ? 研究日变量——DY

——DY=(——DTC的日期部分)-(RFSTDTC的日期部分)+1,如果——DTC和RFSTDTC相同或在其后

——DY=(——DTC的日期部分)-(RFSTDTC的日期部分)+1,如果——DTC

在RFSTDTC之前 ? 访视

对于非计划中的访视:VISITNUM值 ? 相关时间变量

——STRF和——ENRF是分别与RFSTDTC和RFENDTC比较,可能的值是BEFORE,DURING,DURING/AFTER,AFTER,ONGOING,U(Unknown)等 ——STTPT 参考的开始时间点,——STRTPT表示与——STTPT相比较 ? 任何域的日期都应该记录在——DTC 数据标准化

——ORRES记录原始结果,但——STAT为“未检测”或来源为衍生(——DRVFL=“是”)时,它可以为空。

——ORRES有值时,字符型变量——STRESC必须有值,——STRESC可以由——ORRES转换而来,也可以是根据——ORRES值指定的相应值 然后将——STRESC中的值转入数值型变量——STRESN

如果原始数据中含有字符,如<,>等,则字符应该复制到——STRESC中,而——STRESN则为空。 未测项目

CRF表中数据缺失,且没有对选项是/否或已测/未测作出明确选择时 如果一组检测项目未作,则相应的变量值为: ——TESTCD为——ALL; ——TEST应为《模块名称》 ——CAT应为测试组的名称 ——ORRES为空 ——STAT为未测

——REASND如果采集了,可能是标本遗失 ? 心电图的总体解释作为一条新纪录显示

——TEST不能超过40字符,如果超过了,可以提供其在电子CRF的链接;如果CRF表中没有,则创建一个pdf文档来储存全部文本描述。

? 超过200字符的文本,前200字符存储在标准域变量里,剩下的每200字符

应该在SUPP——中存储为一条记录。变量名是在原始的标准域变量名称后

面添加一个从1开始一位的整数,如果变量名已经到了8个字符,则最后一个字符用该数字替代。

1. 人口学数据域 Demographics DM

每个受试者一条记录,DM域includes essential standard variables of each subject 必需变量:STUDYID, DOMAIN, USUBJID, SUBJID, SITEID, SEX, ARMCD, ARM, COUNTRY

预期变量:RFSTDTC, RFENDTC, AGE, AGEU

许可变量:INVID, INVNAM, BIRTHDTC, RACE, ETHNIC, DMDTC, DMDY 变量说明

STUDYID:研究唯一标示符 DOMAIN:域名DM

USUBJID:受试者唯一标示符,可以是STUDYID-SITEID-SUBJID组成 SUBJID:受试者编号 SITEID:研究中心编号

SEX:性别 受控术语F(Female), M(Male), U(Unknown), UNDIFFERENTATED ARMCD:最长20字符,计划分组代码 ARM:计划分组描述

COUNTRY:国家 受控术语 C66785 各国英文缩写,如中国CHN RFSTDTC:受试者第一次暴露于研究治疗的日期/时间

RFENDTC:受试者结束试验的日期/时间,常等于最后一次暴露于研究治疗的日期/时间 AGE:年龄

AGEU:年龄单位 受控术语 DAYS HOURS MONTHS WEEKS YEARS

INVID:研究者标识符,如果SITEID等于INVID(一个中心一个研究者)则不需要 INVNAM:研究者姓名 BIRTHDTC:出生日期/时间

RACE:人种 受控术语 AMERICAN INDIAN OR ALASKA NATIVE/ASIAN/BLACK OR AFRICAN AMERICAN/NATIVE HAWAIIAN OR OTHER PACIFIC ISLANDER/WHITE ETHNIC:族裔 受控术语 HISPANIC OR LATINO/NOT HISPANIC OR LATINO/NOT

REPORTED/UNKNOW DMDTC:采集日期 DMDY:采集数据研究日

如果DMDTC≥RFSTDTC,则DMDY=DMDTC-RFSTDTC+1 如果DMDTC

? ARM/ARMCD的值必须与实验分组的数据集(TA)的一致

如果需要递交筛选失败的受试者数据,应把他们放入DM域中,

ARMCD=SCRNFALL;ARM=筛选失败。还可在Disposition实施情况域(DS)中放入一条记录标明筛选失败发生的时间。

如果没有筛选失败,但也没有分配到任何分组,则ARMCD=NOTASSGN;ARM=未分配。

? 受试者水平的受试人群标志(如COMPLT,SAFETY,ITT和PPROT等)可放入补

充修饰数据集SPPDM。

? 如果是混血人种,则RACE为MULTIPLE,具体人种情况放入SUPPDM。或者

也可指定一个主要人种,其余信息放入SUPPDM。或者采用“其他,请说明”采集自由文本信息,则RACE值为其他,而把具体内容放入SUPPDM。

? Safety population flag/randomized number/randomized flag???

2. 注释域Comments CO

The Comments special-purpose domain provides a solution for submitting free-text comments related to data in one or more SDTM domains or collected on a separate CRF page dedicated to comments.

Comments are generally not responses to specific questions; instead, comments usually consist of voluntary, free-text or unsolicited observations.

CO域是为了提交与域数据相关的自由文本型注释,以及CRF表中专门的注释。 必需变量:STUDYID, DOMAIN, USUBJID, COSEQ, COVAL 许可变量:RDOMAIN, IDVAR, IDVARVAL, COREF, COEAL, CODTC COSEQ:同一USUBJID受试者不同注释的序号

COVAL:注释的内容,超过200字则依次记录在COVAL1-COVALn中 IDVAR:父表中用于指明注释与哪个记录相关 IDVARVAL:IDVAR的值

COREF:与注释相关的参考,如CRF页码 COEVAL:注释的初始作者 CODTC:注释表的注释时间/日期

? CO域的三个来源:a,与特定域或记录无关联,这种情况下RDOMAIN, IDVAR,

IDVARVAL值为空;b,域特定域相关联,但无关联记录,RDIMAINS值为相关域的代码,变量IDVAR, IDVARVAL为空;c,与特定记录或一组记录相关联,RDOMAINS为相关域代码,IDVAR和IDVARVAL分别为所关联的变量名和值。 3. 受试者元素表 Subject Elements SE

The Subject Elements dataset consolidates information about the timing of each subject’s progress through the Epochs and Elements of the trial.

SE域整合了每一受试者在试验过程中经历的各时期(Epochs)和元素(Elements)的时间信息。受试者在试验中的实际经历,

而试验设计相关的TA(Trial Arm)或TE(Trial Elements)域中是设计的时期和元素,并不一定是实际的。

必需变量:STUDYID, DOMAINS, USUBJID, SESEQ, ETCD, SESTDTC 预期变量:SEENDTC

许可变量:ELEMENT, TAETORD, EPOCH SEUPDES

ETCD:ELEMENT的伴随变量,8字符以内。如果受试者实际经历的元素与计划不同,被视为新元素,ETCD=UNPLAN

ELEMENT:元素的名称,如果ETCD=UNPLAN,则为空值 SESTDTC:元素开始日期/时间 SEENSTC:元素结束日期/时间

TAETORD:受试者被分配组别内元素计划序号

EPOCH:与受试者所分配组内的计划元素序列相关联元素的时期 SEUPDES:非计划元素描述

? 强烈建议递交受试者元素数据集

? 根据定义,元素的结束日期SEENDTC值将和下一个元素的开始日期SESTDTC

相同

? SE域与其他域不同,SESTDTC是必需变量,不能为空

4. 受试者访视域 Subject Visit SV

The Subject Visits dataset provides reviewers with a summary of a subject’s Visits. Comparison of an individual subject’s SV dataset with the TV dataset which describes the planned Visits for the trial, quickly identifies missed Visits and “extra” Visits.

受试者访视域是关于受试者访视时间,综合了分散在其他包含访视变量的域中的信息。SV域记录的是受试者实际的访视情况,而TV(Trial Visit)域则记录的是计划中的访视。

必需变量:STUDYID, DOMAIN, USUBJID, VISITNUM 预期变量:SVSTDTC, SVENDTC 许可变量:SVSTDY, SVENDY, SVUPDES

VISITNUM:访视编号,用于排序;小数可用于插入非计划访视 VISIT:访视名称

VISITDY:计划访视研究日

SVSTDY:访视开始日期相对RFSTDTC的研究日 SVENDY:访视结束日期相对RFENDTC的研究日

SVUPDES(description of unplanned visit):非计划访视描述

? 非计划内访视应在SVUPDES中记录原因,VISITNUM用小数表示 ? VISITDY是一次访视的计划的研究日,非计划访视不填 ? SVSTDY是一次访视的实际的研究日,是SVSTDTC相对RFSTDTC

5. 干预类

5.1 既往和伴随用药 Concomitant Medications CM

Case report form (CRF) data that captures the concomitant and prior medications/therapies used by the subject.

必需变量:STUDYID, DOMAIN, USUBJID, CMSEQ, CMTRT

许可变量:CMGRPID, CMSPID, CMMODIFY, CMDECOD, CMCAT, CMSCAT, CMPRESP, CMOCCUR, CMSTAT, CMREASND, CMINDC, CMCLAS, CMCLASCD, CMDOSE, CMDOSTXT, CMDOSEU, CMDOSFRM, CMDOSFRQ, CMDOSTOT, CMDOSRGM, CMROUTE, CMSTDTC, CMENDTC, CMSTDY, CMENDY, CMDUR, CMSTRF, CMENRF, CMSTRTPT, CMSTTPT, CMENRTPT, CMENTPT CMSEQ:序号

CMGRPID(Group ID):组别ID,用来把一组在单独域中相关的记录捆在一起,支持域内或域间关系

CMSPID(Sponsor-Defined Identifier):申办者定义的编号,比如预先打印在CRF表上的识别符或伴随药物的行号

CMTRT(Reported Name of Drug, Med, or Therapy):药品本名 CMMODIFY:修正的药品名,为了便于编码

CMDECOD:标准的药物名称,可从词典中得到,如WHO Drug 受控术语

CMCAT:药物类别 受控术语 CMSCAT:药物子类 受控术语

CMPRESP(Pre-Specified):药物是否在CRF表上预设 受控术语(NY) CMOCCUR:预设药物是否使用 受控术语(NY)

CMSTAT:如果预测药物未使用,则CMSTAT为NOT DONE;如果使用则为空值 CMREASND:如果CMSTAT为NOT DONE,则描述原因,否则为空 CMINDC:适应症,给与药物的原因 CMCLAS(CLASS):药物类别,受控术语

CMCLASCD(CLASS CODE):药物类别代码,受控术语 CMDOSE:每次用药剂量

CMDOSEU:剂量单位,受控术语(UNIT) CMDOSFRM:剂型, 受控术语(FRM) CMDOSFRQ:期间给药频率,受控术语(FRQ) CMDOSTOT:每日总剂量

CMDOSRGM(dose regimen):计划服药方案 CMROUTE:给药途径,受控术语(ROUTE) CMSTDTC:开始用药时间 CMENDTC:结束用药时间 CMSTDY:开始用药研究日 CMENDY:结束用药时间 CMDUR:持续时间

CMSTRF(Start Relative to Reference Period):相对于RFSTDTC,受控术语(STENRF):AFTER/BEFOR/COINCIDENT/DURING/(DURING/AFTER)/ONGOING/UNKNOWN. CMENRF:类似于CMSTRF,受控术语(STENRF) CMSTTPT(Start Reference Time Point):开始参考时间

CMSTRTPT(Start Relative to Reference Time Point):相对CMSTTPT,受控术语(STENRF)

CMENTPT(End Reference Time Point):结束参考时间

CMENRTPT(End Relative to Reference Time Point):相对CMENTPT,受控术语(STENRF)

? CMDOSFRQ=PRN表示按需用药(As needed)

5.2 暴露 Exposure EX

The Exposure domain model records the details of a subject's exposure to protocol-specified study treatment.

暴露域记录了受试者于试验方案定义的研究治疗的细节。 必需变量:STUDYID, DOMAIN, USUBJID, EXSEQ, EXTRT 预期变量:EXDOSE, EXDOSU, EXDOSFRM, EXSTDTC

许可变量:EXGRPID, EXSPID, EXCAT, EXSCAT, EXDOSTXT, EXDOSFRQ, EXDOSTOT, EXDOSRGM, EXROUTE, EXLOT, EXLOC, EXTRTV, EXVAMT, EXVAMTU, EXADJ, TAETORD, EPOCH, EXSTDTC, EXENDTC, EXSTDY, EXENDY, EXDUR, EXTPT, EXTPTNUM, EXELTM, EXTPTREF

EXDOSRGM(Dose Regimen):计划治疗方案 EXLOT:批号

EXDIR(Directionality):给药部位 EXADJ:剂量调整原因

5.3 嗜好品使用 Substance SU

The intent of the domain is to capture substance use information that may be used to assess the efficacy and/or safety of therapies that look to mitigate the effects of chronic substance use.

这个域的目的是为了获取嗜好品的使用信息,可用于评估长期使用嗜好品对治疗有效性及安全性可能存在的作用

必需变量:STUDYID, DOMAIN, USUBJID, SUSEQ, SUTRT 许可变量:若干

? 如果在病例报告表内嗜好品使用信息采集超过一个,那么可加入VISITNUM

V3.2新增 Exposure as collected EC

The Exposure as Collected domain model reflects protocol-specified study treatment administrations, as collected.

EC域是EX域的补充,记录EX域中没有的一些信息。 V3.2新增 procedures PR

The Procedures domain model reflects collected details describing a subject’s therapeutic and diagnostic procedures ? 应用条件: I. II. III. IV. V.

疾病筛查 内窥镜检查 诊断试验 治疗过程 手术过程

6.2 不良事件 Adverse Events AE

The Adverse Events dataset includes clinical data describing \occurrence in a patient or clinical investigation subject administered a pharmaceutical product and which does not necessarily have to have a causal relationship with this treatment\

不良事件域包括病人或临床试验受试者接受一种药品后出现的任何不良医学事件,但不一定与治疗有因果关系。与监管部门协商后,申办者可扩展或限制不良事件采集的范围(如与试验操作相关的治疗前发生的时间,不采集与作为疗效终点的事件)

必需变量:STUDYID, DOMAIN, USUBJID, AESEQ, AETERM, AEDECOD

预期变量:AELLT, AELLTCD, AEPTCD, AEHLT, AEHLTCD, AEBODYSYS, AESER, AEACN, AEREL, AESTDTC, AEENDTC

(MedDRA)中不良事件的分类变量:

AELLT/AELLTCD/AEPTCD/AEHLT/AEHLTCD/AEHLGT/AEHLGTCD

AEDECOD(Dictionary-Derived Term):字典编码事件名称 受控术语 MedDRA AEPTCD(Preferred Term Code):最佳事件名称 受控术语 MedDRA AEHLT(High Level Term):高级别名称受控术语 MedDRA

AEHLTCD(High Level Term Code):高级别名称编码 受控术语 MedDRA AELLT/AELLTCD同上

AEHLGT(High Level Group Term)受控术语 MedDRA AEHLGTCD(High Level Group Term Code)受控术语 MedDRA AEBODSYS:系统或器官分类,受控术语

AEBDSYCD:AEBODSYS的编码,受控术语 MedDRA

AESOC(Primary System Organ Class):主要系统或器官,常与AEBODSYS相同受控术语 MedDRA

AESOCCD:AESOC编码受控术语 MedDRA AELOC:发生位置 受控术语 LOC AESEV:严重程度 受控术语 AESEV AESER:严重事件否? 受控术语 NY

AEACE(Action Taken with Study Treatment):不良事件对研究治疗的改变 受控术语 ACN

AEACNOTH:与研究不相关的措施

AEREL:治疗与时间是否存在因果关系 受控术语 AERELNST:是否与非研究治疗相关

AEPATT:不良事件模式(如间歇性,持续性等) 受控术语

AEOUT:不良事件结局 受控术语 OUT 死亡/未恢复或未解决/恢复或解决/以以恢复或解决但有后遗症/正在恢复或解决/不清楚 AESCAN:与癌症相关吗? 受控术语 NY

AESCONG/AESDISAB/AESDTH/AESHOP/AESLIFE 何种后果受控术语 NY AESOD:是否药物过量引发 受控术语 NY

AESMILE:与其他严重临床事件相关吗 受控术语 NY AECONTRT:是否给与另一种治疗 受控术语 NY AETOXGR:标准毒性等级 受控术语 可用TOXGRV3 ? 通常情况下AESEV AETOXGR只有一个存在 ? EPOCH应是不良事件开始的时期

? 没有采集关于这些事件的其他数据,如果需要则记录在FA域 6.3 处置 Disposition DS

A subject domain utilized for the submission of information encompassing and representing data, vocabulary or records related to disposition.

DS域是提供参加研究所有受试者的概况,如随机、受试者完成状态或整个研究或每个阶段或部分中止的原因,包括筛选和治疗后随访。 必需变量:STUDYID, DOMAIN, USUBJID, DSSEQ, DSTERM, DSDECOD 预期变量:DSCAT, DSSTDTC

DSDECOD:标准化的处置事件名称,受控术语 NCOMPLT

DSCAT:处置分类,受控术语 DSCAT(处置事件、方案里程碑、其他事件) EPOCH:时期,受控术语 EPOCH

? 当DSCAT为处置事件时,DSTERM为完成或当受试者未完成研究时则DSTERM

记录处置事件的确切信息。

? 当DSTERM为完成时,DSDECOD为完成,当DSTERM为确切信息时,DSDECOD

为需要选择受控术语,例如DSTERM=受试者搬家对应为DSDECOD=无法随访 ? 当DSCAT=方案里程碑时,DSTERM和DSDECOD为相同的受控术语,如获得

知情同意或随机,此时EPOCH不赋值

? 非处置或里程碑的事件为其他时间,其原因记录在DSTERM,如DSTERM=研

究者失误,DSDECOD=治疗破盲 6.4 既往病史Medical History MH

MH域包括受试者在试验开始之前的既往病史

The medical history dataset includes the subject's prior history at the start of the trial.

必需变量:STUDYID, DOMAIN, USUBJID, MHSEQ, MHTERM 其他变量

6.5 方案偏离 Deviation DV DV域是采集方案偏离的域模型

The intent of the domain is to capture protocol violations and deviations during the course of the study and will store only those criteria violation by or deviated from by the subject and not a response to each violation or deviation.

? 在受试者随机分配或第一次治疗之后发生的偏离 ? 不包括对偏离的处理 7.6 临床事件 Clinical Events CE

是获取关注的临床事件,而不被分类为不良事件。

A dataset used to capture clinical events of interest that would not be classified as adverse events

例如:在一个偏头痛的研究中,偏头痛可能不会被当作不良事件。此时偏头痛的症状和体征被记录在CE域中。 7.7 医疗经历 Healthcare Encounters HO

The Healthcare Encounters dataset includes inpatient and outpatient healthcare events (e.g., hospitalizations, nursing home stay, rehabilitation facility stays, ambulatory surgery).

如:住院,康复治疗,重症监护室,心导管室等 无特殊变量

? 原因可计入SUPPHO

Finding

7.8 心电图域 ECG test results EG

Findings related to the collection of ECG data, including position of the subject, method of evaluation, all cycle measurements and all findings from the ECG including an overall interpretation if collected or derived. EG域是指CRF上采集的心电图检查相关信息

必需变量:STUDYID, DOMAIN, USUBJID, EGSEQ, EGTESTCD, EGTEST 预期变量:EGPOS, EGORRES, EGSTRESC, EGBLFL, EGEVAL, VISITNUM, EGDTC EGPOS:体位,受控术语 POSITION

EGTESTCD:心电图检查缩写,受控术语,EGTESTCD EGTEST:心电图检查名称,受控术语,EGTEST

EGSTRESC:字符型标准结果,受控术语,EGSTRESC EGXFN:心电图外部文件名和路径 EGNAM:供应商名称

EGLEAD:测量的主要部位,受控术语 LOC

EGMETHOD:心电图检查方法,受控术语 EGMETHOD

可只采集最终解释

6.9 为符合入选标准/排除标准的记录 Inclusion/Exclusion

The intent of the domain model is to only collect those criteria that cause the subject to be in violation of the inclusion/exclusion criteria not a response to each criterion.

CRF采集的受试者未符合入选/排除标准的记录。所有违反入选/排除标准的情况都保存在该数据集中。

? 受试者由于失误而入选的也要记录 ? 不适用的IE 不用记录

? IE域反应的是违反入排标准的记录,TI数据集中记录的是protocol的入排标

? 该域应该记录决定某受试者是否进入该研究时(如:导入期结束时或随机化

前)受试者不符合入选/排除标准的情况,不能采集研究过程中/随机化 后/研究用药后出现的试验方案偏离/违背。 DV域用于递交方案偏离/违背纪录

6.3.3 实验室检查结果 LB

Laboratory test findings including, but is not limited to hematology, clinical chemistry and urinalysis data. This domain does not include microbiology or pharmacokinetic data, which are stored in separate domains.

LB域存储了CRF采集或来自中心提供者/供应商的实验室检查数据。 必需变量:STUDYID, DOMAIN, USUBJID, LBSEQ, LBTESTCD, LBTEST

预期变量:LBCAT, LBORRES, LBORRESU, LBORNRLO, LBORNRHI, LBSTRESC, LBSTRESN, LBSTRESU, LBSTNRLO, LBSTNRHI, LBNRIND, LBBLFL, VISITNUM, LBDTC LBTESTCD:实验室检查的简称,受控术语 LBTESTCD LBTESTCD:实验室检查的名称,受控术语 LBTEST

LBSTRESC:结果的标准化后,字符型,受控术语 LBSTRESC LBORNRLO:正常范围下限 LBORNRHO:正常范围上限

LBNRIND:正常范围标志 受控术语 NRIND LBSPEC:标准类型 受控术语 SPECTYPE LBSPCCND:样本状况 受控术语 SPCCOND LBMETHOD:测试或检查方法,受控术语 METHOD LBLOINC:LOINC代码,从字典得到 LBBLFL:基线标志 受控术语 NY

LBDRVFL:衍生标志 受控术语 NY 如其他记录的平均值,如为Y则LBORRES可能为空

? LBNRIND记录正常范围比较结果,临床意义记录在SUPPLB

? LBTPT为样本采集时间的描述,LBTPTREF是参照点的描述

6.3.4 体格检查 Physical Examination PE

Findings collected during a physical examination of the subject. It has findings that are discovered that are related to body systems. Does not include vital signs measurements, which are stored in the vital signs domain.

该域存储了体检的发现结果。可以是身体系统检查和某体检异常的信息。 PELOC:体检异常发现部位,受控术语,LOC

PEMETHOD:测试或检查的方法,受控术语,METHOD PEEVAL:评估人员,受控术语,EVAL 6.3.5 调查量表 Questionnaires QS

Questionnaires have a defined standard structure, format, and content; consist of conceptually related items that are typically scored; and have documented methods for administration and analysis.

受控术语:QSTESTCD, QSTEST, QSCAT, UNIT, EVAL

? 调查量表域可能包括但不限于受试者报告的结果以及验证或未经验证的调

查量表

? 单项得分测量或结果可以放在调查量表中(例如,APACHE得分,ECOG) ? 申办方应该提供元数据中验证过的调查量表的版本信息

6.3.6 受试者特征 Subject Characters SC

SC是与受试者相关的没有被采集到其它域中的数据。例如:受试者姓名英文首字母、眼睛颜色、生育状况,等。

The subject characteristics domain is for data not collected in other domains that is subject-related.

SCTESTCD:受试者特征简称,受控术语,SCTESTCD,母乳喂养、惯用手、教育情况、工作、工资、肤色等。

SCTEST:受试者特征,受控术语,SCTEST,SCTESTCD的全称 6.3.7 生命体征 visual sign VS

Measurements including but not limited to blood pressure, temperature, respiration, body surface area, BMI, height and weight.

CRF中采集的生命体征测量值,如:血压、身高、体重、脉搏、体温等测量,或由此衍生的数据如体质指数 (BMI)。

VSTESTCD:生命特征检测简称 受控术语 VSTESTCD VSTEST:生命特征检测名称 受控术语 VSTEST

VSPOS:受试者生命特征检测的体位,受控术语 POSITION VSORRESU:单位,受控术语,VSRESU

VSLAT(laterity):左右,受控术语,LAT 6.3.8 药物分发记录 Drug Accountability DA

Data regarding the accountability of study drug, such as information on the receipt, dispensing, return, and packaging.

DA是关于研究药物收发等的数据,例如:药物的接收、分发、返回和包装的信息。

? DACAT是申办者用于区分不同类型药物(例如:研究用药、急救用药和准备

用药等)的一种方法。 6.3.9 微生物学域 MB MS

6.3.10 药代动力学浓度 Pharmacokinetics Concentrations PC 必需变量:STUDYID, DOMAIN USUBJID, PCSEQ, PCTEST, PCTESTCD,PCSPEC 预期变量:PCORRES, PCORRESU, PCSTRESC, PCSTRESN, PCSTRESU, PCNAM, PCLLOQ, PCULOQ, PCDTC 许可变量:若干

PCSPEC(Specimen Material Type ):标本种类(如血清、血浆) PCSPCCND:样本状况

PCNAM:提供试验结果的实验室或供应商名称

PCLLOQ(Lower Limit of Quantitation ):量化指标的下限

PCULOQ:量化指标的上限

PCEVLINT(Evaluation Interval):评估间隔

PCTPT(Planned Time Point):样本采集时间的描述 PCTPTNUM:PCTPT的数字版本

PCTPTREF:固定的参考时间点的名称,用来与采样时间进行比较,比如用于区分服药前和服药后的采样

PCELTM(Elapsed Time):距离PCTPTREF的时间 PCRFTDTC:为PCTPTREF的具体时间

药代动力学参数 Pharmacokinetics parameters PP

? 描述PC数据(如曲线下面积、最大浓度和峰值时间-浓度曲线参数的数据) ? 所有参数的信息(如数量指数,模型加权)应在SUPPPP数据集中递交 6.3.11 死亡情况 Death Details DD

The domain is designed to hold supplemental data that are typically collected when a death occurs, such as the official cause of death. It does not replace existing data such as the SAE details in AE. Furthermore, it does not introduce a new requirement to collect information that is not already indicated as Good Clinical Practice or defined in regulatory guidelines. Instead, it provides a consistent place within SDTM to hold information that previously did not have a clearly defined home.

This domain captures information pertaining to the death of a subject, including the causes of death. There may be more than one causes. If so, these may be separated into primary and secondary causes and/or other appropriate designations. DD may also include other details about the death, such as where the death occurred and whether it was witnessed. 死亡情况记录,比如死因不止一个时,可详细记录。在其他域如SAE中也可能存在死亡记录。

6.3.12 免疫学评估 Immunogenicity Specimen Assessment IS The IS domain is intended to be used only for data collected regarding the immunogenic potential of materials under study. 免疫学检测结果,例如抗原抗体等

6.3.13 显微镜发现 Microscopic Findings (MI)

The Microscopic Findings dataset provides a record for each microscopic finding observed. There may be multiple microscopic tests on a subject or specimen. 受控术语:MITEST/MITESTCD

This domain holds findings resulting from the microscopic examination of tissue samples. These examinations are performed on a specimen, which has been prepared with some type of stain.

Tests classified as \Biomarkers assessed by histologic or histopathological examination (by employing cytochemical / immunocytochemical stains) will be stored in the MI domain. ? MIRESCAT可用于记录结果分类,如肿瘤的良恶性 ? MITSTDTL:如果使用生物标记,可用MITSTDTL说明

6.3.14 形态学发现 Morphology MO

Macroscopic results (e.g. size, shape, color, and abnormalities of body parts or specimens) that are seen by the naked eye or observed via procedures such as imaging modalities, endoscopy, or other technologies. Many morphology results are obtained from a procedure, although information about the procedure may or may not be collected.

受控术语:MOTEST/MOTESTCD/DIR/LAT/LOC/PORTOT/METHOD/EVAL

DI Domain

The example below shows a Device Identifiers (DI) domain record based on the MRI device used for the brain measurement. A prerequisite for any Device domain is that there will be at least one record in DI. The standard controlled terminology for

DIPARMCD, DIPARM, and DIVAL is represented in the table.

Device-in-Use (DU) data example related to MO results for the MRI device This example shows data from one subject collected at two visits regarding parameters from an MRI imaging protocol. DUGRPID is used to facilitate the creation of a RELREC relationship to the morphological result(s) (see table below).

6.3.15 生殖系统发现 Reproductive System Findings RP

The Reproductive System Findings domain captures all Reproductive information related to a subject.

This domain will contain information regarding, for example, the subject’s reproductive ability, reproductive history such as number of previous pregnancies and number of births, pregnant during the study, etc.” 受控术语:RPTEST/RPTESTCD

6.3.16 受试者状态 Subject Status (SS)

Subject Status is for data relating to general subject characteristics that are evaluated periodically to determine if they have changed.

Subject Status must not contain data that belong in another domain. Periodic data collection is not the sole criteria for storing data in SS. The criterion is whether the test reflects the subject’s status at a point in time. It is not for recording clinical test results, event terms, treatment names or other data which belong elsewhere 受控术语:SSTEST/SSTESTCD/SSSTRESC

6.3.17 癌症相关域 Oncology Domains: TU, TR and RS

Tumor Identification TU

The TU domain represents data that uniquely identifies tumors (i.e. malignant tumors and other sites of disease, e.g. lymph nodes). The tumors are identified by an investigator and/or independent assessor and classified according to the disease assessment criteria. In RECIST terms this equates to the identification of Target,

Non-Target or New tumors. A record in the TU domain contains the following information: a unique tumor ID value; anatomical location of the tumor; method used to identify the tumor; role of the individual identifying the tumor; and timing information.

TUTEST:Tumor Identification Test Name,受控术语,TUTEST(Tumor Identification、Tumor Merged和Tumor Split)

TUTESTCD:受控术语,TUTESTCD(TUMERGE,TUMIDENT,TUSPLIT) TUSTRESC:原始数据,数字型 受控术语,TUMEDENT TULOC:肿瘤部位,受控术语LOC TULAT:左右,受控术语LAT TUDIR:位置,受控术语DIR

TUPORTOT:部分或全部,受控术语PORTOT TUMETHOD:肿瘤诊断方法,受控术语 METHOD TUEVAL:评价者,受控术语,EVAL

TUEVALID:评估者标志 受控术语,MEDEVAL

TUACPTFL(Accepted Record Flag):如果有多人评价,TUACPTFL表明接受的是哪个评价 TU域假设

? 肿瘤位置等信息不必每次随访都记录。Post-baseline可能记录:新发肿瘤;

肿瘤split;split肿瘤合并;

? 如果只关注肿瘤的发生,则TUTEST=tumor identification;TUORRES=new,

TULNKID用于连接TR域

? 如果还关注肿瘤的解剖信息,可加入TULOC等

TR域 Tumor Results

The TR domain represents quantitative measurements and/or qualitative assessments of the tumors identified in the TU domain. These measurements are usually taken at baseline and then at each subsequent assessment to support response evaluations. A record in the TR domain contains the following information: a unique tumor ID value; test and result; method used; role of the individual assessing the tumor; and timing information. TRTEST:检测名称,受控术语,TRTEST TRTESTCD:缩写,受控术语,TRTESTCD TRMETHOD:受控术语,METHOD TREVAL:受控术语,EVAL TREVALID:受控术语,MEDEVAL

? 新增LNKID用于TR和TU域之间的连接,因为GRPID,REFID and SPID可能全

做其他用途

? TRLNKGRP用于连接TR和RS域

? 如果肿瘤太小,可用固定值5mm(基于RECIST的研究) RS域 disease response

The RS domain represents the response evaluation(s) determined from the data in TR. Data from other sources (in other SDTM domains) might also be used in an assessment of response.

受控术语:RSTEST/RSTESTCD/EVAL/MEDEVAL

? 有示例文档excel

6.4 Findings About Events or Interventions

Findings About Events or Interventions is a specialization of the Findings General Observation Class. As such, it shares all qualities and conventions of Findings

observations but is specialized by the addition of the --OBJ variable.

7. 1 试验分组 Trial Arms TA

The trial arms table describes each planned arm in the trial. An arm is described as an ordered sequence of elements STUDYID, DOMAIN

ARM:计划分组描述,分组或治疗的名称 受控术语 ARMCD:ARM的代码 TAETORD:元素顺序

ELEMENT:元素描述,受控术语 ETCD:元素代码,受控术语 TABRANCH:分叉条件 TATRANS:过渡规则 EPOCH:时期

? 分支与过渡的区别:分支就是试验中的随机分组;过渡是有条件的进展,如

如果疾病进展则过渡到随访期。

7.2 试验元素Trial Elements TE STUDYID, DOMAIN

ELEMENT:元素的描述 受控术语 ETCD:元素代码 受控术语 TESTRL:元素开始规则

TEENRL:元素结束规则 TEDUR:元素计划持续时间

? 元素之间没有间隔,一个元素结束,下一个元素马上开始 ? 元素开始和结束比较难定义

7.3 试验访视 Trial Visits TV

The Trial Visits (TV) dataset describes the planned Visits in a trial. Visits are defined as \and VISITDY.

7.4 试验疾病评价Trial Disease Assessments (TD)

The TD domain provides information on the protocol-specified disease assessment schedule, and will be used for comparison with the actual occurrence of the efficacy assessments in order to determine whether there was good compliance with the schedule. 定期疾病评估域

8.1 相关记录域 relrec 8.2 补充修饰 supp

作用:SDTM不允许增加新变量, 采集没有被列入常规域中的数据 ?

? 何时需要SUPP

? SUPP中每条记录凭借STUDYID,ROMAIN,USUBJID,IDVAR/IDVARVAL与源

纪录相连接

2. Define.xml

除了提交所有域的数据集以外,还需要提交一个文件Define.xml。Define.xml类似于域数据集的说明书,通过元数据(metadata)定义来提供每一数据集使用的所有变量的信息。元数据的定义是描述数据的数据,目的是为了定义和使用变量。

2.1 域级别的元数据

下图中展示的就是Define.xml的第一部分内容,域级别的元数据,给出提交的每个域的信息。包括以下七个属性:数据集缩写Dataset、全称(Description)、分类(Class)、结构(structure)、目的(purpose)、必须变量(Keys)、文件位置(Location)

2.2 变量级别的元数据

Define.xml中需要提交的第二部分内容是每个域中各个变量的元数据,如下图DM域。其中包括8个属性:变量名(Variable)、变量标签(Label)、必须变量编号(Key)、变量类型(Type)、变量长度(Length)、变量的受控术语(Controlled Terms Format)、变量值来源(Origin)、注释(Derivation/comment)。

? 这里的受控术语(Controlled Terminology)是指变量被控制,只能填入

相应的术语值,例如某变量的受控术语是[\\,则这个变量的取值只能是N,Y or U。 ? 变量值来源(origin)包括:

CRF:直接从CRF采集,包括印在CRF上的信息 eDT:数据通过电子数据传输而来

衍生(derived):通过算法或规则计算而来,依赖于其他数据值,实验室测试结果不算衍生的

指定(Assigned):有评估者决定的值,如用于编码的变量名 方案(Protocol):试验设计准备的材料

? 如果一个变量的值一部分记录是从CRF采集的,另一部分记录是衍生的,

则在value-level元数据显示来源具体是derived还是CRF;而在

variable-level 元数据中显示Derived,CRF。 ? 变量标签最多40字符

2.3 值级别的元数据

2.4 受控术语范围

Define.xml第四部分的内容是受控术语的取值范围,如果某个变量的值不是自由选取的,则需要在Define.xml中给出该变量的取值范围。CDSIC给出了常用

受控术语的取值。

http://www.cancer.gov/cancertopics/cancerlibrary/terminologyresources/cdisc

如果一些受控数据时来自外部的词典,比如药品的标准名称可来自WHO Drug Dictionary,则在define.xml中要给出词典名称及版本。

2.5 其他

一些变量是由其他变量衍生计算出来的,在define.xml中要给出这些变量间的关系和计算公式

Define.xml中还需要汇总各变量的注释

3. SDTM中变量可分为五种 Identifier:标识变量 Topic:主题变量 Timing:时间变量

Qualifier:修饰语变量,包括分组、结果、同义词、记录和变量修饰语

本文来源:https://www.bwwdw.com/article/x698.html

Top