SDTMIG V3.2和V3.4比较:
SDTMIG V3.2:
3.2 Using the CDISC Domain Models in Regulatory Submissions —Dataset Metadata
与数据集一并递交的define.xml,描述了每一个数据集的基本属性及其natural key结构。尽管大多数的研究通常会包括DM?和基于3种general observation classes(Interventions, Events, or Findings)的安全性domains(通常包括?EX,?CM,?AE,?DS,?MH,?IE,?LB?和?VS),但实际递交哪些数据将取决于试验方案及药物监管评审委员的要求。如下面表格?3.2.1?中所描述,数据集定义元数据(Dataset definition metadata)应包括数据集文件名称、描述、位置、结构、类别、目的、关键变量(keys)及注释等内容。
如果有一个数据集中没有记录,为空(例如,小型?PK?研究中,没有受试者服用伴随药物),则该空数据集不需要进行递交,也不要在?define.xml?中进行描述。在注释的CRF?中表明只有采集到的数据才会进行递交,因而不需要在CRF上对没有记录做再次注释。
*注意:此表所示key变量只是示例。Sponsor的实际key结构可能会有所不同。**推荐使用独立的补充修饰语数据集supp--.xpt。参见章节?8.4。
3.2.1.1 Primary Keys上表列举了Sponsor递交的SDTM数据集中构成primary key的一些变量示例。由于该列的目的是帮助评审委员会(reviewers)理解数据集结构,因而Sponsor应当列出该数据集对应的所有natural keys(参见下面的定义)。这些keys用来确定记录在数据集内的唯一性,并可能定义每条记录的顺序。这些keys的名字应该与structure列中对结构的描述一致。对于所有general-observation-class domains(以及一些special-purpose domains),可以通过创建--SEQ变量及结合使用?STUDYID、?USUBJID、?DOMAIN,来确保数据记录的唯一性。在大部分domains中,?--SEQ?是包含natural key的一组变量的替代key(参见下面的定义)。在某些情况下,一个补充修饰(SUPP--)变量也可能构成某些domain里记录的natural key。关于如何呈现及其它附加信息,请参见?4.1.1.9。natural keys是(数据集中单个变量或多个变量)用来标识该数据集唯一性的一条(段?)数据(a piece of data),并将数据集内其他数据区分开。natural keys的优点是它们已经存在,并且不需要在数据集中衍生新的变量。选择natural keys的困难之一在于,任何能想到的natural keys都可能改变。因为natural keys具有特定的使用目的,只有与其相关内容一起使用时才有效,当使用需求发生变化时,natural keys也得随之变化。临床试验数据发生这种变化的一个例子是:在新研究中新收集的部位和地点数据成为key,但在以前的研究中并没有收集。
surrogate keys是单方面、人为衍生的记录标识符。surrogate keys赋值是衍生数据中的一种特殊情况,是primary key中衍生而来的那部分。surrogate key不会受到需求变化的影响。另外,由于该key只依赖于一个字段,因而比较紧凑。surrogate keys的常用方法是按某种顺序衍生整数型变量。在?SDTM?数据集中,变量--SEQ是绝大部分数据集中的surrogate key;然而,在某些情况下,--SEQ可能是natural key的一部分,它替代已存在于Sponsor数据库中的一个key(例如,一个重复的序列号变量)。此处可理解为数据集里已存在类似--SEQ的变量,故直接改名为--SEQ即可。
SDTMIG V3.4:
3.2.1 Dataset-level Metadata
注意:此表所示key变量只是示例。Sponsor的实际key结构可能会有所不同。此表中的class和展示的数据集顺序不是作为递交数据集的规范的顺序。
必须使用独立的补充修饰语数据集supp--.xpt。参见章节?8.4
更多详细内容请移步WX订阅号:CDISC_SAS 。
如有疑问,欢迎私信!