《人口与健康科学数据共享服务平台资源建设工作规范》 人口与健

更新时间:2024-05-29 04:58:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

《人口与健康科学数据共享服务平台资源建设工作规范》

人口与健康科学数据共享平台

资源建设工作规范

人口与健康科学数据共享服务平台管理中心

2009年2月

第一章 总则

第一条 为规范医药卫生科学数据共享网资源建设,明确资源建设的具体内容,指导医药卫生科学数据共享网各数据中心和参与数据库建设单位进行资源规划与设计,确保专业广泛、内容丰富、存在分散、结构各异的医药卫生数据资源在专科数据库、专业数据中心和医药卫生领域共享网不同层面上一致性整合与管理,特制定本规范。

第二条 本规范是医药卫生科学数据共享资源建设的指导性文件,是资源规划与设计的基本要求,是评价资源建设实施的基本依据。

第三条 本规范适用于国家科技基础条件平台科学数据共享工程医药卫生领域科学数据共享工作范畴。目前包括基础医学、临床医学、公共卫生、中医药学四个数据中心和药学、特种医学两个主体数据库建设和相关的数据资源建设。

第四条 本规范所指共享资源包括通过长期观察、监测、检测、调查、诊断、治疗、试验、实验等业务活动获取的数据,国家长期布局获取的公益性科学数据资源,通过科学研究活动产生的数据,基于已有业务信息系统整合集成的数据,国内外各类相关数据资源经过二次开发、深加工的数据以及重要的历史资料。

第五条 本规范依据《国家科技基础条件平台建设管理办法》、《国家科技计划项目科学数据汇交暂行办法(草案)》、《科学数据共享工程管理办法》、医药卫生科学数据共享工程需求任务书、医药卫生科学数据共享网数据类标准等文件制定。

第六条 本规范适用对象为医药卫生科学数据共享网各数据中心和资源拥有单位。

第二章 资源建设的目的与内容概述

第七条 资源建设是医药卫生科学数据共享网建设的核心内容,包括资源规划、任务管理、资源设计及资源管理四部分。

第八条 资源规划的目的是为医药卫生科学数据共享网提供规范化、可持续发展的数据资源保障和服务机制。内容包括资源分类描述、

资源手册编写和现有资源调查。

第九条 任务管理的目的是为规范医药卫生科学数据共享网共享资源项目的申请、评审和验收。内容包括对共享资源项目申请、评审和验收的一致性表达和规范化操作的设计。

第十条 资源设计的目的是为了规范医药卫生科学数据共享网共享资源的组织、生产和汇交,内容包含三个层次:数据集描述规范、通用数据库设计和基于数据仓库的主题数据库设计。

数据集描述规范是资源设计中的基础设计,是基于医药卫生科学数据共享数据模式、元数据、数据资源分类与编码以及数据元标准,面向用户的个性化服务需求,以数据集为单位,提供规范化定义、设计和描述方法。

通用数据库设计是以共享网现有数据集为内容,跨越各数据中心,基于关系型数据库技术进行相关同类数据元重组,为用户提供面向应用需求的通用数据库设计与制作方法。

主题数据库设计是以共享网现有数据资源为内容,基于HL7 RIM模型和数据仓库技术,跨越各数据中心,为用户提供面向主题的资源整合设计与方法。

第十一条 资源管理与本规范第八条至第十条的一系列活动内容相对应,其目的是为了实现对规划资源、任务资源和设计资源的系统化、规范化、一致性管理,管理的内容包括存储、调用、维护。

第三章 资源建设工作流程

第十二条 资源规划是资源建设的基本内容之一,其工作流程包括对资源的分类描述、资源手册编写以及现有资源调查。

(一)资源分类描述

医药卫生科学数据分类编码方案是对医药卫生科学数据共享网进行资源手册编写、现有资源调查和共享资源发布以及目录服务提供统一、规范、系统的描述方法。

医药卫生科学数据分类编码方案的编写需根据医药卫生领域各专业科学数据内容的属性或特征,应用分类法按照一定的类别和层级进行区分和归类,在此基础上,赋予有一定规律性、计算机容易识别与

处理的编码符号。

分类编码方案由各数据中心组织本领域专家进行编写,提交共享网资源建设组汇编,通过资源组提供的分类编码字典进行录制。

(二)资源手册编写

医药卫生科学数据共享资源手册编写是资源规划的重要内容,具有对医药卫生领域数据资源进行总体描述、系统归纳、整理与汇编功能。

资源手册的编写由医药卫生共享网资源建设组统一规划设计,由资源手册编委会确定编写大纲和章节框架,以数据中心为单位分专业、按章节编写各部分具体内容。资源手册的章节编排以各专业分类标准为支撑。

各数据中心完成初稿后,将进行文稿汇总、讨论、修稿、专家函审、定稿及提交等一系列工作步骤,最终形成一套完整的医药卫生资源手册,并在医药卫生共享网上进行发布、管理和查询。

各数据中心可根据发展定期对资源手册内容进行补充和完善。 (三)资源调查

调查目的:通过对医药卫生领域现有数据资源的调查研究,掌握医药卫生领域信息资源量、共享资源域、资源共享主题以及动态增量趋势等,为共享资源任务制订和数据集遴选提供依据。

调查对象:包括各级各类医疗卫生组织和机构、医学院校以及科研院所、各级疾病预防控制机构、各级卫生监督机构。

调查内容:共享数据资源名称、资源类别、基本内容摘要、数据量、数据质量、获取方式、时间跨度、数据增量情况、共享价值(科研、教学、百姓服务、政府决策等)、数据拥有单位、管理单位、存储介质、数据库管理系统等。

调查方式:由医药卫生共享网编制统一的调查表和调查表填报程序,通过共享网用户服务栏目发布,以医药卫生科学数据共享网各数据中心为单位组织调查。

质量控制:各数据中心在进行资源调查时,须根据本规范的总体要求,结合本领域的资源情况,进行严格的质量控制。数据中心须组

织专家对各资源单位填报的资源调查表进行评价与审核。

第十三条 任务管理是资源建设的基本内容之一,包括共享网对各个数据中心的任务管理及数据中心对数据拥有单位的任务管理,其工作流程包括资源任务申请、资源任务评审、资源任务验收。

(一)医药卫生科学数据共享网对数据中心的任务管理: 共享网各数据中心在规定时间内向医药卫生科学数据共享网提交年度经科技部批准的资源建设可行性报告及资源建设子项目的任务书。

医药卫生科学数据共享网每年度根据任务书对数据中心资源建设进行评审验收。

(二)数据中心对申报单位的任务管理,包括申报单位向数据中心的任务申请,数据中心组织评审及进行数据集遴选、向申报单位的任务下达、签署协议书及任务验收等程序。

各申报单位通过医药卫生共享网下载共享资源建设项目申请书。 申报单位通过书面方式向各数据中心提交申请书。 数据中心组织对申报材料的评审,工作步骤如下: 1.各数据中心对申报材料进行汇总和整理、备案。

2.各数据中心组织专家组对申报内容进行评价,对申报材料提出评价意见及是否纳入共享的意见。

3.向申报单位反馈申报评价意见。 4.确定筛选科学数据。 任务下达的工作步骤如下:

1.申报单位根据遴选结果填写工作任务书 2.申报单位向所在数据中心提交任务书 3.各数据中心组织对任务书进行评审

4.反馈评审意见,由申报单位进行修改后返回数据中心并归档。 签订工作协议书 任务书通过评审之后,由数据中心与申报单位负责人或委托负责人签订工作协议书。

数据中心每年度根据申报单位的任务书对其任务完成情况进行检查验收。

第十四条 资源设计包括数据集规范化描述、通用数据库设计、主题数据库设计。

(一)数据集规范化描述

数据集是可以标识的围绕主题的数据集合。数据集是一个相对抽象的概念,它与具体的数据库概念不同,在科学数据共享工程中,只要满足可以进行描述、具有一定主题的数据集合就是数据集,用于数据共享的数据集是数据共享的基本内容和最小粒度。

医药卫生数据集规范化描述的目的是为各数据中心数据资源单位提供共享数据资源的规范化描述、加工和表达的方法与技术,从而生产出内容丰富、形式统一、符合科学数据共享工程标准的数据集产品,确保医药卫生科学数据共享服务的实现。

数据集规范化描述要求各个共享数据集制作单位基于科学数据具体内容的基本构成和分析共享服务需求,理清共享数据集的概念、内容、组成及其结构,再对其进行统一规范的描述和表达。

数据集规范化描述的基本内容包括资源描述、展现需求分析、数据集命名、实体设臵、实体属性设臵、实体关系定义、主键和外键定义和数据集注册等内容。

(二)通用数据库设计 (三)主题数据库设计

第十五条 资源管理的基本内容包括对科学数据的汇交、审核与保管等。

(一)科学数据的汇交包括资源制作单位向数据中心的汇交及数据中心向医药卫生科学数据共享网的汇交。

资源制作单位汇交的科学数据是指规范化制作的共享数据集和元数据;数据中心向医药卫生科学数据共享网汇交的科学数据是指资源制作单位汇交的共享数据集和元数据。

资源制作单位(数据中心)应当适时向所在数据中心(共享网)报告应汇交的科学数据,接受其审核。汇交的科学数据通过数据中心(共享网)审核后,由制作单位(数据中心)适时向所在数据中心(共享网)汇交。

(二)数据中心在完成对科学数据的审核工作后,对符合要求的出具科学数据接受凭证。各数据中心要求制作单位补充有关数据或者对汇交的科学数据作进一步说明的,制作单位应当在10 个工作日内作出补充说明。

(三)数据中心应采用现代化的手段保存科学数据。配备专门的保管人员,建立必要的规章制度,并对科学数据的安全进行定期检查。对失去保存价值的科学数据及时予以清除。

数据中心应当采取有效措施,为科学数据的保管提供必要的安全条件。依据国家秘密法属于国家秘密的科学数据应当采取特殊的保管措施。

(四)数据中心自收到汇交的科学数据之日起30个工作日内予以公开。保护期内的科学数据,只公开科学数据目录。制作单位书面同意提前公开汇交的科学数据的,自其同意之日起,由数据中心予以公开。

共享网完成对数据中心汇交的科学数据后,在共享平台上予以公开。

第四章 资源建设标准化规范

第十六条 资源建设过程中需要遵循的标准包括: 1.医药卫生科学数据分类与编码方案; 2.医药卫生科学数据模式标准;

3.医药卫生科学数据元标准化原则与方法以及医药卫生数据元目录;

4.医药卫生科学数据元数据标准。

第十七条 各数据中心遵循《医药卫生科学数据分类与编码方案》,对本专业的数据资源进行分类描述。

第十八条 数据集规范化设计与制作的基本方法遵循《医药卫生数据模式标准》。

第十九条 数据集实体属性的描述遵循《医药卫生数据元标准化的基本原则和方法》,从数据元的标识、定义、关系、表示及管理五类22个基本属性出发,规范实体属性。

第二十条 数据集基本内容的描述及注册遵循《医药卫生元数据标准》。

第五章 资源建设组织与实施

第二十一条 各数据中心要有专门人员负责医药卫生科学数据共享资源建设工作。专职人员配臵结构要合理,要由具备本专业知识、标准化知识、计算机知识及相关业务知识的人员组成,根据工作需要参加技术培训。

第二十二条 数据中心和资源制作单位的分工和职责明确。 数据中心的职责如下: ? 项目的可行性论证; ? 向科技部进行共享项目申请;

? 组织共享项目申请书、任务书的编写与申报; ? 负责数据管理;

? 负责共享数据的调度及对数据制作单位进行审核; ? 元数据审核、发布、维护; ? 技术指导与培训;

? 组织提交科技部的考核资料,接受科技部的考核。 资源制作单位的职责如下: ? 向数据中心进行共享项目申请;

? 组织共享项目申请书、任务书的编写与申报; ? 共享数据集、通用数据库及主题数据库的制作; ? 元数据注录、初审及复审; ? 科学数据的定期更新和维护;

? 组织提交数据中心的考核资料,接受数据中心的考核。

第六章 附则

第二十三条 本规范由 负责解释。

第二十四条 本规范自 年 月 日起执行。

本文来源:https://www.bwwdw.com/article/5du7.html

Top