布条百科 - 专业百科知识分享的网站 手机版
首页 > 生活 >

数据集是什么? 信息集成平台之数据集

50次浏览     发布时间:2024-02-04 11:41:11    

摘 要

数据集是信息集成平台标准化管理中重要的一个组成部分,它是信息集成平台交换标准形成的基础、是数据中心物理模型的构建基础、是数据中心自动化数据存储的基础、是数据共享的基础。本文从数据集的生成方法、数据集校验机制、数据集在交换和存储及共享使用方面进行全面的论述,让大家对数据集有更加清楚的认识,同时希望本文有价值内容可以服务于工程实践。

关键词集成平台;数据集;过程集

正文

1、 引 言

数据集(Data set)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。

上面是数据集的通用定义,本文中数据集是指某一类业务所涉及的数据集合,它包括两个方面的内容:数据集结构定义、数据集携带内容。这里以表结构来对数据集进行解释,数据集结构定义可以理解了表结构定义;数据集携带内容可以理解了表中的数据。但数据集结构定义与表结构定义有区别:

1、 一个数据集可以包括多个子集:如果检验报告至少会涉及到检验报告基本信息数据

集与检查报告明细项目结果信息数据集;

2、 多个子集之间有一种约束关系对其进行关联:检验报告基本信息数据集与检查报告

明细项目结果信息数据集是通过检验报告单号进行关系;

2、数据集有过程集的概念:如检验申请单医师开出来后,护士校对、采集标准、送检验等过程是检验申请单真正生效前的一些过程信息,是对检验申请单的补充与完善信息,这种业务环节中用到的数据集在本文中定义过程集。

2、 数据集定义

战略数据规划假设如下:任何一个组织都有10几个以上的业务域、任何一个业务域中都会涉及10几个以上业务流程、任何一个业务流程都涉及到10几个以上的流程节点。每个业务节点(除首尾结点)都是承上启下的环节,上一节点输出就是下一节点输入,这种输入输出所涉及到的内容实际上是我们要定义的数据集。通过业务场景下表现为一个申请单、一个报告单或一个采购计划。

根据对于业务节点输入输出的数据项进行梳理,能得到各种数据项的分类及相关属性信息:数据项的分类为数据集的子集定义形成基础;数据项属性信息为数据集中数据元定义奠定基础。

一个完整的数据集(除过程集、主数据集外)应该满足以下的四个要素:

以检验报告为例:时间有申请时间、上机时间、报告时间、审核时间、打印时间;地点:病人住院科室、病人住院病区、检验科室;人物:病人、开立医师、医嘱审核护士、标本采集人员、送检人员、接收人员、上机人员、报告人员、审核人员;事件起因开立开立单信息,结果为检验明细项目结果信息等。

3、 数据集在交换与共享体系中作用

信息集成平台以数据集为基础,可以形成第三方系统接入平台的接入规范,根据实际的

接入场景可以分:

1、发布规范:第三方系统调用此规范实现消息发布给平台;

2、订阅规范(拉模式):第三方系统采用此规范通过定时拉取的方式获取平台给出的消息;

3、订阅规范(推模式):第三方系统通过实现此规范,把获取数据的服务接口注册到平台中,当平台有此系统的订阅消息,通过实时推送的方式把消息给到此系统。

4、共享数据规范:第三方系统实现此规范,可以获取一个时期内的某类数据;

5、同步消息规范:第三方系统实现此规范,可实现两个不同的系统同步的获取消息。

4、 数据集在数据中心构建中作用

信息集成平台以数据集为基础,可以生成相应的物理存储模型。数据集有数据项,每个数据项都定义了数据类型、长度、精度;同时数据集上有业务主键的定义,数据集中子集之间定义了约束,这个可以理解为数据结构中的概念模型,通过与实际的数据库结合就可以生成数据库的物理模型。

通过数据集形成的系统交换规范,第三方系统采用这个规范通过XML、JSON的格式发布给信息集成平台时,平台可以理解发布出来的数据的结构与含义,平台接收到这类数据后,这些数据进行解析、转换,进行数据的自动化存储形成动态的数据中心。

5、 过程集

过程集是一种特殊的数据集,是以数据集为基础的虚拟的数据集,普通的数据集可以生成物理模型,并且在交换过程中能自动化进行业务数据的存储;过程集没有这个特性,他依附于某个数据集,只对某个过程所产生的信息感兴趣,如检验标准采集这个过程,它只关心某个检验申请单的标本采集时间、申请单状态、采集人员,所以过程集不会产生新的一份数据,只会影响它所依附的数据集的状态信息及过程信息。

过程集完善的是已有数据集的过程与状态信息,不会产生一份新数据,在业务流程分析时,以下业务流程节点:如审批环节、取样环节、报告环节、审批环节所产生的信息都可以定义为过程集。

6、 主数据集

主数据集是一类特殊的数据集,主数据是指支撑业务系统核心的基础数据,如科室、人员、药品、ICD等,这些数据集在定义时要充分、完整,考虑到这种业务系统的需要。

主数据管理采用以下原则进行:

1、 有信息系统支撑的主数据:采用主数据管理科室作为主数据进行定义、管理、分发;

2、 没有信息系统支撑主数据:有相对完善的系统对主数据进行管理的,选取这类系统

作为主数据定义、管理、分发的系统;没有相对完善的系统对主数据管理的,由平台对这些主数据进行定义、管理、分发。

相关文章

玩游戏闪退怎么办 ?几种常见闪退现象解决方法

问:卡牌大师游戏闪退怎么解决?答:游戏闪退无非就是内存不足的问题,通常情况下,内存不足就会出现游戏闪退。这个时候将不用的程序清理掉,就可以玩了。当然也会出现因游戏文件包损坏,导致游戏闪退弹出。这种情况一般都是非法安装外挂和辅助造成的,所以建议大家不要用辅助等类型的第三方软件。以上就是常见的二种现象,

2024-11-22 10:29:28

这才是麻叶的正确做法,又薄又香又酥脆,快试试吧!

炸麻叶儿是我们北方的传统特色小吃,小时候逢年过节、家家户户都会预备一些,焦香酥脆、越嚼越香,可是那时候最好的零食。现在生活条件好了,各式各样的零食应接不暇,眼看着这些传统的、经典的小吃逐渐淡出了大家的视野,着实觉得有些可惜。今天,我就把这款地道的、河南特有的、酥的直掉渣的炸麻叶做法,再给大家分享一遍

2024-11-22 09:35:04

机械表哪个牌子好?几百万的手表就一定好吗?

最近发现,越来越多的人开始喜欢机械手表了。相比石英手表,机械手表虽然更贵,但是也更有质感和品味,也是不争的事实。相信很多越来越喜欢机械表的人都是认定了这个理儿。其实,我们常听说的一些大牌钟表,都是以机械手表见长,甚至有不少大牌手表都没有石英手表,比如朗格、宝玑等。论知名度和影响力,以下这些机械手表比

2024-11-22 09:19:48

生的青芒果怎么吃 ?

用料青辣椒一根 红萝卜一根 生芒果一颗 盐渍话梅3粒切丝 日本话梅片6片切丝 备用 柠檬汁适量 矿泉水适量 少许盐 糖 太太乐鸡汁适量调一个咸鲜口 好了… 做法步骤1、买一个芒果准备学做牛肉芒果条菜的…2、切开一看 哇~生的 …3、只能改菜了 凉拌吧 红萝卜切丝 青椒切丝 盐渍话梅切丝(切出来成粒了

2024-11-22 09:04:05

这才是素丸子汤最简单的做法,温阳洗肠,赛过排骨汤

传说东汉刘秀在未登大宝前有过一段很落魄的日子,亏得一位农村老汉割了一种野菜给刘秀充饥,刘秀吃后觉得甚是美味,便给野菜起了“救菜”的名字。此菜就是现在的韭菜,古语有云:“春初早韭,秋末晚菘”,意思是初春时刻,在经历过一个寒冬的缓慢生长后,是韭菜最为鲜嫩完美的一段时间,晚秋次之,夏天味道最差,所以各位碰

2024-11-22 08:49:26

炖丸子汤的家常做法分享,营养开胃,孩子特别爱吃

今天来跟大家分享一个洋葱肉丸汤的做法,这样做出来的肉丸子非常好吃,比较鲜嫩,一点也不柴,爽滑可口,而且汤汁喝起来特别鲜美,光看着就让人特别有食欲,而且它的营养特别丰富。这道洋葱肉丸汤的做法是比较简单的,很容易就能够做出来,非常适合在夏天食用。如果家里有小朋友,那么经常给它吃这样的洋葱肉丸汤,可以起到

2024-11-22 08:34:03