第二章
数据模型是对客观事物及其联系的描述,是记录及其联系的集合,应具有描述数据和数据联系两方面的功能,采用形式化的描述方法表达数据和数据之间的联系。数据模型表示的是数据库的框架,在该框架约束下填上具体数据才是数据库。数据库类型根据数据模型划分。数据的数据结构形式就是数据模型。
为保证数据的完整性,数据模型对数据的描述应包括)模型中包含哪些记录类型,并对记录类型进行命名;指明各个记录类型由哪些数据项构成,并对数据项进行命名;每个数据项均需指明其数据类型和取值范围。
对数据间联系的描述要指明:各个不同记录类型间所存在的联系和联系方式。
公式DM{R,L}是对数据模型的描述,其中R代表记录类型的集合,L代表不同记录类型联系的集合。公式的含义是表示了数据模型具有描述数据和数据联系两方面的功能,R是对数据的描述,L是对数据间联系的描述。
数据模型本质上是对“信息模型”的数据化表示,信息模型又称“实体联系模型”,是客观事物及其自然联系在人脑中所形成的概念。
信息来自于三个领域:现实世界、信息世界和数据世界。
在信息世界中,不论是实际存在的东西,还是概念性的东西,或是事物与事物之间的联系,一律统称为实体。不同实体是由其属性的不同而被区分的。实体和属性都有“型”和“值”之分。“型”是概念的内涵,而“值”是概念的实例。“型”表达的是个体的共性,而“值”是个体的具体内容。
“键”也称关键字,是指在实体属性中,可用于区分实体集中不同个体的那个或几个属性的组合。当有多个属性可作为键而选定其中一个时,则称它为该实体的“主键”。若在实体诸属性中,某实体虽非该实体的主键,却是另一个实体的主键,则称此属性为“外部键”。实体中每个属性,都有一个取值范围,这叫做属性的“域”。
实体间的联系分别是一对一联系(1:1),一对多联系(1:n),多对多联系(m:n)。
E-R方法,又称为实体联系表示法。
E-R图中所表示的实体及其联系,实际上是信息模型。E-R图的三大要素:属性、实体、联系。
目前,成熟地应用于数据库系统中的数据模型有层次模型、网状模型和关系模型。
层次模型用树结构表示记录类型及其联系。结构特点:有且仅有一个结点无父结点,其他结点有且仅有一个父结点。在层次模型中,上一层记录型和下一层记录型之间的联系为1:n.不能直接支持m:n联系。对于记录之间的m:n关系,可以将其转换为1:n联系。
网状模型的结构是结点的连通图,特点是:有一个以上结点无父结点且至少有一个结点有多于一个父结点。典型代表是DBTG系统。
目前,在微机上的数据库系统应用最广泛的数据模型是关系模型。关系模型的本质是一张二维表,关系模型中,一张二维表就称为一个关系。如果二维表中的数据有变化,则它的记录数改变,它的字段数相对固定。
在文件系统中,一张二维表称为一个文件,表头行称为记录型,表中其他各行称为记录,而每一列中的各元素称为一个数据项。通常在数据库中,二维表以文件的形式存储在磁盘上,一个关系就是一个文件(一张二维表)。
从E-R图导出关系模型的时候,图中的每一个实体,都应转换为关系,其中应包括对应实体的全部属性,并应根据关系所表达的语义确定哪个属性(或哪几个属性组合)作为主键。
E-R图:方框表示实体,椭圆表示实体的属性,菱形表示联系。
信息世界用语:实体集、实体、属性、实体键,在数据世界中对应:文件、记录、数据项(字段)、记录键。
以下关于数据模型的描述,A不正确。
(A)数据模型表示的是数据库本身 (B)数据模型表示的是数据库的框架
(C)数据模型是客观事物及其联系的描述(D)数据模型能够以一定的结构形式表示出各种不同数据之间的联系
下列关于实体的说法, 不正确。B
(A)实体是指现实世界中存在的一切事物 (B)实体靠联系来描述
(C)实体所具有的性质统称为属性 (D)实体和属性是信息世界表达概念的两个不同单位
实体集中,各实体值相应的属性有着B的域。(A)不同 (B)相同 (C)各自 (D)固定
综合:画E-R图,写出关系模型