一般来说,物理设计的主要工作步骤包括确定数据分布、存储结构和访问方式。
工作步骤 | 说明 | |
1 | 确定数据分布 | 确定数据是集中管理还是分布式管理(主流) |
(1)根据不同应用分布数据。将与某应用相关数据存储在相应场地,对于应用多个场地的业务,可以通过网络进行数据处理。 (2)根据处理要求确定数据分布。不同的处理要求,使用频度和响应时间要求不同。高频和实时响应数据应存储在高速设备上。 (3)对数据分布存储必然导致数据逻辑结构变化。要调整关系模式,回到数据库逻辑设计阶段做必要修改。 | ||
2 | 确定数据的存储结构 | 存储结构:指数据文件中记录之间的物理结构 在文件中,数据是以记录为单位存储的,可以采用顺序存储、哈希存储、堆存储和B+树存储等方式。 要根据数据的处理要求和变更频度选定合理的物理结构。 为提高数据的访问速度,通常会采用索引技术。 在物理设计阶段,确定数据库文件的索引字段和索引类型。 |
3 | 确定数据的访问方式 | 数据访问方式由其存储结构所决定。 数据库物理结构由存储记录格式、记录在物理设备上的安排及访问路径(存取方法)等构成。 |
(1)存储记录结构设计。存储记录结构包括记录组成、数据项类型、长度和数据项间的联系,以及逻辑记录到存储记录的映射。 数据项的被访问频率很不均匀(80/20规则:从数据库中检索的80%的数据由其中的20%的数据项组成) (2)存储记录布局。即确定数据的存放位置。采用聚簇功能可以提高按聚簇码进行查询的效率。聚簇可用于单个关系或者多个关系。 建立聚簇索引的原则: 1、聚簇码的值相对稳定(修改少) 2、应用的表主要用于查询 3、对应每个聚簇码值的平均元组数适当 (3)存取方法设计。存取方法是为存储在物理设备(外存)上的数据提供存储和检索的能力。存取方法包括存储结构和检索机制两部分。 1、存储结构限定可能访问的路径和存储记录; 2、检索机制定义每个应用的访问路径。 | ||
建立和改善存取路径的方法是建立索引 1、确定关系的存储结构 2、确定不宜建立索引的属性或表(小表、更新频繁、属性值少、过长属性、特殊数据类型属性、不出现或少出现在查询条件中属性) 3、确定宜建立索引的属性(主外码、只查只读、范围查询、聚集函数(Min、Max、Avg、Sum、Count)或需要排序输出的属性) 注意: 1、索引一般需在数据库运行测试后,再加以调整。 2、不能对进行频繁存储操作的关系建立过多索引 |