ORACLE索引聚簇表的数据加载

网络整理 - 07-27

一：首先介绍一下索引聚簇表的工作原理：

　　聚簇是指：如果一组表有一些共同的列，则将这样一组表存储在相同的数据库块中;聚簇还表示把相关的数据存储在同一个块上。利用聚簇，一个块可能包含多个表的数据。概念上就是如果两个或多个表经常做链接操作，那么可以把需要的数据预先存储在一起。聚簇还可以用于单个表，可以按某个列将数据分组存储。

　　更加简单的说，比如说，EMP表和DEPT表，这两个表存储在不同的segment中，甚至有可能存储在不同的TABLESPACE中，因此，他们的数据一定不会在同一个BLOCK里。而我们有会经常对这两个表做关联查询，比如说：select * from emp,dept where emp.deptno = dept.deptno .仔细想想，查询主要是对BLOCK的操作，查询的BLOCK越多，系统IO就消耗越大。如果我把这两个表的数据聚集在少量的BLOCK里，查询效率一定会提高不少。

　　比如我现在将值deptno=10的所有员工抽取出来，并且把对应的部门信息也存储在这个BLOCK里(如果存不下了，可以为原来的块串联另外的块)。这就是索引聚簇表的工作原理。

　　二：创建过程。

　　索引聚簇表是基于一个索引聚簇(index cluster)创建的。里面记录的是各个聚簇键。聚簇键和我们用得做多的索引键不一样，索引键指向的是一行数据，聚簇键指向的是一个ORACLE BLOCK。我们可以先通过以下命令创建一个索引簇。

　　SQL> conn scott/tiger

　　已连接。

　　SQL> desc dept

　　名称是否为空? 类型

　　----------------------------------------- -------- ----------------------------
　　DEPTNO NOT NULL NUMBER(2)
　　DNAME VARCHAR2(14)
　　LOC VARCHAR2(13)
　　SQL> create cluster emp_dept_cluster
　　2 ( deptno number(2) )
　　3 size 1024
　　4 /

　　簇已创建。

　　这个名字可以用户定义，不一定叫deptno，数据类型必须和需要使用这个聚簇的数据类型一致NUMBER(2)。在这里最关键的一个参数是size。这个选项原来告诉Oracle：我们希望与每个聚簇键值关联大约1024字节的数据(1024对于一般的表一条数据没问题)，Oracle会在用这个数据库块上设置来计算每个块最多能放下多少个聚簇键。假设块大小为8KB，Oracle会在每个数据库块上放上最多7个聚簇键，也就是说，对应部门10、20、30、40、50、60和70的数据会放在一个块上，一旦插入部门80，就会使用一个新块。存放的数据是和插入顺序相关的。