话说数据库也有着重要的衡量指标,那么性能和安全绝对是重要的两大板块,在这里性能指的是处理与响应户端服务的速度,而安全则是数据完整性规则。
为啥要用索引?
我们知道,当我们用select去查询一个表内容,或者用where指定一些关键字,Oracle会遍历整个表去寻找我们的数据,不会因为where找到了数据而不继续遍历,因为Oracle不知道是否数据表后面的字段有没有我们要的数据,所以还会遍历整个表数据,那么当一个大数据文件,是非常耗时的操作,为了提高我们的检索效率,更快速更高效的去找到我们想要的数据,也算是索引设计的初衷之一。
索引怎样高效?
为什么用力了索引就会高效,那么我们一起来了解一下索引的原理把,关系型数据库每一行都会有ROWID的,那么ROWID包括该行的条件、文件中的BOLACKS等,那么说到这里大概就知道!索引建立依靠ROWID来进行的,按照索引的村存储方法有B树的,还有位图索引。个人组织语言讲解这两种类型怕误人子弟引用百度知识!
(1)B*树索引的存储结构类似书的索引结构,有分支和叶两种类型的存储数据块,分支块相当于书的大目录,叶块相当于索引到的具体的书页。Oracle用B*树机制存储索引条目,以保证用最短路径访问键值。默认情况下大多使用B*树索引,该索引就是通常所见的唯一索引、逆序索引。
(2)位图索引存储主要用于节省空间,减少oracle对数据块的访问。它采用位图偏移方式来与表的行ID号对应,采用位图索引一般是重复值太多的表字段。位图索引之所以在实际密集型OLTP(联机事物处理)中用的比较少,是因为OLTP会对表进行大量的删除、修改、新建操作。Oracle每次进行操作都会对要操作的数据块加锁。以防止多人操作容易产生的数据库锁等待甚至现象。在OLAP(联机分析处理)中应用位图有优势,因为OLAP中大部分是对数据库的查询操作,而且一般采用,所以大量数据采用位图索引节省空间比较明显。当创建表的命令中包含有唯一性关键字时,不能创建位图索引,创建全局分区索引时也不能用位图索引。
以上就是百度百科对两种结构的介绍
格式:
create index index_name on people(name)
解释:
那么index就是创建索引的关键字,这时候索引就会在表people列name上建立,会根据ROWID等信息把名字信息分块处理。
通过本人测试不贴图了,对10W条数据进行测试,普通查找的COST的为400左右,当为某一列建立索引之后,4左右,效率100倍!
DML的影响
确实在检索方面很快,但是缺点无疑暴露,不适合频繁插入,更改删除等操作,为啥啊?因为当我们插入也会对索引进行修改,那么索引中不会把你修改删除的数据从块中清理释放内存,只是打上标记,而且有时候可能会改变“颠覆”原结构,重要的是不释放空间资源,所以我们在频繁插入修改删除的表中尽量避免索引这种机制,其次在数据量少的情况下也要去避免这种机制,因为小数据还要为索引建立格外开销,本身不具备什么优势。
数据完整性(Data integrity)
索引他就简单的说完了,谈谈数据的完整性,在前面很多章节都提到过数据的完整性,我们大多数认为就是数据比较完善就是数据的完整性,其实分的很精细,数据的完整性是指数据的可靠性和精确性.
进一步的说,数据的完整性又分为实体完整性,参照完整,域完整性,用户自定义完整性四大类。
实体完整性(Entity)
简单来说,就是行的完整性,不能为空值,保证唯一性约束。那么通常用主键来保证实体的完整性,当主键有多列还会声明唯一性约束UNIQE来保证唯一标识。
参照完整性 (Domain integrity)
表与表之间的关系,对于父子表如果进行插入更新删除操作,只完成其中一个表就会破坏参照的完整性,字表为随着父表二变化,外键一般用来保证参照完整性的约束。
域完整(Referential Integrity)
域完整是指满嘴特殊的数据类型或者约束的列,比如check,not null,default等都在域完整的范围内。
用户自定义完整(User-defined Integrity)
用户自定义完整多数在用户对列中数据类型,字段的约束,比如我只想某一个字段插入什么样的内容,或者只允许插入1500元以下工资等等,根据我们的需求通过SQL语句动作得到预期的结果这个过程保证了我们自定义的完整,如CHECK检车约束的使用。
更深入的知识这里不多做分享,怕误人子弟,以上是个人参照书籍资料加上自己的理解分享给大家的知识,不足之处希望指点出一定改进!