`
lizhuohuang
  • 浏览: 117602 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

数据库优化整理

 
阅读更多

非原创-------------------



速度,影响它的因数太多了,且数据量越大越明显。
1、存储
      将硬盘分成NTFS格式,NTFS比FAT32快,并看你的数据文件大小,1G以上你可以采用多数据库文件,这样可以将存取负载分散到多个物理硬盘或磁盘阵列上。

2、tempdb
      tempdb也应该被单独的物理硬盘或磁盘阵列上,建议放在RAID   0上,这样它的性能最高,不要对它设置最大值让它自动增长

3、日志文件
      日志文件也应该和数据文件分开在不同的理硬盘或磁盘阵列上,这样也可以提高硬盘I/O性能。

4、分区视图
      就是将你的数据水平分割在集群服务器上,它适合大规模OLTP,SQL群集上,如果你数据库不是访问特别大不建议使用。

5、簇索引
      你的表一定有个簇索引,在使用簇索引查询的时候,区块查询是最快的,如用between,应为他是物理连续的,你应该尽量减少对它的updaet,应为这可以使它物理不连续。

6、非簇索引
      非簇索引与物理顺序无关,设计它时必须有高度的可选择性,可以提高查询速度,但对表update的时候这些非簇索引会影响速度,且占用空间大,如果你愿意用空间和修改时间换取速度可以考虑。

7、索引视图
      如果在视图上建立索引,那视图的结果集就会被存储起来,对与特定的查询性能可以提高很多,但同样对update语句时它也会严重减低性能,一般用在数据相对稳定的数据仓库中。

8、维护索引
      你在将索引建好后,定期维护是很重要的,用dbcc   showcontig来观察页密度、扫描密度等等,及时用dbcc   indexdefrag来整理表或视图的索引,在必要的时候用dbcc   dbreindex来重建索引可以受到良好的效果。

不论你是用几个表1、2、3点都可以提高一定的性能,5、6、8点你是必须做的,至于4、7点看你的需求。










如何优化数据库的性能
     
1、 硬件调整性能
最有可能影响性能的是磁盘和网络吞吐量,解决办法
扩大虚拟内存,并保证有足够可以扩充的空间;把数据库服务器上的不必要服务关闭掉
把数据库服务器和主域服务器分开
把SQL数据库服务器的吞吐量调为最大
在具有一个以上处理器的机器上运行SQL
2、 调整数据库
若对该表的查询频率比较高,则建立索引;建立索引时,想尽对该表的所有查询搜索操作, 按照where选择条件建立索引,尽量为整型键建立为有且只有一个簇集索引,数据在物理上按顺序在数据页上,缩短查找范围,为在查询经常使用的全部列建立 非簇集索引,能最大地覆盖查询;但是索引不可太多,执行UPDATE   DELETE   INSERT语句需要用于维护这些索引的开销量急剧增加;避免在索引中有太多的索引键;避免使用大型数据类型的列为索引;保证每个索引键值有少数行。
3、 使用存储过程
应用程序的实现过程中,能够采用存储过程实现的对数据库的操作尽量通过存储过程来实现,因为存储过程是存放在数据库服务器上的一次性被设计、编码、测试, 并被再次使用,需要执行该任务的应用可以简单地执行存储过程,并且只返回结果集或者数值,这样不仅可以使程序模块化,同时提高响应速度,减少网络流量,并 且通过输入参数接受输入,使得在应用中完成逻辑的一致性实现。
4、 应用程序结构和算法
        建立查询条件索引仅仅是提高速度的前提条件,响应速度的提高还依赖于对索引的使用。因为人们在使用SQL时往往会陷入一个误区,即太关注于所得的结果是否 正确,特别是对数据量不是特别大的数据库操作时,是否建立索引和使用索引的好坏对程序的响应速度并不大,因此程序员在书写程序时就忽略了不同的实现方法之 间可能存在的性能差异,这种性能差异在数据量特别大时或者大型的或是复杂的数据库环境中(如联机事务处理OLTP或决策支持系统DSS)中表现得尤为明 显。在工作实践中发现,不良的SQL往往来自于不恰当的索引设计、不充份的连接条件和不可优化的where子句。在对它们进行适当的优化后,其运行速度有 了明显地提高!







在书写应用程序的SQL的   where子句时,注意以下几种情况:  
1、避免使用不兼容的数据类型。例如float和int、char和varchar、binary和varbinary是不兼容的。数据类型的不兼容可能使优化器无法执行一些本来可以进行的优化操作。例如:  
SELECT   name   FROM   employee   WHERE   salary   >   60000  
在这条语句中,如salary字段是money型的,则优化器很难对其进行优化,因为60000是个整型数。我们应当在编程时将整型转化成为钱币型,而不要等到运行时转化。  
2、避免对搜索参数使用其它数学操作符,如要将  
SELECT   name   FROM   employee   WHERE   SUBSTRING(id,   1,   1)   =   'B '  
SELECT   name   FROM   emplyee   WHERE   salary   *   12   >   30000  
写成为:  
SELECT   name   FROM   employee   WHERE   id   like   'B% '  
SELECT   name   FROM   emplyee   WHERE   salary   >   3000  
3、、避免使用!=或<>等这样的操作符,因为这会使系统无法使用索引,而只能直接搜索表中的数据。例如:  
SELECT   id   FROM   employeeWHERE   id   !=   'B% '  
优化器将无法通过索引来确定将要命中的行数,因此需要搜索该表的所有行。  
4、在应用程序中,保证在实现功能的基础上,尽量减少对数据库的访问次数;通过搜索参数,尽量减少对表的访问行数,最小化结果集,从而减轻网络负担;能够 分开的操作尽量分开处理,提高每次的响应速度;在数据窗口使用SQL时,尽量把使用的索引放在选择的首列;算法的结构尽量简单;在查询时,不要过多地使用 通配符如select   *   语句;尽量不要在应用中使用数据库游标,游标是非常有用的工具,但比使用常规的、面向集的SQL语句需要更大的开销;按照特定顺序提取数据的查找。
上面我们提到的是一些基本的提高查询速度的注意事项,但是在更多的情况下,程序员往往需要反复试验比较不同的语句以得到最佳方案。此外更为重要的是需要数据库管理员在数据库的服务器一端调整数据库管理系统的参数,以得到更快的响应性能。  


1   逻辑数据库和表的设计  
  数据库的逻辑设计、包括表与表之间的关系是优化关系型数据库性能的核心。一个好的逻辑数据库设计可以为优化数据库和应用程序打下良好的基础。  

  标准化的数据库逻辑设计包括用多的、有相互关系的窄表来代替很多列的长数据表。下面是一些使用标准化表的一些好处。  

A:由于表窄,因此可以使排序和建立索引更为迅速  
B:由于多表,所以多镞的索引成为可能  
C:更窄更紧凑的索引  
D:每个表中可以有少一些的索引,因此可以提高insert   update   delete等的速度,因为这些操作在索引多的情况下会对系统性能产生很大的影响  
E:更少的空值和更少的多余值,增加了数据库的紧凑性由于标准化,所以会增加了在获取数据时引用表的数目和其间的连接关系的复杂性。太多的表和复杂的连接关系会降低服务器的性能,因此在这两者之间需要综合考虑。  
  定义具有相关关系的主键和外来键时应该注意的事项主要是:用于连接多表的主键和参考的键要有相同的数据类型。  

  2   索引的设计  
A:尽量避免表扫描  
检查你的查询语句的where子句,因为这是优化器重要关注的地方。包含在where里面的每一列(column)都是可能的侯选索引,为能达到最优的性能,考虑在下面给出的例子:对于在where子句中给出了column1这个列。  
下面的两个条件可以提高索引的优化查询性能!  
第一:在表中的column1列上有一个单索引  
第二:在表中有多索引,但是column1是第一个索引的列  
避免定义多索引而column1是第二个或后面的索引,这样的索引不能优化服务器性能  
例如:下面的例子用了pubs数据库。  
SELECT   au_id,   au_lname,   au_fname   FROM   authors  
WHERE   au_lname   =   'White '  
按下面几个列上建立的索引将会是对优化器有用的索引  
?au_lname  
?au_lname,   au_fname  
而在下面几个列上建立的索引将不会对优化器起到好的作用  
?au_address  
?au_fname,   au_lname  
考虑使用窄的索引在一个或两个列上,窄索引比多索引和复合索引更能有效。用窄的索引,在每一页上  
将会有更多的行和更少的索引级别(相对与多索引和复合索引而言),这将推进系统性能。  
对于多列索引,SQL   Server维持一个在所有列的索引上的密度统计(用于联合)和在第一个索引上的  
histogram(柱状图)统计。根据统计结果,如果在复合索引上的第一个索引很少被选择使用,那么优化器对很多查询请求将不会使用索引。  
有用的索引会提高select语句的性能,包括insert,uodate,delete。  
但是,由于改变一个表的内容,将会影响索引。每一个insert,update,delete语句将会使性能下降一些。实验表明,不要在一个单表上用大量的索引,不要在共享的列上(指在多表中用了参考约束)使用重叠的索引。  
在某一列上检查唯一的数据的个数,比较它与表中数据的行数做一个比较。这就是数据的选择性,这比较结果将会帮助你决定是否将某一列作为侯选的索引列,如果需要,建哪一种索引。你可以用下面的查询语句返回某一列的不同值的数目。  
select   count(distinct   cloumn_name)   from   table_name  
假设column_name是一个10000行的表,则看column_name返回值来决定是否应该使用,及应该使用什么索引。  
Unique   values   Index  

5000   Nonclustered   index  
20   Clustered   index  
3   No   index  

镞索引和非镞索引的选择  

<1:> 镞索引是行的物理顺序和索引的顺序是一致的。页级,低层等索引的各个级别上都包含实际的数据页。一个表只能是有一个镞索引。由于 update,delete语句要求相对多一些的读操作,因此镞索引常常能加速这样的操作。在至少有一个索引的表中,你应该有一个镞索引。  
在下面的几个情况下,你可以考虑用镞索引:  
例如:   某列包括的不同值的个数是有限的(但是不是极少的)  
顾客表的州名列有50个左右的不同州名的缩写值,可以使用镞索引。  
例如:   对返回一定范围内值的列可以使用镞索引,比如用between,> ,> =, <, <=等等来对列进行操作的列上。  
select   *   from   sales   where   ord_date   between   '5/1/93 '   and   '6/1/93 '  
例如:   对查询时返回大量结果的列可以使用镞索引。  
SELECT   *   FROM   phonebook   WHERE   last_name   =   'Smith '  

当有大量的行正在被插入表中时,要避免在本表一个自然增长(例如,identity列)的列上建立镞索引。如果你建立了镞的索引,那么insert的性能就会大大降低。因为每一个插入的行必须到表的最后,表的最后一个数据页。  
当一个数据正在被插入(这时这个数据页是被锁定的),所有的其他插入行必须等待直到当前的插入已经结束。  
一个索引的叶级页中包括实际的数据页,并且在硬盘上的数据页的次序是跟镞索引的逻辑次序一样的。  

<2:> 一个非镞的索引就是行的物理次序与索引的次序是不同的。一个非镞索引的叶级包含了指向行数据页的指针。  
在一个表中可以有多个非镞索引,你可以在以下几个情况下考虑使用非镞索引。  
在有很多不同值的列上可以考虑使用非镞索引  
例如:一个part_id列在一个part表中  
select   *   from   employee   where   emp_id   =   'pcm9809f '  
查询语句中用order   by   子句的列上可以考虑使用镞索引  

3   查询语句的设计  

SQL   Server优化器通过分析查询语句,自动对查询进行优化并决定最有效的执行方案。优化器分析查询语句来决定那个子句可以被优化,并针对可以被优化查询的子句来选择有用的索引。最后优化器比较所有可能的执行方案并选择最有效的一个方案出来。  
在执行一个查询时,用一个where子句来限制必须处理的行数,除非完全需要,否则应该避免在一个表中无限制地读并处理所有的行。  
例如下面的例子,  
select   qty   from   sales   where   stor_id=7131  
是很有效的比下面这个无限制的查询  
select   qty   from   sales  
避免给客户的最后数据选择返回大量的结果集。允许SQL   Server运行满足它目的的函数限制结果集的大小是更有效的。  
这能减少网络I/O并能提高多用户的相关并发时的应用程序性能。因为优化器关注的焦点就是where子句的查询,以利用有用的索引。在表中的每一个索引都 可能成为包括在where子句中的侯选索引。为了最好的性能可以遵照下面的用于一个给定列column1的索引。  
第一:在表中的column1列上有一个单索引  
第二:在表中有多索引,但是column1是第一个索引的列不要在where子句中使用没有column1列索引的查询语句,并避免在where子句用一个多索引的非第一个索引的索引。  
这时多索引是没有用的。  
For   example,   given   a   multicolumn   index   on   the   au_lname,   au_fname   columns   of   the   authors   table   in  
the   pubs   database,  
下面这个query语句利用了au_lname上的索引  
SELECT   au_id,   au_lname,   au_fname   FROM   authors  
WHERE   au_lname   =   'White '  
AND   au_fname   =   'Johnson '  
SELECT   au_id,   au_lname,   au_fname   FROM   authors  
WHERE   au_lname   =   'White '  
下面这个查询没有利用索引,因为他使用了多索引的非第一个索引的索引  
SELECT   au_id,   au_lname,   au_fname   FROM   authors  
WHERE   au_fname   =   'Johnson '

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics