如果编写高效的数据库代码

网络整理 - 07-27

作为一个.NET开发者,我们经常会发现自己置身于SQL Server查询和存储过程当中,一个很好的例子就是我最近开发的一个ASP.NET应用软件。

该软件已经开发完成并交付用户进行测试,这个软件使用了一个先有的SQL Server数据库,大部分T-SQL已经包含在预先定义的存储过程中了(也就是说,我并没有编写它们),当我把软件提交给用户的时候,他们向我抱怨了性能问题。瓶颈源于数据库层,所以我花费了大量的时间来调整T-SQL以提升性能。

在这篇文章中,我将和您共享一些在项目中发现的技巧,我使用的是SQL Server,不过很多项目对所有的数据库平台都是适用的。

难以避免

尽管大部分企业都拥有数据库管理员和开发人员,但是很难避免对SQL Server的开发,这是开发管理的迷题之一,很多数据库开发人员告诉我因为我知道软件的需求,所以由我来编写查询,尽管这种逻辑很难争辩,但是要想精通T-SQL确实非常困难,而同时作为开发者还要学习.NET平台的多个层面。但是,基本的T-SQL语言还是具有一致性的,因此,让我们来看看如何编写高效的数据库代码。

优化要点

和编写任何程序代码一样,构建T-SQL查询的方法也不止一种,以下是提升性能的一些指导方针。

WHERE语句

您应当适用WHERE语句来控制返回的数据行的数量,如果不使用WHERE语句,SQL Server会执行对整个表格进行扫描并返回所有的行(如果确实需要这样做,您可以不必适用WHERE语句,但是所有其他的情况下都要使用WHERE语句。)

您应当使用WHERE语句来支持HAVING语句,当您将GROUP BY和HAVING语句一起使用的时候,GROUP BY会将数据行分为不同的组并聚合它们的值,然后HAVING语句会剔除不需要的组。在有些情况下,您可以编写只包含WHERE和GROUP BY的语句而不需要HAVING语句。

数据列

使用星号(*)可以在查询中很容易地返回所有数据列的值,您应当只获取必需的数据行。结果集合中的数据列越少,数据量就会越少,这样网络流量的负担就会减小。性能的提升依赖于数据列的数量,所以对数据列进行限定是一种良好的习惯。

避免指针

SQL Server的指针功能可以在扫描结果中进行循环,但是这一功能的代价就是性能。指针功能对于每夜的服务器任务来讲是不错的,但是要在您的应用软件的代码/过程中避免使用指针。最好使用选择语句来返回需要的值并在客户端处理这些数据。