在SQL Server中谨慎导入导出大容量数据(二)

网络整理 - 07-27

  通常情况下,只有在需要大容量导入导出数据的时候才临时启用这种操作模式。为了大容量导入性能与数据库安全考虑,笔者建议建议数据库管理员可以在执行大容量导入操作之前,先将数据库改为使用大容量日志恢复模式。完成之后马上将数据库重设为完整恢复模式。

  一、 考虑是否需要先暂时删除表的索引。

  引是一种特殊的文件,在数据库中它的作用是举足轻重的。简单的来说,如果把数据库比喻成一本书的话,那么索引就好像是书的目录。索引包含着对数据表里所有记录的引用指针。索引可以提高数据库的性能,这是毋庸置疑的。但是不是在任何场合索引都可以起到正面的效果。在某些特殊情况下,其反而会降低一些操作的性能,如大容量数据的导入。

  索引可以加快数据检索操作,但它会使数据修改操作变慢。因为每次修改或者插入数据记录,索引就必须刷新一次。也就是说,插入一百万条记录,则索引就必须重新所新一百万次。可见,当大容量数据导入的时候,索引将耗费数据库大量的资源,从而降低数据库的性能。如果目的表中有索引,那么不仅会影响数据库大容量数据导入的速度,而且还会降低其他用户正常访问数据库的性能。

  为此,笔者的建议是,如果要导入的表中数据并不是很多,那么最好先删除索引来提高大容量数据导入的性能。导入之后再重新启用索引。但是,如果在需要导入的表中已经有不少的数据,而需要导入的数据可能跟已存在的数据差不多或者要少的话,那么还是不用删除索引。此时如果删除索引会起到适得其反的效果。因为数据库系统重新生成索引所需要的时间可能比大容量导入操作期间所节省的时间要更长。此时管理员删除目的表的索引就有点得不偿失了。

  二、 数据导入后即时进行数据库备份。

  同建立数据库对象一样,把大容量数据导入到数据库系统后,管理员要及时对现有的数据库进行备份。因为及时有系统大容量导入工具的帮助,这个数据导入的工作仍然是非常繁琐、耗时的。为此当大容量数据顺利导入到数据库系统之后,管理员要及时得对数据库进行备份。这里笔者要提醒大家的是,不同的操作日志模式下,其备份的方法往往是不同的。

  大容量数据导入后,管理员需要对数据库进行备份。对此笔者的建议是,如果当时管理员采用的是简单的日志恢复模式,则管理员在大容量导入操作完成后应该立即执行完整备份或差异备份(如果时间允许的话,最好还是完整备份)。而如果数据库管理员当时采用的是大容量日志恢复模式或完整恢复模式,如果时间不是很多或者怕担心完全备份会影响当时用户的访问,那么只需执行日志备份就足够了。如果数据库服务器还没有变成生产服务器(即还有没有用户在用),则还是对数据库进行完全备份保险一点。

  三、 常见的错误。

  在大容量数据导入过程中,最常见的错误大概有两个。

  一是提供文件的格式不对。如上面所说,通常情况下数据库提供的大容量导入工具不支持文本文件。为此管理员需要进行事先的转换。二是要注意隐藏字符可能带来到问题。许多软件和文本编辑器都会显示隐藏字符。这些隐藏字符通常位于数据文件末尾。在大容量导入操作期间,数据文件中的隐藏字符可能会导致一些难以预测的问题,如意外空字符错误等等。这个错误很好避免。只要数据库管理员在导入数据之前先查找并删除所有隐藏字符即可。其实,不仅在大容量数据导入过程中,还是在少量数据导入过程中,都会遇到这个问题。