专家在线:SQL Server的数据清理技术
网络整理 - 07-27
当涉及决策的制订的时候,数据数值的准确性就非常重要了。如果数据不准确,决策制订者就有可能作出错误的假设,这会惨重的后果。在这篇贴士中,我将会列出确保数据正确性的技术,其中包括:
· 收集的确认
· 参考的完整性
· 查询表的使用
· 平衡应用程序的逻辑
· 反复核对
· 映射表
· 概要确认
· 抽查验证
· 文档规范
· NULL值管理
· 验证逻辑
· 处理异常和补救
坚持列表:数据清洁技术
收集的确认
确保用于报告和决策目的的数据的准确性,最简单的一种方式就是确保从一开始收集的就是准确的数据。这会让系统下游的人们生活得更轻松,因为他们不需要在导入数据的过程中编写验证逻辑。你可能会遇到一些与业务有关的困难,所以要考虑如下选项:
· 验证所有输入的数据。确保它符合一组合理的规则。
· 限制数据以自由的格式进入。使用check box或者下拉列表框来选择数据。
· 决定你如何激励雇员们提供输入准确的数据。
完整性参考和约束
我很惊讶于没有使用SQL Server自带的完整性参考和约束的系统是如此之多。这些技术,在默认情况下,是确保表之间数据的准确性的一个合理方法。他们还强加了一些规则,只在一定的范围内提供准确的数据。这是查看你的数据是否是孤儿,以及是否满足业务规则的一条简单的方法。通过使用本地自带的完整性参考和约束,下游的系统就可以花更少的力气在验证依赖数据和校正违反了业务规则的数据上。