使用Access 2007进行数据挖掘
什么是数据挖掘
专家会告诉你,数据挖掘是使用自动化技术在企业斥资获得的数据库中建立有用的趋势/信息。一旦得到了,这个信息就会被用来改进商业操作或制定更好的商业决策。涉及的技术有很多,包括联合分析、集群、分类、模糊逻辑、神经网络和数据清理等。然后这些技术与可视化工具联系在一起,这些可视化工具包括报表、图表、OLAP和其它的工具。
有专家来进行数据挖掘是很好,但是其它人群(占99%),那些既不懂数据挖掘又没有时间和资金来获得专业数据挖掘工具用于他们的数据库的人们该怎么办呢?他们能够做什么?
为什么不使用流行的Microsoft Access工具而不是新工具来探究我们的数据库呢?首先,Access与Microsoft Office/Excel中的图表工具紧密集成在一起(见图1)。Access所使用的图表工具和Excel所使用的工具很类似;主要的不同是Access使用查询而Excel使用单元。其次,Access支持工业级SQL查询,并且其通过Links可以被任何种类的数据库——从文本文件、电子数据表、SharePoint Lists、SQL server、Oracle、MySQL等等——当作一个客户端应用程序。在它之上,设计良好的表单和VBA可以帮助你建立一个界面,从而为你的用户提供便利,使得他们能够开始靠他们自己研究他们的数据。
在Access 2007中有一些创新,这些创新将帮助人们探究他们的数据。这包括在Access 2007和Excel 2007中的非常类似的数据过滤界面;在用户界面上透视图、透视表是非常有用的,而交互过滤器现在在Access报表中也可以使用了。
图4 – 添加一个Totals记录到一个Access查询中会降低对额外报表或复制到Excel的需求
将你的查询转换成数据透视表用于更深入的研究
在Access的之前版本中,当你查看一个查询中的数据时,你在查询界面中处理排序和过滤之外就几乎什么都不能做了。在Access 2007中,你现在可以将这个查询转换成一个直接的交互透视网格视图,它具有大量更进一步的数据探究选择。如果你看了图5,你会看到当你按这种方式浏览查询时你所得到的界面。此外,当你从一个普通查询视图转到一个数据透视表视图时,你所使用的过滤器仍然在使用。
图5 – 在数据透视表视图中浏览查询
将你的查询转换成数据透视图表用于更深入的研究
像直接以数据透视表的方式来查看查询一样,你可以以数据透视图表的方式来查看它们,并使用和数据透视表相同的字段和过滤界面。同时这也是一个有用的工具,它要求用户了解查询,从而确保将要提取出来的数据是适用于这个图表视图的。所以如果有了解数据库模型的Access专家坐下来与图表用户一起确认他们在以正确的方式来获取信息,那么这是很好的。通常只要有一两个好的示例就足够激发管理层用户的创造性了。此外,如果你告诉管理层用户数据透视视图使用起来是和Excel透视一样的话,他们会很振奋的。
图6 – 在数据透视图表视图中查看图表形式的查询
注意,你可以合并透视到表单和报表中作为子报表,但是你需要设置这个子报表的默认视图属性为正确的视图并允许这种类型的视图。
在使用中过滤报表
在Access 2007中,现在报表可以在它们将要显示时被过滤;这使得你可以使你的报表更加强大而几乎不用做什么修改。要这么做,你可以通过右键单击报表中的一个字段来采用这些过滤选项(它们使用起来就像查询一样),如图7中所做的。
图7 – 通过过滤一个Access 2007报表来探究数据
Microsoft Graphs
现在,你探究数据的最后一个方法是要使用Microsoft Graph,而这是更加专业的编程人员的领域。使用MS Graph,当你有大量数据时,要查看各个记录的数据是不太实际的。所以对于MS Graph对象,你将几乎总是对二维图形和交叉表查询使用合并查询(group by),这使得你可以以三维形式显示数据。
举例来说,这个合并查询计算了美国的按月瓶装销售,这个查询可以被用来给一个Microsoft Graph提供记录来源。
SELECT Format([SalesDate],"mmmm") AS Months, Sum(Sales) AS SumSales
FROM zWorld_Demo
WHERE (((Region)='The Americas') AND
((ProductName)='Bottled Water'))
GROUP BY Format([SalesDate],"mmmm");
总结 – 那么你可以怎样开始探究你的数据库呢
对于专家来说,要使这些工具工作起来的窍门是理解数据模型,建立适当的查询并将它们安装到用户界面中。对于管理层用户来说,窍门可能就是使开发人员对一个类似的查询建立正确工具的一个良好示例,然后使用它作为一个原型来探究你的数据。无论你的方法是什么,你在看过这些选择之后都会同意Access 2007为数据挖掘业余爱好者添加了一些很酷并有用的工具