用ASP实现对Web搜索引擎IndexServer的访问
网络整理 - 09-16
摘要:Index Server是专门为企业Web网站设计的专业搜索引擎,传统的访问方法HTML/IDQ/HTX由于固有的特性,缺乏灵活性。本文介绍用ASP实现对Index Server访问的两种方法,以及如何实现复杂查询,和对查询结果的控制。 关键字:Index Server ASP ADO
在电子商务方兴未艾的今天,企业上网不但是为了展示企业形象,提高知名度;也意味着无穷的商机与财富。而内部网Intranet则为企业带来了全新的沟通方式和管理理念。因此构建企业Web站点已经排上了许多企业信息部门的日程。Web的优点在于可以方便的展示大量信息,但同时也带来了信息的泛滥使得寻找有效信息非常困难。为此,好的企业网站都拥有强大的搜索引擎,使得网站更加友好和便利。对于有政策法规、合同定单等大量文档上网的企业网站,信息搜索的服务必不可少。
Index Server是专门为企业网站设计的专业搜索引擎,利用它可以非常轻松的在网站中加入功能强大的信息搜索功能。并且Index Server搜索的文件不局限于HTML格式,还支持TXT、DOC、EXL、RTF、GIF、JPEG等多种文件格式,并可以通过插入第三方插件来支持更多的文件格式。搜索范围可以是存放在本地服务器中的内容,也可以是网络中其他机器的共享资源,包括INTERNET中的资源。搜索时除了文档中的关键字词以外,还可以就文件大小、修改日期、作者等属性进行搜索。此外Index Server还支持英文、简体中文、德语、法语、日语等语种,无须编程,就可在网站中实现多语种的搜索引擎。由于Index Server是零维护设计,故只需启动Index Server服务,搜索引擎就会自动运行。而在Web服务器端,需要加入与Index Server连接的页面。
传统Index Server的工作过程由浏览器通过HTML文档的FORM表单向Web服务器发出请求开始,Web服务器通过一个类似于数据库接口的专用文件.IDQ与Index Server连接,将客户的请求转换成Index Server理解的语句。Index Server再将查询结果按照模板文件HTX定义的格式组织成HTML文档,通过Web服务器返回给浏览器。这种方式称为HTML/IDQ/HTX方式,需要三个文件配合完成查询。使用这种方式不能对查询结果进行处理,并且模板文件HTX格式单一。因此微软在Index Server 2.0 中加入了对Active Server scripts的支持,用一个ASP文件替代先前的三个文件。由于ASP有灵活且功能强大的脚本语言操纵,因此Web开发者可以设计条件复杂的查询,并能更加精确的处理查询结果。
图1.ASP访问Index Server工作过程
熟悉Index Server 1.0 或 1.1版本的用户,可以在ASP文件中使用Index Server query object,对象参数和查询语句都和传统的.IDQ文件保持一致。此外,还可以利用ADO 技术创建对象,用标准数据库查询语言Structured Query Language (SQL)语句定义查询。两种对象都以ADO记录集(Recordsets)的形式返回结果。因此对于数据库Recordset操作的代码可以直接用于查询结果。
ASP文件要完成查询,首先要在文件中定义一个表单用于接收查询要求,表单的动作指向ASP文件本身。本例中用名为SearchString的文本框接收查询字段。
eg.1 在sample .asp文件中定义查询表单
<FORM ACTION = "sample .asp" METHOD="GET">
<TABLE >
<TR>
<TD>输入欲搜索关键词:</TD>
</TR>
<TR>
<TD><INPUT TYPE="TEXT" NAME="SearchString" SIZE="40" VALUE=""></TD>
<TD><INPUT TYPE="SUBMIT" VALUE="GO"></TD>
</TR>
</TABLE>
接下来在ASP文件中建立Index Server 查询对象,并为Index Server 参数赋值。
方法1.利用Index Server query object和参数
<%
Set Q= Sever.CreatObject(“ixsso.Query”) ‘创建查询对象
Set Util= Sever.CreatObject(“ixsso.Util”)
Q.Query= Request(“SearchString”) ‘查询字段
Q.SortBy=”rank[d]” ‘按照符合程度降序排列
Q.Columns=”DocTitle,vpath,filename,size,write,characterization,rank”
‘返回记录属性
Q.MaxRecords=300 ‘最多返回记录数
Util.AddScopeToQuery Q,”/”,”DEEP” ‘搜索所有子目录
Q.LocaleID=Util.ISOToLocaleID(“ZH-CN”) ‘指定所用语言为简体中文
Set RS = Q.CreateRecordSet("nonsequential") ‘创建输出集
%>
方法2.利用ADO query object和SQL语句
<%
Set Conn = Server.CreateObject("ADODB.Connection")
Conn.ConnectionString = "provider=msidxs;"
Conn.Open
Set AdoCommand = Server.CreateObject("ADODB.Command")
Set AdoCommand.ActiveConnection = Conn
AdoCommand.CommandText = "Select DocTitle,vpath,filename,size,write,”&
“characterization,rank FROM SCOPE() WHERE CONTAINS (’”&
SearchString &”’) ORDER BY rank DESC”
Set RS = Server.CreateObject("ADODB.RecordSet")
RS.open AdoCommand
%>
创建包括文件大小、作者等属性的复杂条件的查询,可在表单中加入输入相应限定条件的域,如图2所示。
图2.带限定条件的复杂查询表单
提交表单后各值由Query语句接收,如以下一个Query语句:
Q. Query=“ (@DocAuthor ”+ DocAuthorRestriction +“) & (@Write >” +
FMModDate + “) & (@Size ”+ FSRest + FSRestVal +“) & @Contenets”+
SearchString
其中,DocAuthorRestriction、FMModDate、FSRest、FSRestVal、SearchString分别代表浏览器端输入的作者、修改时间、比较符号、比较大小和关键字词等值。此外Index Server还支持自然语言查询(Free Text Queries),如可输入语句:“怎样使用Index Server管理工具?”。并在Query字段中添加标记$ Contenets。Index Server将进行语法分析,自动生成查询语句。
如前所述,两种查询对象返回的结果都是ADO记录集(Recordsets),因此可以用数据指针来操作输出。
eg.2 在sample .asp文件中定义输出格式
<% if Not RS.EOF %>
<table border=0>
<colgroup width=105>
<% end if %>
<% Do While Not RS.EOF %>
<tr>
<td valign=top >
<a href="<%=RS("vpath")%>" ><%= Server.HTMLEncode( RS("filename") )%>
</a></td>
<td valign=top>
<%if VarType(RS("characterization")) = 8 and RS("characterization") <> "" then%>
<b><I>摘要 </I></b><%= Server.HTMLEncode(RS("characterization"))%>
<%end if%>
<p><a href="<%=RS("vpath")%>" ><%=Request("server_name")%>
<%=RS("vpath")%></a></p>
</td>
</tr>
<%
RS.MoveNext
Loop
%>
</table>
根据需要,还可以输出作者、文件大小、创建时间等属性。比较常见的还有把文件符合查询的程度划分为五个级别,分别用不同数目的星图标识,这是传统的HTX文档无法实现的功能。
结合ASP和 Index Server,我们可以开发出功能强大的搜索引擎应用。实施简单方便,没有特殊的编程要求,并且搜索的速度和准确度也比较理想,非常适合企业级Web网站采纳。