后台遍历一个HTML页面
网络整理 - 07-26
前几天写一个程序,需要后台遍历一个动态生成的页面,找寻特定节点于是写了以下代码:
public class HtmlReader
{
public HtmlReader()
{
}
///
/// 搜索特定标记的节点
///
///
///
/// 返回属性值数组
public static ArrayList SearchAttributes(string inMarkup, string KeyWord, string AttrName)
{
IHTMLDocument2 doc = new HTMLDocumentClass ();
doc.write (new object [] {inMarkup});
doc.close ();
ArrayList searchList = new ArrayList();
foreach(IHTMLElement el in (IHTMLElementCollection)doc.body.all)
{
if(el.tagName.ToLower() ==KeyWord)
{
string src=el.getAttribute(AttrName,0).ToString();
//src=src.Remove(0,src.LastIndexOf("/")+1);
searchList.Add(src);
}
}
return searchList;
}
}