C# HTML解析工具HtmlAgilityPack使用实例(一)
2021-05-31 12:02
标签:字符 方便 pen 使用详解 lang 文档 enc hive line XPath简明介绍 例如有下面一段XML:一、生成HTML字符串
//生成DOM字符串结构
HtmlNode container = HtmlNode.CreateNode("");
HtmlNode title = HtmlNode.CreateNode("");
title.InnerHtml = "张三丰";
HtmlNode link = HtmlNode.CreateNode("");
link.InnerHtml = "点击进入";
link.SetAttributeValue("href", "http://wwww.gongjuji.net");
container.AppendChild(title).AppendChild(link);
Console.WriteLine(container.OuterHtml);
二、解析HTML字符串或本地html文件
//解析html 字符串或者本地html文件
HtmlDocument doc = new HtmlDocument();
string html = "
Hello
三、解析处理结合XPath使用更加方便
XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。
下面列出了最有用的路径表达式:
nodename:选取此节点的所有子节点。
/:从根节点选取。
//:从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
.:选取当前节点。
..:选取当前节点的父节点。
"1.0" encoding="utf-8"?>
Articles>
Article>
Title>在ASP.NET中使用Highcharts js图表title>
Url>http://zhoufoxcn.blog.51cto.com/792419/537324Url>
CreateAt type="en">2011-04-07price>
Article>
Article>
Title lang="eng">Log4Net使用详解(续)title>
Url>http://blog.csdn.net/zhoufoxcn/archive/2010/11/23/6029021.aspxUrl>
CreateAt type="zh-cn">2010年11月23日price>
Article>
Article>
Title>J2ME开发的一般步骤title>
Url>http://blog.csdn.net/zhoufoxcn/archive/2011/06/12/6540223.aspxUrl>
CreateAt type="zh-cn">2011年06月12日price>
Article>
Article>
Title lang="eng">PowerDesign高级应用title>
Url>http://zhoufoxcn.blog.51cto.com/792419/166415Url>
CreateAt type="zh-cn">2007-09-08price>
Article>
Articles>
针对上面的XML文件,我们列出了带有谓语的一些路径表达式,以及表达式的结果:
/Articles/Article[1]:选取属于Articles子元素的第一个Article元素。
/Articles/Article[last()]:选取属于Articles子元素的最后一个Article元素。
/Articles/Article[last()-1]:选取属于Articles子元素的倒数第二个Article元素。
/Articles/Article[position() //title[@lang]:选取所有拥有名为lang的属性的title元素。
//CreateAt[@type=‘zh-cn‘]:选取所有CreateAt元素,且这些元素拥有值为zh-cn的type属性。
/Articles/Article[Order>2]:选取Articles元素的所有Article元素,且其中的Order元素的值须大于2。
/Articles/Article[Order
C# HTML解析工具HtmlAgilityPack使用实例(一)
标签:字符 方便 pen 使用详解 lang 文档 enc hive line
原文地址:https://www.cnblogs.com/cuihongyu3503319/p/11025221.html
文章标题:C# HTML解析工具HtmlAgilityPack使用实例(一)
文章链接:http://soscw.com/index.php/essay/89737.html