经常在工作中会使用到XPath的相关知识,但每次总会在一些关键的地方不记得或不太清楚,所以免不了每次总要查一些零碎的知识,感觉即很烦又浪费时间,所以对XPath归纳及总结一下。
在这篇文章中你将能学习到:
XPath简介
XPath 路径表达式详解
XPath在DOM,XSLT及XQuery中的应用
XPath简介
XPath是W3C的一个标准。它最主要的目的是为了在XML1.0或XML1.1文档节点树中定位节点所设计。目前有XPath1.0和XPath2.0两个版本。其中Xpath1.0是1999年成为W3C标准,而XPath2.0标准的确立是在2007年。W3C关于XPath的英文详细文档请见:http://www.w3.org/TR/xpath20/ 。
XPath是一种表达式语言,它的返回值可能是节点,节点集合,原子值,以及节点和原子值的混合等。XPath2.0是XPath1.0的超集。它是对XPath1.0的扩展,它可以支持更加丰富的数据类型,并且XPath2.0保持了对XPath1.0的相对很好的向后兼容性,几乎所有的XPath2.0的返回结果都可以和XPath1.0保持一样。另外XPath2.0也是XSLT2.0和XQuery1.0的用于查询定位节点的主表达式语言。XQuery1.0是对XPath2.0的扩展。关于在XSLT和XQuery中使用XPath表达式定位节点的知识在后面的实例中会有所介绍。
在学习XPath之前你应该对XML的节点,元素,属性,原子值(文本),处理指令,注释,根节点(文档节点),命名空间以及对节点间的关系如:父(Parent),子(Children),兄弟(Sibling),先辈(Ancestor),后代(Descendant)等概念有所了解。这里不在说明。
XPath路径表达式
在本小节下面的内容中你将可以学习到:
路径表达式语法
相对/绝对路径
表达式上下文
谓词(筛选表达式)及轴的概念
运算符及特殊字符
常用表达式实例
函数及说明
这里给出一个实例Xml文件。下面的说明及实例都是基于该XML文件。
<?xml version=\”1.0\” encoding=\”UTF-8\”?>
<!– edited with XMLSpy v2008 rel. 2 sp2 (http://www.altova.com) by Administrator –>
<?xml-stylesheet type=\”text/xsl\” href=\”messages.xsl\” rel=\”external nofollow\” ?>
<messages>
<message id=\”1\”>
<sender>gukaitong@gmail.com</sender>
<to>anonymous@gmail.com
<group name=\”IT\”>
<address>111@gmail.com</address>
<address>222@gmail.com</address>
<address>aaa@gmail.com</address>
<address>bbb@gmail.com</address>
<address>ccc@gmail.com</address>
</group>
</to>
<subject>This is a sample</subject>
<datetime date=\”2008-12-11\” time=\”12:00:00\” formatted=\”12/11/2008 12:00AM\”>2008-12-11T12:00:00Z</datetime>
<body>
Are you interested in?
<attachments>
<attachment id=\”1\”>
<message id=\”0\”>
<sender>anonymous@gmail.com</sender>
<to>gukaitong@gmail.com</to>
<body>
We strongly recommend the following books
<books xmlns:amazon=\”http://www.amazon.com/books/schema\”>
<amazon:book>
<name>Professional C# 2008 </name>
<country>USA</country>
<price>37.79</price>
<year>2007</year>
</amazon:book>
<amazon:book>
<name>Microsoft Visual C# 2008 Step by Step </name>
<country>USA</country>
<price>26.39 </price>
<year>2008</year>
</amazon:book>
<amazon:book>
<name>C# in Depth</name>
<country>USA</country>
<price>29.69 </price>
<year>2006</year>
</amazon:book>
<amazon:book>
<name>Thinking in Java</name>
<country>USA</country>
<price>23.69 </price>
<year>2004</year>
</amazon:book>
</books>
</body>
</message>
</attachment>
</attachments>
</body>
</message>
<message id=\”2\”>
<sender>333@gmail.com</sender>
<to>444@gmail.com</to>
<subject>No title</subject>
<body/>
</message>
</messages>
路径表达式语法:
路径 = 相对路径 | 绝对路径
XPath路径表达式 = 步进表达式 | 相对路径 \”/\”步进表达式。
步进表达式=轴 节点测试 谓词
说明:
其中轴表示步进表达式选择的节点和当前上下文节点间的树状关系(层次关系),节点测试指定步进表达式选择的节点名称扩展名,谓词即相当于过滤表达式以进一步过滤细化节点集。
谓词可以是0个或多个。多个多个谓词用逻辑操作符and, or连接。取逻辑非用not()函数。
请看一个典型的XPath查询表达式:/messages/message//child::node()[@id=0],其中/messages/message是路径(绝对路径以\”/\”开始),child::是轴表示在子节点下选择,node()是节点测试表示选择所有的节点。[@id=0]是谓词,表示选择所有有属性id并且值为0的节点。
相对路径与绝对路径:
如果\”/\”处在XPath表达式开头则表示文档根元素,(表达式中间作为分隔符用以分割每一个步进表达式)
如:/messages/message/subject是一种绝对路径表示法,它表明是从文档根开始查找节点。假设当前节点是在第一个message节点【/messages/message[1]】,则路径表达式subject(路径前没有\”/\”)这种表示法称为相对路径,表明从当前节点开始查找。具体请见下面所述的\”表达式上下文\”。
表达式上下文(Context):
上下文其实表示一种环境。以明确当前XPath路径表达式处在什么样的环境下执行。例如同样一个路径表达式处在对根节点操作的环境和处在对某一个特定子节点操作的环境下执行所获得的结果可能是完全不一样的。也就是说XPath路径表达式计算结果取决于它所处的上下文。
XPath上下文基本有以下几种:
当前节点(./):
如./sender表示选择当前节点下的sender节点集合(等同于下面所讲的\”特定元素\”,如:sender)
父节点(../):
如../sender表示选择当前节点的父节点下的sender节点集合
根元素(/):
如/messages表示选择从文档根节点下的messages节点集合.
根节点(/*):
这里的*是代表所有节点,但是根元素只有一个,所以这里表示根节点。/*的返回结果和/messages返回的结果一样都是
messages节点。
递归下降(//):
如当前上下文是messages节点。则//sender将返回以下结果:
/messages//sender :
<sender>gkt1980@gmail.com</sender>
<sender>111@gmail.com</sender>
<sender>333@gmail.com</sender>
/messages/message[1]//sender:
<sender>gkt1980@gmail.com</sender>
<sender>111@gmail.com</sender>
我们可以看出XPath表达式返回的结果是:从当前节点开始递归步进搜索当前节点下的所有子节点找到满足条件的节点集。
特定元素
如sender:表示选择当前节点下的sender节点集合,等同于(./sender)
注意:在执行XPath时一定要注意上下文。即当前是在哪个节点下执行XPath表达式。这在XMLDOM中很重要。如:在XMLDOM中的selectNodes,selectSingleNode方法的参数都是一个XPath表达式,此时这个XPath表达式的执行上下文就是调用这个方法的节点及它所在的环境。更多信息请参见:http://www.w3.org/TR/xpath20/
谓词(筛选表达式)及轴的概念:
XPath的谓词即筛选表达式,类似于SQL的where子句.
运算符及特殊字符:
常用表达式实例:
函数及说明:
值得欣喜的是XPath函数和XSLT,XQuery等共享函数库,函数库为我们提供了功能丰富的各种函数的调用,我们也可以自定义自己的函数。这里不再对每个函数的用法逐一说明,中文的可以参考这个网站, https://www.jb51.net/w3school/xpath/index.htm
XPath在DOM,XSLT及XQuery中的应用
DOM:
<!DOCTYPE html PUBLIC \”-//W3C//DTD XHTML 1.0 Transitional//EN\” \”http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd\”>
<html xmlns=\”http://www.w3.org/1999/xhtml\”>
<head>
<title>XPath Test</title>
</head>
<body>
<script language=\”javascript\” type=\”text/javascript\”>
var xmlDoc = new ActiveXObject(\”Microsoft.XMLDOM\”);
xmlDoc.async=\”false\”;
xmlDoc.load(\”messages.xml\”);
xmlDoc.setProperty(\”SelectionLanguage\”, \”XPath\”);
var sPath = \”/messages/message[1]//books/*[local-name()=\’book\’]\”;
var bookNodes = xmlDoc.selectNodes(sPath);
document.write(\”<ul>\”);
for ( var i = 0; i < bookNodes.length; i++) {
document.write(\”<li>\” + bookNodes[i].childNodes[0].text + \”</li>\”);
}
document.write(\”</ul>\”);
</script>
</body>
</html>
注意:
我们若使用new ActiveXObject(\”Microsoft.XMLDOM\”)则需要注意的是:因为早期的XMLDOM的SelectionLanguage属性默认是正则表达式,不是XPath语言。所以需要指定这样一条语句xmlDoc.setProperty(\”SelectionLanguage\”, \”XPath\”); 以支持XPath查询表达式。.
若没有指定SelectionLanguage属性值为XPath则要注意以下情况:
数组下标从0开始(我们知道在XPath查询表达式中数组下标是从1开始的)不支持在XPath查询表达式中使用XPath函数。
总结
以上就是本文关于Xpath语法格式总结的全部内容,希望对大家有所帮助。感兴趣的朋友可以参阅:MYSQL updatexml()函数报错注入解析、OGNL表达式基本语法与用法详解、前端常见跨域解决方案(全)等,有什么问题可以随时留言,欢迎大家讨论交流。
您可能感兴趣的文章:
- 深入XPath的详解以及Java示例代码分析
- xpath的数据和节点类型以及XPath中节点匹配的基本方法
- XPath的定义、基础语法、使用示例和高级用法