您的位置: 首页 > 文章 > 使用dom4j解析xml

使用dom4j解析xml

分类: 文章 • 2025-01-31 08:15:16

使用dom4j解析xml

为什么用dom4j：
dom：很方便实现增删改操作
sax：不能实现增删改操作，只能做查询操作
dom4j：集dom跟sax于一身

*dom4j，是一个组织，针对xml解析，提供解析器 dom4j

*dom4j不是javase的一部分，想要使用第一步需要怎么做？
**导入dom4j提供jar包
– 创建一个文件夹 lib
– 复制jar包到lib下面，
– 右键点击jar包，build path – add to build path
– 看到jar包，变成奶瓶样子，表示导入成功

*得到document
SAXReader reader = new SAXReader();
Document document = reader.read(url);

*document的父接口是Node
*如果在document里面找不到想要的方法，到Node里面去找

*document里面的方法 getRootElement() ：获取根节点返回的是Element

*Element也是一个接口，父接口是Node
-Element和Node里面方法
** getParent()：获取父节点
** addElement：添加标签

*element(qname)
** 表示获取标签下面的第一个子标签
** qname：标签的名称

*elements(qname)
** 获取标签下面是这个名称的所有子标签（一层）
** qname：标签名称

*elements()
** 获取标签下面的所有一层子标签

使用dom4j查询xml

*解析是从上到下解析

*查询所有name元素里面的值
/*
1、创建解析器
2、得到document
3、得到根节点 getRootElement() 返回Element
4、得到所有的p1标签
使用dom4j解析xml
* elements(“p1”) 返回list集合
* 遍历list得到每一个p1
5、得到name
* 在p1下面执行 element(“name”)方法返回Element
6、得到name里面的值
* getText方法得到值
*/
eg:
public static void selectName() throws DocumentException{
SAXReader sr = new SAXReader();//直接new
Document d = sr.read(“src/p1.xml”);
Element e = d.getRootElement();
List le = e.elements(“p1”); //注意泛型
for (Element element : le) {
Element name = element.element(“name”);
System.out.println(name.getText());
}

获取第二个name元素的值
/*
* 1、创建解析器
* 2、得到document
* 3、得到根节点
*
* 4、得到所有的p1
** 返回 list集合
* 5、遍历得到第二个p1
** 使用list下标得到 get方法，集合的下标从 0 开始，想要得到第二个值，下标写 1 Element p2 = list.ge1(1);
* 6、得到第二个p1下面的name
** element(“name”)方法返回Element
* 7、得到name的值
** getText方法
* */
使用dom4j解析xml

获取第一个name元素的值
使用dom4j解析xml

使用dom4j实现添加操作

*在第一个p1标签末尾添加一个元素 <sex>nv</sex>
* 步骤
/*
* 1、创建解析器
* 2、得到document
* 3、得到根节点
*
* 4、获取到第一个p1
* 使用element方法
* 5、在p1下面添加元素
* 在p1上面直接使用 addElement(“标签名称”)方法返回一个Element
* 6、在添加完成之后的元素下面添加文本
*在sex上直接使用 setText(“文本内容”)方法
* 7、回写xml
* 格式化 OutputFormat,使用 createPrettyPrint方法，表示一个漂亮的格式
* 使用类XMLWriter 直接new 这个类，传递两个参数
* 第一个参数是xml文件路径 new FileOutputStream(“路径”)
* 第二个参数是格式化类的值
* */
eg:
public static void selectName() throws DocumentException, IOException{
SAXReader sr = new SAXReader();
Document document = sr.read(“src/p1.xml”);
Element root = document.getRootElement();
Element p1 = root.element(“p1”);
Element sex = p1.addElement(“sex”);
sex.setText(“female”);
//回写xml
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter xw = new XMLWriter(new FileOutputStream (“src/p1.xml”),format);
xw.write(document);
xw.close();
}

使用dom4j实现在特定位置添加元素

*在第一个p1下面的age标签之前添加 <school>ecit.edu.cn</schlool>

*步骤
/*
* 1、创建解析器
* 2、得到document
* 3、得到根节点
* 4、获取到第一个p1
* 5、获取p1下面的所有的元素
* ** elements()方法返回 list集合
* ** 使用list里面的方法，在特定位置添加元素
* 首先创建元素在元素下面创建文本
- 使用DocumentHelper类方法createElement创建标签
- 把文本添加到标签下面使用 setText(“文本内容”)方法
* * **list集合里面的 add(int index, E element)
* - 第一个参数是位置下标，从0开始
* - 第二个参数是要添加的元素
* 6、回写xml
* */
eg:
public static void addSchool() throws Exception{
SAXReader sa = new SAXReader();
Document d = sa.read(“src/p1.xml”);
Element root = d.getRootElement();
Element p1 = root.element(“p1”);

List list = p1.elements();
//创建需要添加的元素
Element school = DocumentHelper.createElement(“school”);
school.setText(“huake”);
//在特定位置添加
list.add(1, school);

//回写xml
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter xw = new XMLWriter(new FileOutputStream(“src/p1.xml”), format);
xw.write(d);
xw.close();
}

使用dom4j实现修改节点的操作

* 修改第一个p1下面的age元素的值<age>30</age>

*步骤
/*
* 1、得到document
* 2、得到根节点，然后再得到第一个p1元素
* 3、得到第一个p1下面的age
element(“”)方法
* 4、修改值是 30
** 使用setText(“文本内容”)方法
* 5、回写xml
* */
使用dom4j解析xml

使用dom4j实现删除节点的操作

*删除第一个p1下面的<school>ecit</school>元素

*步骤
/*
* 1、得到document
* 2、得到根节点
* 3、得到第一个p1标签
* 4、得到第一个p1下面的school元素
* 5、删除（使用p1删除school）
** 得到school的父节点
- 第一种直接得到p1
- 使用方法 getParent方法得到
* 删除操作
- 在p1上面执行remove方法删除节点
p1.remove(sch);
* 6、回写xml
* */
使用dom4j解析xml

使用dom4j获取属性的操作

*获取第一个p1里面的属性id1的值

*步骤
/*
* 1、得到document
* 2、得到根节点
* 3、得到第一个p1元素
* 4、得到p1里面的属性值
- p1.attributeValue(“id1”);
- 在p1上面执行这个方法，里面的参数是属性名称
* */
使用dom4j解析xml

使用dom4j支持xpath的操作

*这个xpath操作可以直接获取到某个元素
xpath是一种书写形式，或者直接理解为一种表达式
* 第一种形式
/AAA/DDD/BBB：表示一层一层的，AAA下面 DDD下面的BBB
* 第二种形式
//BBB：表示和这个名称相同，表示只要名称是BBB，都得到
* 第三种形式
/*: 所有元素
* 第四种形式
**　BBB1：　表示第一个BBB元素
**　BBB[last()]：表示最后一个BBB元素
* 第五种形式
** //BBB[@id]：表示只要BBB元素上面有id属性，都得到
* 第六种形式
** //BBB[@id=’b1’] 表示元素名称是BBB,在BBB上面有id属性，并且id的属性值是b1

使用dom4j支持xpath具体操作

xpath-API
教程
 W3C教程
 JAR

** 默认的情况下，dom4j不支持xpath
** 如果想要在dom4j里面使用xpath
* 第一步需要，引入支持xpath的jar包，使用 jaxen-1.1-beta-6.jar
** 需要把jar包导入到项目中

** 在dom4j里面提供了两个方法，用来支持xpath
* **selectNodes(“xpath表达式”)
- 获取多个节点
* **selectSingleNode(“xpath表达式”)
- 获取一个节点

** 使用xpath实现：查询xml中所有name元素的值
** 所有name元素的xpath表示： //name
** 使用selectNodes(“//name”);

** 代码和步骤
/*
* 1、得到document
* 2、直接使用selectNodes(“//name”)方法得到所有的name元素
* */
//得到document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
//使用selectNodes(“//name”)方法得到所有的name元素
List<Node> list = document.selectNodes(“//name”); //导包不要导错
//遍历list集合
for (Node node : list) {
//node是每一个name元素
//得到name元素里面的值
String s = node.getText();
System.out.println(s);
}

使用xpath实现：获取第一个p1下面的name的值
* //p1[@id1=’aaaa’]/name
* 使用到 selectSingleNode(“//p1[@id1=’aaaa’]/name”)
* 步骤和代码
/*
* 1、得到document
* 2、直接使用selectSingleNode方法实现
* - xpath ： //p1[@id1=’aaaa’]/name
* */
//得到document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
//直接使用selectSingleNode方法实现
Node name1 = document.selectSingleNode(“//p1[@id1=’aaaa’]/name”); //name的元素
//得到name里面的值
String s1 = name1.getText();
System.out.println(s1);

方法封装
** 可以对得到document的操作和回写xml的操作，封装成方法
** 也可以把传递的文件路径，封装成一个常量
public static final String PATH = “src/p1.xml”;
* 好处：可以提高开发速度，可以提交代码可维护性
- 比如想要修改文件路径（名称），这个时候只需要修改常量的值就可以了，其他代码不需要做任何改变
使用dom4j解析xml