先学了XML

zisefeiniao

浏览: 168522 次
性别:
来自: 成都

最近访客更多访客>>

chen8039

yxjsmile

seed2sky

晨晨90

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

MLDN魔乐科技跟李兴华老师学JAVA记

XML 应用服务器数据结构编程 Myeclipse

   一开始以为要先学的是Sturts,所以做好了Struts的学习准备,结果没想到，先学的是xml,哈哈，有些紧张过头了，不过也好，今天李老师讲解完XML之后，还是觉得挺有收获的，可以将AJAX和javascript进一步的整合应用，XML本身也很重要，我又收集了些XML的资料，之后给朋友们看。

今天所讲的知识点
A XML简介
B XML的解析与创建

我对知识点的分析
XML简介
一、XML与HTML
HTML用来显示页面的，XML用来保存和传递数据。
HTML英文全称 HyperText Markup Language;超文本标记语言，其标记功能固定
XML 英文全称 Extensible Markup Language;可扩展标记语言，其标记功能不明

二、XML的用处
XML主要使用在：AJAX中（传递数据）、WebService中（传递数据）、所有常用框架中（保存配置数据，比数据库执行和查询效率高）

　　使用XML的五种场合
　　（1）数据交换
　　用XML在应用程序和公司之间作数据交换已不是什么秘密了，毫无疑问应被列为第一位。那么为什么XML在这个领域里的地位这么重要呢?原因就是XML使用元素和属性来描述数据。在数据传送过程中，XML始终保留了诸如父/子关系这样的数据结构。几个应用程序可以共享和解析同一个XML文件，不必使用传统的字符串解析或拆解过程。
　　相反，普通文件不对每个数据段做描述(除了在头文件中)，也不保留数据关系结构。使用XML做数据交换可以使应用程序更具有弹性，因为可以用位置(与普通文件一样)或用元素名(从数据库)来存取XML数据。
　　（2）Web服务
　　Web服务是最令人激动的革命之一，它让使用不同系统和不同编程语言的人们能够相互交流和分享数据。其基础在于Web服务器用XML在系统之间交换数据。交换数据通常用XML标记，能使协议取得规范一致，比如在简单对象处理协议(Simple Object Access Protocol, SOAP)平台上。
　　SOAP可以在用不同编程语言构造的对象之间传递消息。这意味着一个C#对象能够与一个Java对象进行通讯。这种通讯甚至可以发生在运行于不同操作系统上的对象之间。DCOM, CORBA或Java RMI只能在紧密耦合的对象之间传递消息，SOAP则可在松耦合对象之间传递消息。
　　（3）内容管理
　　XML只用元素和属性来描述数据，而不提供数据的显示方法。这样，XML就提供了一个优秀的方法来标记独立于平台和语言的内容。
　　使用象XSLT这样的语言能够轻易地将XML文件转换成各种格式文件，比如HTML, WML, PDF, flat file, EDI, 等等。XML具有的能够运行于不同系统平台之间和转换成不同格式目标文件的能力使得它成为内容管理应用系统中的优秀选择。
　　（4）Web集成
　　现在有越来越多的设备也支持XML了。使得Web开发商可以在个人电子助理和浏览器之间用XML来传递数据。
　　为什么将XML文本直接送进这样的设备去呢?这样作的目的是让用户更多地自己掌握数据显示方式，更能体验到实践的快乐。常规的客户/服务(C/S)方式为了获得数据排序或更换显示格式，必须向服务器发出申请;而XML则可以直接处理数据，不必经过向服务器申请查询-返回结果这样的双向“旅程”，同时在设备也不需要配制数据库。
　　甚至还可以对设备上的XML文件进行修改并将结果返回给服务器。想像一下，一台具有互联网功能并支持XML的电冰箱将会给市场带来多么大的冲击吧。你从此不必早起去取牛奶了!
　　（5）配制
　　许多应用都将配制数据存储在各种文件里，比如.INI文件。虽然这样的文件格式已经使用多年并一直很好用，但是XML还是以更为优秀的方式为应用程序标记配制数据。使用.NET里的类，如XmlDocument和XmlTextReader，将配制数据标记为XML格式，能使其更具可读性，并能方便地集成到应用系统中去。使用XML配制文件的应用程序能够方便地处理所需数据，不用象其他应用那样要经过重新编译才能修改和维护应用系统。
　　如前所述，这里提到的五种使用XML的途径不包括全部场合。

三、XML的语法
1、XML由两个部分组成：
1）前导区：用来描述该XML的基本信息
2）数据区：所有的要传递或保存的数据都在这里编写

2、前导区
（1）XML版本信息：<?xml version="1.0"?> 必写
（2）处理编码的格式：<?xml version="1.0" encoding="GBK"?>
（3）定义dtd文件，用来控制数据区中编写的语法格式（框架部分）
（4）配置css：用来处理XML的显示格式，一般不用
<?xml version="1.0" encoding="GBK"?>
<?xml-stylesheet href="test.css" type="text/css" ?>
<person>
<name>中文</name>
<phone>62350411</phone>
<phone>51283346</phone>
</person>
定义如下样式：
name {
font-size:25px;
color: #00FF33;
}

3、数据区
（1）每个节点必须关闭
（2）整个数据区有且只能有一个根节点
（3）纯文本也是一个节点，该节点不可能拥有子节点
（4）非文本节点还可能拥有属性
（5）命名规范同编程语言通用的命名规范
（6）特殊字符处理同HTML：&编码;

XML的解析与创建
一、Java的XML的四种解析技术
DOM和SAX为标准
DOM方式：将一个XML所有内容一起读入，然后进行解析，适合读取小文件，可以创建XML
SAX方式：将XML每次读入一部分，进行解析，适合读取大文件，不可以创建XML
JDOM结合了两者的优点，简化代码，创建了新的API。
详细：Java中四种XML解析技术（参考资料）
　　1、 DOM（JAXP Crimson 解析器）
　　DOM 是用与平台和语言无关的方式表示 XML 文档的官方 W3C 标准。DOM 是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中寻找特定信息。分析该结构通常需要加载整个文档和构造层次结构，然后才能做任何工作。由于它是基于信息层次的，因而 DOM 被认为是基于树或基于对象的。DOM 以及广义的基于树的处理具有几个优点。首先，由于树在内存中是持久的，因此可以修改它以便应用程序能对数据和结构作出更改。它还可以在任何时候在树中上下导航，而不是像 SAX 那样是一次性的处理。DOM 使用起来也要简单得多。
　　另一方面，对于特别大的文档，解析和加载整个文档可能很慢且很耗资源，因此使用其他手段来处理这样的数据会更好。这些基于事件的模型，比如 SAX。
　　2、 SAX
　　这种处理的优点非常类似于流媒体的优点。分析能够立即开始，而不是等待所有的数据被处理。而且，由于应用程序只是在读取数据时检查数据，因此不需要将数据存储在内存中。这对于大型文档来说是个巨大的优点。事实上，应用程序甚至不必解析整个文档；它可以在某个条件得到满足时停止解析。一般来说，SAX 还比它的替代者 DOM 快许多。
　　选择 DOM 还是选择 SAX ？
　　对于需要自己编写代码来处理 XML 文档的开发人员来说，选择 DOM 还是 SAX 解析模型是一个非常重要的设计决策。
　　DOM 采用建立树形结构的方式访问 XML 文档，而 SAX 采用的事件模型。
　　DOM 解析器把 XML 文档转化为一个包含其内容的树，并可以对树进行遍历。用 DOM 解析模型的优点是编程容易，开发人员只需要调用建树的指令，然后利用navigation APIs访问所需的树节点来完成任务。可以很容易的添加和修改树中的元素。然而由于使用 DOM 解析器的时候需要处理整个 XML 文档，所以对性能和内存的要求比较高，尤其是遇到很大的 XML 文件的时候。由于它的遍历能力，DOM 解析器常用于 XML 文档需要频繁的改变的服务中。
　　SAX 解析器采用了基于事件的模型，它在解析 XML 文档的时候可以触发一系列的事件，当发现给定的tag的时候，它可以激活一个回调方法，告诉该方法制定的标签已经找到。SAX 对内存的要求通常会比较低，因为它让开发人员自己来决定所要处理的tag。特别是当开发人员只需要处理文档中所包含的部分数据时，SAX 这种扩展能力得到了更好的体现。但用 SAX 解析器的时候编码工作会比较困难，而且很难同时访问同一个文档中的多处不同数据。
　　3、 JDOM
　　JDOM 的目的是成为 Java 特定文档模型，它简化与 XML 的交互并且比使用 DOM 实现更快。由于是第一个 Java 特定模型，JDOM 一直得到大力推广和促进。正在考虑通过“Java 规范请求 JSR-102”将它最终用作“Java 标准扩展”。从 2000 年初就已经开始了 JDOM 开发。
　　JDOM 与 DOM 主要有两方面不同。首先，JDOM 仅使用具体类而不使用接口。这在某些方面简化了 API，但是也限制了灵活性。第二，API 大量使用了 Collections 类，简化了那些已经熟悉这些类的 Java 开发者的使用。
　　JDOM 文档声明其目的是“使用 20%（或更少）的精力解决 80%（或更多）Java/XML 问题”（根据学习曲线假定为 20%）。JDOM 对于大多数 Java/XML 应用程序来说当然是有用的，并且大多数开发者发现 API 比 DOM 容易理解得多。JDOM 还包括对程序行为的相当广泛检查以防止用户做任何在 XML 中无意义的事。然而，它仍需要您充分理解 XML 以便做一些超出基本的工作（或者甚至理解某些情况下的错误）。这也许是比学习 DOM 或 JDOM 接口都更有意义的工作。
　　JDOM 自身不包含解析器。它通常使用 SAX2 解析器来解析和验证输入 XML 文档（尽管它还可以将以前构造的 DOM 表示作为输入）。它包含一些转换器以将 JDOM 表示输出成 SAX2 事件流、DOM 模型或 XML 文本文档。JDOM 是在 Apache 许可证变体下发布的开放源码。
　4、DOM4J
　　虽然 DOM4J 代表了完全独立的开发结果，但最初，它是 JDOM 的一种智能分支。它合并了许多超出基本 XML 文档表示的功能，包括集成的 XPath 支持、XML Schema 支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项，它通过 DOM4J API 和标准 DOM 接口具有并行访问功能。从 2000 下半年开始，它就一直处于开发之中。
　　为支持所有这些功能，DOM4J 使用接口和抽象基本类方法。DOM4J 大量使用了 API 中的 Collections 类，但是在许多情况下，它还提供一些替代方法以允许更好的性能或更直接的编码方法。直接好处是，虽然 DOM4J 付出了更复杂的 API 的代价，但是它提供了比 JDOM 大得多的灵活性。
　　在添加灵活性、XPath 集成和对大文档处理的目标时，DOM4J 的目标与 JDOM 是一样的：针对 Java 开发者的易用性和直观操作。它还致力于成为比 JDOM 更完整的解决方案，实现在本质上处理所有 Java/XML 问题的目标。在完成该目标时，它比 JDOM 更少强调防止不正确的应用程序行为。
　　DOM4J 是一个非常非常优秀的Java XML API，具有性能优异、功能强大和极端易用使用的特点，同时它也是一个开放源代码的软件。如今你可以看到越来越多的 Java 软件都在使用 DOM4J 来读写 XML，特别值得一提的是连 Sun 的 JAXM 也在用 DOM4J。
　　JDOM 和 DOM 在性能测试时表现不佳，在测试 10M 文档时内存溢出。在小文档情况下还值得考虑使用 DOM 和 JDOM。虽然 JDOM 的开发者已经说明他们期望在正式发行版前专注性能问题，但是从性能观点来看，它确实没有值得推荐之处。另外，DOM 仍是一个非常好的选择。DOM 实现广泛应用于多种编程语言。它还是许多其它与 XML 相关的标准的基础，因为它正式获得 W3C 推荐（与基于非标准的 Java 模型相对），所以在某些类型的项目中可能也需要它（如在 JavaScript 中使用 DOM）。
　　SAX表现较好，这要依赖于它特定的解析方式。一个 SAX 检测即将到来的XML流，但并没有载入到内存（当然当XML流被读入时，会有部分文档暂时隐藏在内存中）。
　　无疑，DOM4J是这场测试的获胜者，目前许多开源项目中大量采用 DOM4J，例如大名鼎鼎的 Hibernate 也用 DOM4J 来读取 XML 配置文件。如果不考虑可移植性，那就采用DOM4J吧！

二、DOM
DOM可以在JavaScript中使用（JavaScript支持DOM解析，HTML也支持）
DOM的全称：Document，将XML作为一个文档进行处理，将每一个节点整理成为树型结构。
1、DOM读取XML文件示例
package org.liky.dom;

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class DomDemo {
public static void main(String[] args) {
// TODO Auto-generated method stub
// 建立一个DOM处理工厂
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// 建立DOM处理类
try {
   DocumentBuilder builder = factory.newDocumentBuilder();
   // 依据一个要处理的文件创建DOM树
   Document doc = builder.parse(new File("D:/Test.xml"));

   Node root = doc.getChildNodes().item(0);//取得根节点
// 调用递归方法取得所有节点内容
   getChild(root);

} catch (ParserConfigurationException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
} catch (SAXException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
} catch (IOException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
}

}

public static void getChild(Node node) {
// 判断文本节点。
if (node.getNodeType() == Node.TEXT_NODE) {
            //处理节点之间的空格
   if (node.getTextContent().trim().equals("")) {
    return ;
   }
   System.out.print(node.getTextContent());
   return ;
}
// 处理其他类型节点
System.out.println(node);
if (node.getChildNodes() == null
    || node.getChildNodes().getLength() == 0) {
   return;
} else {
   for (int i =0 ;i < node.getChildNodes().getLength();i++) {
    // 如果包含子节点，则执行递归
    getChild(node.getChildNodes().item(i));
   }
}
}
}

重点：
doc的创建方式；
getElementsByTagName方法，根据标记名称查询，返回多个节点信息（NodeList），可以循环取得所有节点内容（文本内容）；
doc和Node节点的方法：
getFirstChild：取得当前节点的第一个子节点；
getLastChild：取得当前节点的最后一个子节点；
getChildNodes：取得当前节点的所有子节点；

2、DOM创建XML示例
// 建立一个DOM处理工厂
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// 建立DOM处理类
try {
   DocumentBuilder builder = factory.newDocumentBuilder();
   // 创建一个空的DOM树
   Document doc = builder.newDocument();

   // 创建一个根节点，该节点名称为persons
   Element root = doc.createElement("persons");
   // 创建person节点
   Element person1 = doc.createElement("person");
   Element person2 = doc.createElement("person");
   // 创建name节点
   Element name1 = doc.createElement("name");
   Element name2 = doc.createElement("name");
   // 创建phone节点
   Element phone1 = doc.createElement("phone");
   Element phone2 = doc.createElement("phone");
   Element phone3 = doc.createElement("phone");
   Element phone4 = doc.createElement("phone");
   // 创建文本节点
   Text nameText1 = doc.createTextNode("中文");
   Text nameText2 = doc.createTextNode("MLDN");
   Text phoneText1 = doc.createTextNode("62350411");
   Text phoneText2 = doc.createTextNode("51283346");
   Text phoneText3 = doc.createTextNode("62350411");
   Text phoneText4 = doc.createTextNode("51283346");

   // 配置节点的父子关系
   name1.appendChild(nameText1);
   name2.appendChild(nameText2);
   phone1.appendChild(phoneText1);
   phone2.appendChild(phoneText2);
   phone3.appendChild(phoneText3);
   phone4.appendChild(phoneText4);

   person1.appendChild(name1);
   person1.appendChild(phone1);
   person1.appendChild(phone2);

   person2.appendChild(name2);
   person2.appendChild(phone3);
   person2.appendChild(phone4);

   root.appendChild(person1);
   root.appendChild(person2);

   // 设置节点的属性
   person1.setAttribute("id", "001");
   person1.setIdAttribute("id", true);

   person2.setAttribute("id", "002");
   person2.setIdAttribute("id", true);

   root.setAttribute("id", "abc");
   root.setIdAttribute("id", true);

   // 将根节点加入到doc中
   doc.appendChild(root);

   // 使用IO操作进行保存
   TransformerFactory tf = TransformerFactory.newInstance();
   Transformer tran = tf.newTransformer();
   // 设置编码
   tran.setOutputProperty(OutputKeys.ENCODING, "GBK");
   //定义输出源文件
   DOMSource source = new DOMSource(doc);
   StreamResult sr = new StreamResult("d:/myout.xml");
   // 执行输出
   tran.transform(source, sr);
} catch (ParserConfigurationException e) {
   e.printStackTrace();
} catch (Exception e) {
   e.printStackTrace();
}

三、SAX解析方式
SAX：Simple API XML解析
使用SAX必须先建立解析规则类，在这个类中需要继承DefaultHandler类，覆写其中的处理方法。然后再进行解析
1、建立解析规则类
package org.liky.sax;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class SaxHandler extends DefaultHandler {
// 处理文本节点
public void characters(char[] ch, int start, int length) throws SAXException {
// 显示文本信息
System.out.println(String.valueOf(ch).substring(start,start+length));
}

// 当文档读取结束时调用
public void endDocument() throws SAXException {
System.out.println("结束读取");
}

// 当某一个节点读取结束时调用
public void endElement(String arg0, String arg1, String qName)
   throws SAXException {
// 输出结束时节点标记
System.out.println("</"+qName+">");
}

// 当文档开始时调用
public void startDocument() throws SAXException {
System.out.println("开始读取");
}

// 当某一个节点开始时调用
public void startElement(String arg0, String arg1, String qName,
   Attributes attr) throws SAXException {
// 输出节点名称和属性值
System.out.print("<" + qName);
if (attr != null) {
   for (int i = 0; i < attr.getLength(); i++) {
    System.out.print(" " + attr.getQName(i) + "=\”"
      + attr.getValue(i) + "\” ");
   }
}
System.out.println(">");
}
}

2、解析XML文件
package org.liky.sax;

import java.io.File;
import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.SAXException;
public class SaxDemo {
public static void main(String[] args) {
SAXParserFactory sf = SAXParserFactory.newInstance();
try {
   SAXParser sp = sf.newSAXParser();
   sp.parse(new File("d:/myout.xml"), new SaxHandler());
} catch (ParserConfigurationException e) {
   e.printStackTrace();
} catch (SAXException e) {
   e.printStackTrace();
} catch (Exception e) {
   e.printStackTrace();
}
}
}

四、JDOM方式解析
JDOM是结合了DOM与SAX的优点，完成的一套用来解析和创建XML的API
由于是第三方开发，因此使用时需要引入第三方jar包。
在MyEclipse中的插件库里包含了该jar包
在D:\MyEclipse 5.5.1 GA\myeclipse\eclipse\plugins下搜索jdom，将其中的jdom.jar拷贝到项目的lib下
1、JDOM解析示例
SAXBuilder sax = new SAXBuilder();
try {
   Document doc = sax.build(new File("d:/myout.xml"));
   // 取得根节点
   Element root = doc.getRootElement();
   // 取得根节点的直接子节点
   List allChild = root.getChildren() ;
   Iterator iter = allChild.iterator();
   while(iter.hasNext()) {
    Element child = (Element) iter.next();
    System.out.println(child.getChild("name").getText());
   }
} catch (JDOMException e) {
   e.printStackTrace();
} catch (IOException e) {
   e.printStackTrace();
}

2、JDOM创建XML文件
public static void main(String[] args) {
Document doc = new Document();
// 创建元素
Element root = new Element("persons");
Element person1 = new Element("person");
Element person2 = new Element("person");
Element name1 = new Element("name");
Element name2 = new Element("name");
// 配置关系
name1.addContent("中文");
name2.addContent("MLDN");
person1.addContent(name1);
person2.addContent(name2);
root.addContent(person1);
root.addContent(person2);
// 设置属性
Attribute att = new Attribute("id", "001");
att.setAttributeType(Attribute.ID_ATTRIBUTE);
person1.setAttribute(att);
att = new Attribute("id", "002");
att.setAttributeType(Attribute.ID_ATTRIBUTE);
person2.setAttribute(att);
// 配置到doc中
doc.setRootElement(root);
// 保存及输出到文件
XMLOutputter output = new XMLOutputter();
output.setEncoding("GBK");
try {
   FileWriter fw = new FileWriter(new File("d:/jdom.xml"));
   output.output(doc, fw);
   fw.close();
} catch (IOException e) {
   e.printStackTrace();
}
}

分享到：

XML解析技术 | MLDN项目开发日报

2009-05-09 22:04
浏览 804
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

先学了XML

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

先学了XML

评论

发表评论

相关推荐

本小姐回来啦 —— 超级感谢MLDN

现在开始积极的找工作

素质教育 —— 模拟面试

EJB实体Bean开发的复合主键映射

EJB实体Bean开发

EJB3.0

JBoss服务器配置

Spring结合iBATIS进行开发

ibatis开发框架

WebService分布式开发

北京下雨了

JQuery

AJAX中使用JSON

AJAX框架 —— JSON基本知识

还应该多帮助同学，才能让自己进步快

业务、业务、业务。。。

IBM Project 继续中ing....

实际开发了

web学习笔记 —— 数据源

SSH（Spring + Struts + Hibernate）

最近访客更多访客>>