xml转html例子

巧妙利用XSLT将XML数据转换成HTML时间:2005-09-29 08:00 来源:网管之家bitsCN.com 字体:[大 中 小]
  使用一个简单的 XSL 样式表就可以将 XML 数据转换成 HTML。随着 XML 规范的不断演进,在新的版本中满足每个人的需要似乎已经成为必要;不幸的是,进行简单的转换一直都困扰着规范。
  
  假设我有一个表示一个页面内容的 XML 数据,现在我想将其内容转换成布局。下面是我想要转换的 XML:
  
  <?xml version='1.0'?>
  <?xml-stylesheet type="text/xsl" href="article.xsl"?>
  <xml>
  <folders>
  <folder>
  <text>Folder 1</text>
  <files>
  <file>
  <text>File 1</text>
  <fields>
  <field>
  <data>
  <type>string</type>
  <length>50</length>
  <value>some data</value>
  </data>
  </field>
  </fields>
  </file>
  </files>
  </folder>
  </folders>
  </xml>
  
  这个内容表示一组文件夹、文件和域。每个文件夹包含文件,每个文件包含用于输入数据的域。文件夹组中的每个文件夹都将表现为一个 TABLE 的第一行的一个 TR 元素和一个 TD 元素。文件组中的每个文件都将表示为嵌套在文件夹 TR 元素中的一个 TABLE 元素的第一行的一个 TR 元素和一个 TD 元素。域组中的每个域都将在相关的文件中表现为一个 INPUT。
  
  为了实现这一想法,我们需要将遍历 XML 然后根据XSL 构建一个表。
  
  下面是用于这个转换的 XSL:
  
  <?xml version="1.0"?>
  <xsl:stylesheet
  xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0"
  xmlns:msxsl="urn:schemas-microsoft-com:xslt"
  xmlns:fn="http://www.mycompany.com/mynamespace">
  <xsl:output method="html"/>
  
  <msxsl:script language="JScript" implements-prefix="fn">
  function getElementCount(nodelist, what) {
  var rtrn = 0;
  rtrn = nodelist[0].parentNode.selectNodes(what).length;
  return (rtrn + 1); //1 is added for filler TD
  }
  </msxsl:script>
  
  <xsl:template match="/">
  
  <TABLE CELLSPACING="0" CELLPADDING="0"
  WIDTH="100%" BORDER="0" ID="tblRoot" NAME="tblRoot"
  style="table-layout:fixed;">
  <TR>
  <xsl:for-each select="xml/folders/folder">
  <xsl:element name="TD">
  <xsl:attribute name="style">width:55px</xsl:attribute>
  <xsl:value-of select="text"/>
  </xsl:element>
  </xsl:for-each>
  <TD> </TD>
  </TR>
  
  <xsl:for-each select="xml/folders/folder">
  <TR>
  <xsl:element name="TD">
  <xsl:attribute name="colspan">
  <xsl:value-of select="fn:getElementCount(., 'folder')"/>
  </xsl:attribute>
  
  <TABLE CELLSPACING="0" CELLPADDING="0"
  WIDTH="100%" BORDER="0" style="table-layout:fixed;">
  <TR>
  <xsl:for-each select="files/file">
  <xsl:element name="TD">
  <xsl:attribute name="style">width:55px;</xsl:attribute>
  <xsl:value-of select="text"/>
  </xsl:element>
  </xsl:for-each>
  <TD> </TD>
  </TR>
  
  <xsl:for-each select="files/file">
  <TR>
  <xsl:element name="TD">
  <xsl:attribute name="colspan">
  <xsl:value-of select="fn:getElementCount(., 'file')"/>
  </xsl:attribute>
  
  <xsl:for-each select="fields/field">
  <xsl:element name="INPUT">
  <xsl:attribute name="type">text</xsl:attribute>
  <xsl:attribute name="maxlength">
  <xsl:value-of select="data/length"/>
  </xsl:attribute>
  <xsl:attribute name="value">
  <xsl:value-of select="data/value"/>
  </xsl:attribute>
  </xsl:element><BR/>
  </xsl:for-each>
  
  </xsl:element>
  </TR>
  </xsl:for-each>
  </TABLE>
  </xsl:element>
  </TR>
  </xsl:for-each>
  </TABLE>
  
  </xsl:template>
  </xsl:stylesheet>
  
  在 stylesheet 标记中,我们设置了几个命名空间,包括定义所有 xsl 转换标记的 xsl 命名空间。能够让我们创建可以在样式表中使用的用户函数的msxml 命名空间。我使用它得到所有的子元素,以便得到一个 TD 标记的一个 COLSPAN 属性集。用于加入一组用户定义的函数的fn 命名空间,该命名空间由msxml:script element 创建。
  
  然后,我们创建外部 TABLE 和第一个 TR。在 TR 中,我为 XML 中指定的每个文件夹创建一个 TD。我使用了 xsl:element 标记,因为它允许我添加自定义属性或者执行一个函数来为另一个 TD 元素中的 COLSPAN 属性设置一个属性。
  
  在为每个文件夹创建了所需的 TD 之后,我开始为每个文件夹创建 TR。我只向这个 TR 添加一个 TD,但是我将它的 COLSPAN 属性设为等于文件夹组中文件夹标记的数量再加一。多出的一是用来在一个固定布局样式的 TABLE 中填充空格用的。
  
  为了得到 COLSPAN,我传入当前的上下文(在这里由“.”指定)和我想计算的节点的名字。在我的函数中,我得到当前的上下文,paraentNode,和 XPath 查询中指定的节点的数量。然后函数返回这个数量加上一以填充 TD。
  
  有了这个 TD,我在其中嵌入另外一个 TABLE,该 TABLE 包含文件组中的每个文件。从这一点开始,其过程就与外部 TABLE 转换一样。最后的步骤是添加每个文件中的域。这次我没有再创建嵌入的 TABLE,只是把这些域添加到当前的 TD 中。
  
  一旦我完成了通用布局,我就可以开始添加用户界面功能了,比如说隐藏掉其它的文件夹和文件行,直到用户点击了相关的选项卡。这一功能可以通过编写支持这一功能的脚本来实现,添加一个 onclick xsl:attribute 元素到文件夹和文件 TD 元素,然后将它的值设置为脚本函数的名字。
  
  最后,在通用功能完成之后,你可以添加class xsl:attributes 并在 STYLE 或 CSS 中添加相关的classNames 得到你想要的外观。
  
  这个例子为在部署 Web 数据解决方案中用到的 File-Folder-Field 视图创建了一个基础。访问 MSDN 找到更多有关Microsoft 的 XML 规范的信息。

文章转载自网管之家:http://www.bitscn.com/pdb/java/200605/22774.html
### Java 中实现 Word XML 并进一步 HTML 的方法 #### 方法概述 在 Java 开发环境中,可以利用第三方库来完成 Word 文档到 XMLXMLHTML换过程。以下是具体的技术方案。 --- #### 使用 Spire.Doc 实现 Word XML Spire.Doc 是一种功能强大的文档处理库,能够轻松地将 Word 文件换为 XML 格式。以下是一个简单的代码示例: ```java import com.spire.doc.*; public class WordToXml { public static void main(String[] args) { // 加载 Word 测试文档 Document doc = new Document(); doc.loadFromFile("input.docx"); // 支持 .doc 或 .docx 格式的文件 // 将 Word 换为 XML 文件 doc.saveToFile("output.xml", FileFormat.Word_Xml); // 清理资源 doc.dispose(); } } ``` 此代码片段展示了如何通过 `saveToFile` 方法将 Word 文件保存为 XML 格式[^1]。 --- #### 使用 Apache Tika 提取 XML 数据并化为 HTML Apache Tika 是一款用于解析各种格式文档的强大工具,它可以从 Word 文档中提取纯文本或结构化数据,并将其换为其他格式(如 HTML)。下面是如何使用 Tika 进行换的一个例子: ```java import org.apache.tika.Tika; import org.apache.tika.metadata.Metadata; import org.apache.tika.parser.ParseContext; import org.apache.tika.sax.BodyContentHandler; import java.io.File; import java.io.FileInputStream; public class XmlToHtml { public static void main(String[] args) throws Exception { BodyContentHandler handler = new BodyContentHandler(); Metadata metadata = new Metadata(); FileInputStream inputstream = new FileInputStream(new File("output.xml")); ParseContext pcontext = new ParseContext(); // 初始化 Tika 配置 Tika tika = new Tika(); String htmlOutput = tika.parseToString(inputstream); // 输出 HTML 结果至指定路径 System.out.println(htmlOutput); } } ``` 这段代码演示了如何借助 Apache Tika 解析 XML 文件并将内容输出为 HTML 字符串[^5]。 --- #### 基于 Freemarker 替换模板中的占位符 如果需要更复杂的操作,比如动态填充数据,则可采用 Freemarker 来生成最终的 HTML 页面。首先准备好带有 `${}` 占位符的 XML 模板文件,接着用如下方式替换这些占位符: ```java import freemarker.template.Configuration; import freemarker.template.Template; import freemarker.template.Version; import java.io.FileWriter; import java.util.HashMap; import java.util.Map; public class TemplateProcessor { public static void main(String[] args) throws Exception { Configuration cfg = new Configuration(Configuration.VERSION_2_3_30); cfg.setDirectoryForTemplateLoading(new File("./templates/")); Map<String, Object> dataModel = new HashMap<>(); dataModel.put("title", "Example Title"); dataModel.put("content", "<p>This is an example paragraph.</p>"); Template template = cfg.getTemplate("template.ftl"); try (FileWriter writer = new FileWriter("output.html")) { template.process(dataModel, writer); } } } ``` 该脚本会读取名为 `template.ftl` 的 FreeMarker 模板文件,并根据传入的数据模型渲染出目标 HTML 文件[^6]。 --- #### 工具推荐 除了编程实现外,还有一些成熟的开源工具可以直接帮助完成这一系列任务: - **Pandoc**: Pandoc 是一个多用途的文档换工具,支持多种输入和输出格式,包括 DOCX -> XML -> HTML。 - **LibreOffice API**: LibreOffice 提供了一个命令行接口以及 SDK,允许开发者自动化执行类似的换流程。 例如,在终端运行以下命令即可快速完成换: ```bash pandoc -s input.docx -t html -o output.html ``` 这一步骤无需编写额外的程序逻辑就能满足基本需求[^7]。 --- ### 注意事项 当涉及复杂样式或者嵌套对象时,某些细节可能会丢失;因此建议提前验证源文档的内容是否适合此类简单映射关系下的迁移工作。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值