miércoles, marzo 18, 2009

Apache Xalan - Herramienta para procesar XML con XSL

Apache Xalan - Herramienta para procesar XML con XSL

En algunas ocasiones, tenemos que embarrarnos las manos utilizando XML de transformación para procesar un XML hacia otro formato de salida.

Se que existen algunas herramientas que realizan el trabajo, sin embargo quiero compartir con ustedes una sencilla herramienta (Apache Xalan), la cual podemos utilizar ya sean en Linux o Windows, mediante un "sh" o un "bat", o dentro de cualquier otro sistema que tenga una VM.

Para comentar un poco, Apache Xalan es una librería la cual expone tanto herramientas como un API para trabajar en Java con XML y XSL, entre otras cosas; en nuestro caso particular, solo nos interesa las herramientas.

Manos a la obra, lo primero que hacemos es dirigirnos al sitio de Apache Xalan y bajar la librería, si todo va bien, deberías tener:

xalan.jar
serializer.jar
xml-apis.jar
xercesImpl.jar

Coloca las librerías en el mismo lugar de trabajo, ahora dentro de nuestro .bat o .sh, colocamos las siguientes líneas:

java -classpath "xalan.jar;serializer.jar;xml-apis.jar;xercesImpl.jar" org.apache.xalan.xslt.Process -IN algunXML.xml -XSL algunXLS.xsl -OUT algunArchivoSalida.AlgunFormato

Los tokens, algunXML.xml, algunXLS.xls y algunArchivoSalida.AlgunFormato, representan el XML, el XLS y algún archivo en algún formato que estamos generando, cambie estos parámetros por los que us desea o recibalos como parámetro y listo, corra el archivo asegurándose que los jar se encuentren en la misma carpeta y listo, ya tiene un procesador XML/XSL.

Enjoy!
J

4 comentarios:

Anónimo dijo...

Hola

Me descargue la version
xalan-j_2_7_1-bin-2jars.zip

Seguí tus pasos y funciona todo correctamente cuando pongo de salida fichero.txt o fichero.html pero si el fichero de salida tiene extension fichero.xhtml al abrir da un error porque el fichero xhtml no se forma de manera correcta...¿Hay alguna solucion para esto? ¿Hay que hacer algo diferente a lo que indicas en el post?

Gracias por adelantado

Saludos

jsanca dijo...

Hola,

No se si estoy equivocado, pero un XHTML, en realidad es un HTML (con esa misma extensión), solo que tiene una declaracion de tipo de documento que indica al interprete que tipo de esquema sigue.

Toma en cuenta que Xalan, en realidad no le interesa el nombre del archivo, simplemente el XSL y XML son importantes.

Tambien, si describes el error!

Anónimo dijo...

Hola

El problema es que el XHTML no le genera bien probablemente porque el XSL no le se definir bien(vamos que ahora está mal definido).

EL XSL que tengo es:

< ?xml version="1.0" encoding="UTF-8"?>
< xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

< xsl:template match='/'>

< html>
< head>< title>HOLA< /title>< /head>

< body>
< h1> < xsl:apply-templates /> < /h1>
< /body>
< /html>
< /xsl:template>
< /xsl:stylesheet>

Y el XHTML que me genera sale asi:

< html>
< head>
< META http-equiv="Content-Type" content="text/html; charset=UTF-8">
< title>HOLA< /title>
< /head>
< body>
< h1> Estoy en XML< /h1>
< /body>
< /html>

por lo que en el XHTML falta la declaración del DOCTYPE

< !DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd" >

que el META salga en minusculas y cerrarlo...


Por lo que intuyo el XSL es el que debe de hacer estas cosas pero no se como...

jsanca dijo...

Hola,

A decir verdad no estoy muy seguro que sea el XLS el responsable de poner el DOCTYPE de forma automatica, me parece que para el XLS, simplemente toma un XML y lo procesa como texto y genera texto sin agregar nada mas de lo que el programador le indique, igual amigo, no me considero muy experto en XLS como para orientarte.