Download Automatizacion de Tareas en El Web PDF

TitleAutomatizacion de Tareas en El Web
TagsWorld Wide Web Technology Web Browser Software Server (Computing)
File Size1.2 MB
Total Pages256
Document Text Contents
Page 1

UNIVERSIDAD CARLOS III DE MADRID

Departamento de Ingenieŕıa Telemática

Doctorado en Tecnoloǵıas de las Comunicaciones

TESIS DOCTORAL

AUTOMATIZACIÓN DE TAREAS

EN EL WEB:

UNA PROPUESTA BASADA EN

ESTÁNDARES

Autor: Vicente Luque Centeno
Licenciado en Informática

Directores: Carlos Delgado Kloos y Luis Sánchez Fernández
Doctores Ingenieros de Telecomunicación

Page 128

cos posibles, básicamente los mencionados anteriormente junto con los nodos
(referencias a elementos del documento XML, incluyendo el elemento ráız
o página), en los posteriores borradores del estándar el conjunto de tipos
básicos posibles ha sido ampliados con la incorporación de tipos de datos
provenientes de XML Schema (como fechas, duraciones, URIs, ...). Ello ha
dotado al lenguaje de una mayor riqueza al incluir aśı tipos especializados
que, con frecuencia, aparecen en los documentos que se publican en el Web.

4.2.2. Variables

Las variables son repositorios en memoria que albergan resultados de ex-
presiones XPath y que constituyen la forma de comunicar XPath con su
entorno. Gracias a las variables, expresiones XPath pueden utilizar los resul-
tados de otras expresiones XPath. El acceso al valor de una variable dentro
de XPath se representa con el śımbolo del dólar $ seguido del nombre de la
variable. Las variables de XPath son accesibles por el lenguaje anfitrión de
XPath de forma que éste también es capaz de manipular los resultados de
expresiones XPath.

4.2.3. Operadores aritmético-lógicos y de comparación

XPath permite especificar operaciones aritméticas (sumas, restas, mul-
tiplicaciones, divisiones, ...) aśı como operaciones lógicas (and, or, not) y
comparaciones de diversos tipos (igualdad, menor que, menor o igual que,
mayor que ...), incluyendo también operadores para comparar el orden de
aparición de nodos dentro del documento. Todo ello permite la creación de
expresiones sencillas capaces de calcular operaciones habituales de análisis
de datos en páginas XML que pueden ser combinadas fácilmente.

4.2.4. Ejes de navegación

Los ejes de navegación son indicadores acerca de los caminos que de-
ben seguirse para saltar de un nodo a otro dentro del árbol del documento.
Normalmente esta navegación necesita hacerse en varios saltos, razón por la
cual las expresiones XPath están divididas en distintos steps o pasos, deli-
mitados por barras inclinadas /. Dentro de cada paso, los saltos entre nodos
están condicionados por los denominados ejes de navegación que indican la
relación vecinal existente entre el nodo de origen y el nodo destino de cada

110

Page 129

salto. Estas distintas formas de proximidad vecinal son contempladas por el
estándar de forma que sean aśı explorables todos los nodos, tanto internos
a un nodo cualquiera (child y descendant), como externos al mismo (pa-
rent, ancestor, preceding-sibling y following-sibling). El acceso a los
atributos XML de un nodo se puede realizar atravesando el eje attribute.
XPath proporciona a su vez una sintaxis abreviada para cada uno de esos
ejes de navegación, lo cual permite la construcción de expresiones más cortas
y legibles. La tabla 4.2 muestra un listado de los ejes de XPath.

Eje Nodos considerados

ancestor Cualquier nodo en el camino hacia la ráız

ancestor-or-self Lo mismo, pero incluyéndolo

attribute Sólo los nodos atributo del árbol

child Los nodos directamente contenidos por el nodo actual

descendant Los nodos del subárbol cuya ráız es el nodo actual

descendant-or-self Lo mismo, pero incluyéndolo

following Los nodos posteriores al actual, excluyendo descendientes

following-sibling Nodos hermanos posteriores al actual

parent El ascendiente directo de un nodo

preceding Los nodos anteriores al actual, excluyendo ancestros

preceding-sibling Nodos hermanos anteriores al actual

self El nodo actual

Cuadro 4.2: Ejes de XPath partiendo de un nodo contexto

4.2.5. Predicados

Si bien suele ser necesario a menudo atravesar varios nodos antes de po-
der llegar a los elementos que interesa finalmente acceder, lo cierto es que
muchas veces el atravesamiento de ciertos de esos nodos que aparecen di-
reccionables por un eje de navegación resultan no deseables. El uso de los
ejes de navegación, aunque esté bien combinado con una adecuada elección
de los nombres de los elementos, resulta muchas veces insuficiente para evi-
tar la navegación por nodos no deseados. Por esa razón, XPath proporciona
mecanismos adecuados para permitir la selección, conforme a criterios espe-
cificables por el usuario, de los elementos de una secuencia obtenida en cada
paso de una expresión XPath, de manera que sólo sean seleccionados del

111

Page 255

[107] J. Robie, J. Lapp, and D. Schach. Xml query language (xql).
http://www.w3.org/TandS/QL/QL98/pp/xql.html.

[108] E. Rudolph, J. Grabowski, and P. Graubmann. Towards a harmonization
of UML-Sequence Diagrams and MSC. En R. Dsoulli, G. von Bochmann,
and Y. Lahav, editors, SDL’99: The Next Millennium, Proceedings of the
9th SDL Forum, Montreal, Canada, June 1999. Elsevier Science Publishers.

[109] M. d. T. y. A. S. Secretaŕıa General de Asuntos Sociales. Test de accesibilidad
web. www.tawdis.net.

[110] M. P. Singh. Deep web structure. Internet Computing, 6(5):4–5, Sept.-Oct.
2002.

[111] H. Snoussi, L. Magnin, and J.-Y. Nie. Heterogeneous web data extraction
using ontology. En Third International Bi-Conference Workshop on Agent-
orienter Information Systems (AOIS-2001), Montreal (Canada, 2001.

[112] Sun. Package java.net. En JavaTM 2 Platform Standard Edition,
www.sun.com/java.

[113] S. Thompson. Haskell: The craft of functional programming. En Addison-
Wesley, ISBN 0-201-34275-8, 1996.

[114] S. Todd, F. Parr, and M. Conner. A primer for httpr. En An Overview of
the Reliable HTTP Protocol, IBM, April 2002.

[115] A. Tost. Xml document processing in java using xpath and xslt.
www.javaworld.com/javaworld/jw-09-2000/jw-0908-xpath.html.

[116] K. e. Turner. Using formal description techniques. En An Introduction to
Estelle, LOTOS, and SDL, Wiley, 1993.

[117] W3C. Hypertext markup language (html and xhtml).
www.w3.org/MarkUp/.

[118] W3C. Libwww - the w3c protocol library. En www.w3.org/Library/.
[119] W3C. Marking document changes: The ins and del elements. En Especifi-

cación de HTML 4.01, www.w3.org/TR/html4/struct/text.html#h− 9,4.
[120] W3C. Mathematical markup language (mathml). www.w3.org/TR/REC-

MathML.
[121] W3C. Policies relating to web accessibility.

http://www.w3.org/WAI/Policy/.
[122] W3C. [email protected] mail archives.

lists.w3.org/Archives/Public/public-qt-comments/.
[123] W3C. Resource description framework (rdf). www.w3.org/RDF.
[124] W3C. Scalable vector graphics (svg). www.w3.org/Graphics/SVG.
[125] W3C. Synchronized multimedia integration language.

www.w3.org/AudioVideo.
[126] W3C. W3c link checker. validator.w3.org/checklink.
[127] W3C. [email protected] mail archives.

lists.w3.org/Archives/Public/www-xpath-comments/.
[128] W3C. Web content accessibility guidelines 1.0. W3C Recommendation 5-

May-1999, 1999.

237

Page 256

[129] W3C. Xml path language (xpath) version 1.0. W3C Recommendation 16
November 1999, 1999.

[130] W3C. Xsl transformations (xslt) version 1.0. W3C Recommendation 16
November 1999, 1999.

[131] W3C. Document object model (dom) level 2. W3C Recommendation 13
November, 2000, 2000.

[132] W3C. Extensible markup language (xml) 1.0 (second edition). W3C Re-
commendation 6 October 2000, 2000.

[133] W3C. Del - data extraction language. W3C Note 31 October 2001, 2001.
[134] W3C. Xml schema. W3C Recommendation, 2 May 2001, 2001.
[135] W3C. Xml syntax for xquery 1.0 (xqueryx). W3C Working Draft 07 June

2001, 2001.
[136] W3C. Techniques for authoring tool accessibility guidelines 1.0. W3C Note

29-Oct-2002, 2002.
[137] W3C. User agent accessibility guidelines 1.0. W3C Recommendation 17-

Dec-2002, 2002.
[138] W3C. Xml pointer language (xpointer). W3C Working Draft 16 August

2002, 2002.
[139] W3C. Document object model (dom) level 2 html specification version 1.0.

W3C Recommendation 09 January 2003, 2003.
[140] W3C. Web ontology language (owl) reference version 1.0. En W3C Working

Draft 21 February 2003, http://www.w3.org/2001/sw/, 2003.
[141] W3C. Xml path language (xpath) 2.0. W3C Working Draft 02 May 2003,

2003.
[142] W3C. Xquery 1.0: An xml query language. W3C Working Draft 02 May

2003, 2003.
[143] W3C. Xsl transformations (xslt) version 2.0. W3C Working Draft 02 May

2003, 2003.
[144] P. Wadler. A formal model of pattern matching in XSL. Technical report,

1999.
[145] P. Wadler. Two semantics for xpath. 1999. http://www.cs.bell-labs.com/

who/wadler/topics/xml.html., 1999.
[146] D. Wahlin. Parse html pages to extract data.

www.fawcette.com/xmlmag/2002 12/online/xml wahlin 12 18 02/, De-
cember 18, 2002.

[147] L. Wall. Perl language, v5.004. En Freely available software package, June
1997, ftp://ftp.perl.com/pub/perl/src/CPAN/5.0/perl5.004.tar.gz.

[148] XML:DB. Xupdate working draft, last release september 14, 2000.
http://www.xmldb.org/xupdate/, 2000.

[149] L. S. Zettlemoyer and R. S. Amant. A visual medium for programmatic
control of interactive applications. En CHI, pags 199–206, 1999.

238

Similer Documents