Recuperacion y Organizacion de la Informacion

Motores de recuperacion de documentos XML RDF

El objetivo de la web es tratar el papel de los motores de recuperacion de documentos XML y RDF dentro de la recuperacion y organizacion de la informacion. Para ello se realizara una breve introduccion al concepto de web semántica y al por que de la necesidad de estos motores de recuperacion para despues analizar dos de ellos: swoogle y semanticwebsearch.

Introduccion a la web semantica

Hasta ahora la WWW (World Wide Web) estaba concebida mas para la recuperacion y organizacion de la informacion para los humanos que para manipular datos o procesar informacion de manera automatica. Sin embargo, se penso en una web que permitiera programar agentes que navegaran la infinitud de sitios pudiendo obtener la informacion que necesitamos sin tener que indicarles de donde obtenerla o que significado debe tener cada recurso, transformando esa informacion posteriormente a un formato entendible por nosotros.

Este es, por tanto, el objetivo de la web semantica: crear un medio universal para el intercambio de informacion basado en representaciones del significado de los recursos de la web, de una manera inteligible para las maquinas. Con esto se pretende aumentar la interoperabilidad entre los sistemas informaticos y disminuir la mediacion de operadores humanos en los procesos inteligentes del flujo de informacion.

Elementos basicos de la web semantica

Para saber mas sobre estos tipos de documentos ver la pagina sobre metadatos y documentos XML y RDF

La recuperacion de la informacion en la web semantica

Con los actuales motores de recuperacion de Internet la unica informacion que podemos obtener son contextos descontextualizados, es decir, si en un buscador se introduce la palabra Margarita apareceran resultados sobre personas con ese nombre, paginas sobre flores e incluso sobre la isla situada en Venezuela.

Con la web semántica se podran realizar busquedas precisas del tipo quiero el viaje con menor coste entre Madrid y Paris teniendo en cuenta que soy no fumador y me gusta ir en el pasillo.

El gran problema que presenta la recuperacion y organizacion de la informacion en esta web semantica es no existen motores de recuperación de caracter general que permitan busquedas basadas en documentos RDF por toda la web. Ni siquiera los grandes motores de recuperacion como google indizan RDF, ni basan su recuperacion de la informacion en ontologias.

Por este motivo la web semantica en la actualidad esta formada por:

Páginas del WIKI