Recuperacion y Organizacion de la Informacion
Motores de recuperacion de documentos XML RDF
El objetivo de la web es tratar el papel de los motores de recuperacion de documentos XML y RDF dentro de la recuperacion y organizacion de la informacion. Para ello se realizara una breve introduccion al concepto de web semántica y al por que de la necesidad de estos motores de recuperacion para despues analizar dos de ellos: swoogle y semanticwebsearch.
Introduccion a la web semantica
Hasta ahora la WWW (World Wide Web) estaba concebida mas para la recuperacion y organizacion de la informacion para los humanos que para manipular datos o procesar informacion de manera automatica. Sin embargo, se penso en una web que permitiera programar agentes que navegaran la infinitud de sitios pudiendo obtener la informacion que necesitamos sin tener que indicarles de donde obtenerla o que significado debe tener cada recurso, transformando esa informacion posteriormente a un formato entendible por nosotros.
Este es, por tanto, el objetivo de la web semantica: crear un medio universal para el intercambio de informacion basado en representaciones del significado de los recursos de la web, de una manera inteligible para las maquinas. Con esto se pretende aumentar la interoperabilidad entre los sistemas informaticos y disminuir la mediacion de operadores humanos en los procesos inteligentes del flujo de informacion.
Elementos basicos de la web semantica
- XML (eXtensive Markup Language)
- RDF (Resource Description Framework)
Para saber mas sobre estos tipos de documentos ver la pagina sobre metadatos y documentos XML y RDF
- Ontologias - Colecciones de enunciados redactados en un lenguaje, como el RDF, que define las relaciones entre conceptos y especifica reglas logicas para razonar con ellos
- Agentes - Encargados de realizar las tareas para los usuarios de la web semantica
La recuperacion de la informacion en la web semantica
Con los actuales motores de recuperacion de Internet la unica informacion que podemos obtener son contextos descontextualizados, es decir, si en un buscador se introduce la palabra Margarita apareceran resultados sobre personas con ese nombre, paginas sobre flores e incluso sobre la isla situada en Venezuela.
Con la web semántica se podran realizar busquedas precisas del tipo quiero el viaje con menor coste entre Madrid y Paris teniendo en cuenta que soy no fumador y me gusta ir en el pasillo.
El gran problema que presenta la recuperacion y organizacion de la informacion en esta web semantica es no existen motores de recuperación de caracter general que permitan busquedas basadas en documentos RDF por toda la web. Ni siquiera los grandes motores de recuperacion como google indizan RDF, ni basan su recuperacion de la informacion en ontologias.
Por este motivo la web semantica en la actualidad esta formada por:
- Un conjunto de sitios o dominios particulares que utilizan sus ontologias ad-hoc y desarrollan sus propios motores de recuperacion.
- Web 2.0, un conjunto de aplicaciones que comprenden algunas notaciones semanticas (RSS, FOAF) y permiten añadir y difundir contenidos en un contexto dirigido al usuario.