tecnología

En busca de la respuesta perfecta

Microsoft, Yahoo y un nuevo buscador llamado Wolfram Alpha trabajan en el desarrollo de nuevos algoritmos que les permitan destronar a Google, rey absoluto del mercado, con el 80%

BLANCA SALVATIERRA MADRID 23/03/2009 08:00 Actualizado: 23/03/2009 10:29

Las compañías de Internet sueñan con desarrollar un algoritmo inteligente que sea capaz de interpretar las preguntas que los usuarios realizan en su buscador y ofrecerles, así, la respuesta más precisa posible. El internauta ha tenido que acostumbrase a plantear sus cuestiones de una determinada manera, y aprender los símbolos que el algoritmo de búsqueda es capaz de procesar. La idea de que todo el contenido está en Internet y que encontrarlo sólo depende de saber plantear la pregunta de forma adecuada deja en manos del usuario un papel que debería jugar el servicio que ofrece las respuestas. Google, Yahoo, Microsoft y decenas de proyectos más pequeños pero no menos ambiciosos trabajan en nuevos algoritmos y tecnologías para que, sea cual sea la forma de preguntar del usuario, ofrezcan la respuesta perfecta.

Google es el rey indiscutible de las búsquedas mundiales, con más de un 80% de cuota de mercado según el informe de febrero de la consultora Net Applications. Le siguen Yahoo con un 10% y Microsoft con un 4,71%. Se calcula que el negocio publicitario de Google, basado en gran medida en los enlaces patrocinados de sus búsquedas, le reportan casi 17.000 millones de euros al año, una cifra demasiado jugosa como para no intentar hacerse con una parte de ella.

Las búsquedas semánticas establecen relaciones entre conceptos, más allá de la forma

Kumo, el cambio semántico

Microsoft está realizando una campaña de servicios combinados bajo la denominación de Windows Live que, con herramientas estrella como Sky Drive, que ofrece 25 GB de espacio on-line gratis, trata de conseguir que los usuarios se queden en su círculo de servicios (Search, Messenger, Hotmail o Maps). Pero perfeccionar las búsquedas para ganar usuarios es una guerra de largo recorrido que sólo acaba de empezar. Microsoft ya está realizando pruebas de forma interna con Kumo, un nuevo servicio de búsqueda que parece llamado a sustituir al actual Live Search. Kumo, cuya existencia se conoció tras una filtración, supone un cambio en la tecnología que se emplea actualmente en la búsqueda de Microsoft, añadiéndole un componente semántico. Las búsquedas semánticas establecen relaciones entre conceptos, más allá de la forma sintáctica de las palabras. Es la única manera de que si el internauta escribe, por ejemplo, la frase "amigos de Picasso en París", el buscador interprete exactamente eso y no muestre un batiburrillo de páginas que incluyen los tres conceptos.

"La mayoría de las funciones que se están probando no llegarán al mercado español hasta 2010", matiza el jefe de producto de la División de consumo de Microsoft Ibérica, Juan Antonio Roncero. Pero Microsoft no es la única que está investigando las búsquedas más allá de la sintáctica. El físico Stephen Wolfram, creador del sistema de computación simbólica Mathematica, considera que los actuales sistemas tienen mucho que mejorar. Wolfram ha anunciado que en mayo lanzará Wolfram Alpha, un buscador inteligente que por el momento sólo han visto unos pocos y que promete respuestas exactas a partir de preguntas planteadas en lenguaje natural, algo en lo que todos trabajan pero que, de momento, nadie ha conseguido de forma completa.

El físico Stephen Wolfram promete respuestas a partir de lenguaje natural

La compañía española Isoco trabaja con un buscador semántico llamado Naveganza que ya se aplica en entornos cerrados. Su director de innovación, Jesús Contreras, sostiene que, aunque existe la visión de que en Internet se pueden crear pequeñas islas interconectadas que se entiendan entre sí, a día de hoy esta visión sólo puede aplicarse plenamente en un ambiente controlado. "Naveganza funciona ya en la administración pública o dentro de las compañías, pero dar el salto a la Web es muy difícil", afirma, y sigue: "Con un poco de semántica ya se consigue ir muy lejos", parafraseando al investigador de inteligencia artificial y web semántica James Hendler.

Fórmulas alternativas

El vicepresidente europeo de investigación de Yahoo, Ricardo Baeza, argumenta que, aunque todas las compañías trabajan para aplicar la semántica en sus buscadores, por el momento es imposible conseguir uno en el que se aplique plenamente. "Estaríamos hablando de la construcción de una inteligencia artificial perfecta, y es algo que no se ha logrado. En investigación hay que ser muy cuidadosos antes de afirmar algo así", añade.

Los expertos se muestran escépticos ante un buscador global plenamente semántico

Baeza destaca que una de las fórmulas en las que está trabajando Yahoo para recuperar cuota de mercado es el empleo de tecnologías diferenciadas. En este sentido, Correlator (sólo en inglés) es un prototipo experimental de buscador centrado en la Wikipedia que muestra los resultados creando una página con los distintos extractos encontrados en la enciclopedia on-line. También realiza búsquedas de fechas y lugares, con una web que incluye líneas de tiempo y mapas.

Correlator no es la única tecnología avanzada sobre la que trabaja el departamento de investigación de Yahoo. Con servicios de búsqueda abiertos a terceros como Boss, la compañía logró alcanzar más de 10 millones de peticiones diarias a finales del año pasado según sus propias cifras.

¿Y qué hace Google mientras tanto? Fuentes de la compañía aseguran que su algoritmo de búsqueda está en constante evolución, aunque sin cambios drásticos. En cuanto a las búsquedas semánticas, Google indica que no están preparando nada específico, aunque los medios especializados sostienen que se trata de un plato demasiado suculento para que la compañía lo deje pasar.

La Web de los datos 

Martín Álvarez Espinar, responsable de la Oficina Española de la W3C

Se cumplen 20 años desde que el actual director del World Wide Web Consortium (W3C), Tim Berners-Lee, presentase el primer borrador sobre Internet. Durante estos años se ha publicado una incalculable cantidad de información, hecho que ha llevado a los buscadores a ocupar un puesto de gran relevancia para la indexación de datos en la Web. No obstante, estos siempre han presentado un problema de eficacia debido a la ambigüedad del lenguaje natural, presente en los sitios web y utilizado por los usuarios en la búsqueda de información.

Los motores de búsqueda tradicionales se basan en coincidencias sintácticas de palabras incluidas en los documentos y, aunque ofrezcan algoritmos optimizados y mejoras de uso, es complicado obtener resultados concisos y adecuados que eviten la
frustración del usuario.

Esta limitación se solventa con la evolución que está experimentando la Web, que no sólo está compuesta por documentos destinados a las personas sino que además incluye datos que pueden interpretar las máquinas, teniendo en cuenta los conceptos de la información representada (persona, organización, localización, etc.) y las
relaciones establecidas entre estos conceptos.

A través de nuevos estándares, Internet está creciendo hacia la denominada Web semántica, una gran base de datos global. Si a esto le unimos los nuevos mecanismos de acceso mediante dispositivos móviles, los cuales ofrecen funcionalidades para determinar el contexto en el que se encuentra el usuario (su posición, características del terminal, etc.), las consultas se enriquecen más allá de las palabras que las componen.
Las aplicaciones web, y los buscadores en concreto, pueden y deben hacer uso de las posibilidades de la composición de recursos adecuados a la naturaleza de la búsqueda y a las preferencias de los usuarios para mostrar un resultado más completo, preciso y adecuado que el que se obtiene a través de la
búsqueda simple.

9 Comentarios
  • Clonado
    #1 Vota Vota

    -5 i Clonado 23-03-2009 10:34

    Yo creo que se equivocan, ya que me parece a mí que por lo que realmente triunfó Google es por lo simple que es, no por que haga búsquedas más o menos acertadas (ya que ultimamente no da mucho en el clavo de lo que buscas). Así que se quiten de algoritmos y limpien sus páginas de publicidad, de aplicaciones chorras y demás y puede los usuarios empecemos a usarlos.

  • sin semntica
    #2 Vota Vota

    1 i sin semntica 23-03-2009 12:13

    qué raro ... un articulo de blanca salvatierra dando bombo a microsoft :D a ver, el problema fundamental de un buscador semántico es que antes de empezar tiene que hacer un análisis semántico del contenido. por eso es impensable llevarlo a la web, eso sólo puede funcionar en contextos concretos y supervisados. y luego está el tema de la ambigüedad del lenguaje natural y el pequeño detalle de que hay un montón de ellos. si quitamos entonces de la noticia este disparate qué queda? que hemos leído "microsoft" 4 o 5 veces (más). como si pintara algo ...

  • De acuerdo con

    El error de bulto de al menos los "intentos" explicados en el artículo es que si vas a buscar en un entorno concreto, el web en este caso, tendrás que adaptarte a los contenidos del web, que tienen una manera de exponer contenidos muy particular. Digo yo! Como hizo Google, que desde su origen (por cierto, hasta hoy mismo, ¿eh "Clonado"?) interpretó perfectamente este hecho, y basa sus búsquedas en el índice de relevancia en el resto de espacio web, por ejemplo.

  • YoMismo
    #4 Vota Vota

    -5 i YoMismo 23-03-2009 14:56

    Da lo mismo... MSN, con "Kumo" o sin él te sacará los resultados conforme a que las demás empresas paguen más o menos por ello. El algoritmo de Google, por otra parte, es un concepto sencillísimo y muy potente: cuantas más páginas en Internet contengan un enlace al resultado, más probabilidad hay de que sea lo que tú quieres encontrar, por lo que te lo pondrá antes que otros resultados (por el simple hecho de que en la mayoría de los casos buscas lo mismo que otros ya han buscado, o lo que otros también han considerado importante o lo suficientemente relevante como para enlazarlo en su misma página). Google basa su puntuación en la puntuación "virtual" que le concede Internet entera, como un todo, no un grupo de personas que deciden si tal o cual web es más importante que otra. Ese es el gran acierto de Google, y por eso es el mejor con diferencia (extrapolando, es como una "elección democrática" de importancia). Lo del "concepto semántico" va implícito en ello. Que ahora se quiera sacar esta historia con nombre técnico y en cierto modo rimbombante por otras compañías me suena a marketing y venta de humo.

  • t mismo
    #5 Vota Vota

    0 i t mismo 23-03-2009 15:40

    son cosas diferentes. en el pagerank de google no va implícito ningún concepto semántico en absoluto. podría haberlo en un contexto cerrado y controlado, pero la web no es eso. lo que hay en google es una aproximación estadística y el aprovechamiento de cierta dinámica. pero esa dinámica es engañosa y está llena de ruído, no es para nada semántica y por eso google necesita estar cambiando su algoritmo constantemente. porque no es semántica, es un simple truco que resulta práctico, pero se vicia rápidamente con la propia dinámica que explota. lo que menciona el artículo, estoy de acuerdo, es humo. humo de millones de dólares. quien los pillara! :)

  • YoMismo
    #6 Vota Vota

    0 i YoMismo 23-03-2009 18:05

    Con lo de "implícito" me refiero a que si una web comenta otra y pega el link, está claro que se refiere a ese concepto semántico (de hecho, Google ofrece a veces resultados que no contienen todas las palabras, sino que esas palabras estaban en webs que referencian a esa). Un ejemplo: se busca "comprar calculadoras" y se compara la calidad del resultado de la búsqueda entre Google y el resto. Por mi parte, no creo que un buscador semántico pueda mejorar esos resultados de Google mucho más... Y no es que sea un fan de Google, es solo que los resultados son mejores (MUCHO mejores) y solo probándolo se ve. Si fueran mejor los de MSN, pues usaría MSN, pero como no es así...

  • Juanan Roncero
    #7 Vota Vota

    1 i Juanan Roncero 23-03-2009 18:22

    Hola, Soy Juan Antonio Roncero, responsable de Live Search en España. Me gustaría hacer un par de aclaraciones a los comentarios que estoy leyendo hoy aquí. Primero, Live Search no ordena sus resultados según las empresas que paguen por aparecer como he leído en un comentario, tiene un algoritmo propio de ordenación en el que os puedo asegurar que no influye ningún criterio económico en los resultados naturales. Obviamente los resultados patrocinados funcionan de una manera similar a los de la competencia. Segundo, otros comentarios hablan sobre si hay una apuesta semántica en Microsoft o no, la apuesta de Microsoft por la web semántica comenzó con la adquisición de Powerset (www.powerset.com) que es un buscador semántico sobre la Wikipedia y que estamos estudiando cómo adaptarlo a un sistema de búsqueda global (no solo a la wikipedia) este concepto es 100% semántico. Estoy de acuerdo con que la búsqueda semántica no resuelve el 100% de la casuística de búsqueda en internet y en muchos casos la búsqueda no semántica funciona mejor, por eso la situación ideal para nosotros es un híbrido que resuelva la búsqueda del usuario en cada situación.

  • YoMismo
    #8 Vota Vota

    6 i YoMismo 23-03-2009 18:41

    Hola, Juan Antonio. Yo lo he comentado porque en la gran mayoría de veces, al buscar en MSN (o Live Search), me han salido resultados muy sospechosos de haber sido influidos económicamente, ya que no entiendo qué de relevante tiene que me saque antes empresas de venta que webs públicas, por ejemplo (se puede probar perfectamente: se busca "barcelona" en Google y en Live Search, y mientras que en Google me saca las webs públicas al principio, en Live Search saca tiendas de moda de "Custó Barcelona" antes que la propia web del Ayuntamiento de la ciudad. Tiene bemoles, la cosa...). Si no es cosa de influencia económica, creo que el algoritmo debería ser revisado concienzudamente, porque es un poco... sesgado, digamos. O al menos, así me lo parece en vista de los resultados. Un saludo.

  • Hugo Zaragoza
    #9 Vota Vota

    0 i Hugo Zaragoza 26-03-2009 10:51

    Podeis probar Correlator aqui: http://correlator.sandbox.yahoo.net/

Cargando...

Cargando

Generado: 2012-05-28 19:56:32