Opinión
La IA generativa se vuelve destructiva

Por David Bollero
Periodista
Internet Archive lleva tres décadas preservando la memoria de internet. Desde 1996, este archivo ha ido registrando desde páginas web, a audios y todo tipo de documentos, habiendo superado el pasado mes de octubre el billón de páginas web guardadas. Ahora, este repositorio sin ánimo de lucro está en peligro. ¿La causa? La Inteligencia Artificial (IA) generativa que, en lugar de crear en positivo, está destruyendo más de la cuenta.
La vida de Internet Archive no ha sido fácil. Durante su camino ha tenido que lidiar con el recelo de editoriales y discográficas, así como de ataques cibernéticos cuya autoría intelectual no resulta muy difícil de imaginar. Sin embargo, el proyecto libre, abierto y gratuito ha sabido rehacerse y superar todos estos palos en las ruedas; incluso, consiguió llegar a acuerdos con Universal Music Group y Sony Music Entertainment para preservar los discos antiguos.
Sin embargo, ahora se enfrenta a otro desafío aún mayor, derivado de las malas artes de los impulsores de la IA. Tal y como hemos abordado en alguna ocasión, las compañías detrás de grandes modelos de IA están entrenándolos utilizando técnicas de web scrapping, es decir, extrayendo automáticamente datos de los sitios web sin contar con autorización para ello.
Imaginen el botín que supone Internet Archive para estos saqueadores de lo ajeno que hacen negocio con la IA a costa del trabajo de otros. En el pasado, fueron sonadas las demandas de, por ejemplo, The New York Times contra OpenAI y Microsoft por utilizar sus textos sin permiso. Precisamente, esta cabecera neoyorquina es una de las que ha bloqueado el acceso a Internet Archive para rescatar contenido. No es el único, puesto que cerca de 250 medios de casi una decena de países han capado total o parcialmente el acceso a la biblioteca digital, con referencias del calibre de The Guardian o USA Today (titular del 87% de estas cabeceras).
Desde Internet Archive, el director de la Wayback Machine, Mark Graham, afirma que el proyecto no se ha tomado a la ligera la amenaza de los modelos de IA y su entrenamiento ilegal, habiendo limitado el abuso de estas automatizaciones de IA y tomado medidas para prevenir la extracción masiva de datos.
Los cierto es que ese bloqueo que está teniendo lugar porque, básicamente, las autoridades de los diferentes países están siendo muy laxos atando en corto a la IA, terminará por empobrecer el conocimiento colectivo. La Wayback Machine se ha convertido en los últimos 30 años en una herramienta muy útil para periodistas, investigadores, académicos, historiadores y público general, incluidas personas con algún tipo de discapacidad visual. La memoria digital se ha guardado durante todos estos años, impidiendo que se perdiera contenido valiosísimo de periódicos ya desaparecidos, páginas web que se esfumaron de internet dejando morir sus dominios o todo tipo de blogs cuando aún se llamaban bitácoras.
Conscientes de ello y a iniciativa de la Electronic Frontier Foundation y Fight for the Future, cientos de periodistas hemos firmado una carta de apoyo a la Wayback Machine de Internet Archive, en la que se destaca cómo "sin preferencias ni sesgos, Internet Archive preserva el registro histórico de nuestra época", al tiempo que es fiel a "su compromiso con la preservación del periodismo para las generaciones futuras". Y es que, a diferencia de lo que hacen los modelos de IA, Internet Archive no esquiva los muros de pago de los periódicos digitales ni extrae irresponsablemente datos de los medios de comunicación.
Mark Graham, que afirma que más de cien artículos de noticias al mes hacen referencia, citan o se basan en material preservado por la Wayback Machine, ha mostrado públicamente su agradecimiento, lamentando que muchos de los bloqueos que sufre son preventivos, sin que haya pruebas de uso indebido. Graham recuerda que un estudio del Pew Research Center de 2024 reveló que el 38% de las páginas web de hace una década ya no es accesible, habiéndose perdido para siempre casi el 25% de ellas. Sin embargo, cerca de un 15% sí ha podido ser rescatado gracias a la Wayback Machine.
La IA es voraz y por cada una de sus creaciones hay que pensar cuánto ha destruido antes. Empleos, acuíferos, energía, derechos de autor y conocimiento. Nada parece escapar a una tecnología con la que se enriquecen unos pocos a costa de la mayoría, sin que muchas veces ésta sea consciente de que terminará siendo víctima de ella.
Ni los medios de comunicación debieran confundirse de enemigo, por muy asustados que estén por la sangría de visitas que sufren en el salto del SEO (Search Engine Optimisation) al GEO (Generative Engine Optimisation), ni usted, querido lector, debiera caer en un uso irresponsable de una tecnología que, pese a su indudable utilidad, tiene un lado oscuro muy destructivo.
Comentarios de nuestros socias/os
¿Quieres comentar?Para ver los comentarios de nuestros socias y socios, primero tienes que iniciar sesión o registrarte.