Meta enfrenta acusaciones explosivas por descargar 81,7 terabytes de libros pirateados para entrenar sus modelos de IA Llama, según correos electrónicos recién desclasificados. Los documentos revelan que la compañía buscó sistemáticamente contenido protegido por derechos de autor a través de redes de torrents, incluso con el conocimiento y aprobación del CEO Mark Zuckerberg.
Los Detalles del Escándalo
Según los correos internos filtrados:
- Meta descargó 35,7 terabytes de libros de Z-Library y LibGen, dos plataformas conocidas por alojar material pirateado.
- Empleados expresaron preocupación, con un ingeniero señalando: "Descargar torrents desde una laptop corporativa no se siente correcto".
- La compañía modificó metadatos y eliminó marcas de copyright para reducir riesgos legales.
- Operaron en "modo sigiloso", ajustando configuraciones para evitar compartir archivos (seeding) y minimizar rastreo.
Implicaciones Legales y la Defensa de Meta
El caso forma parte de una demanda colectiva presentada por autores como Sarah Silverman y Christopher Golden, quienes acusan a Meta de violar derechos de autor. La empresa alega "uso justo" (fair use) bajo la ley estadounidense, aunque sus propios abogados habían advertido sobre posibles consecuencias legales.
Este escándalo podría sentar un precedente crucial sobre cómo las empresas de tecnología obtienen datos para entrenar IA. Si los tribunales fallan en contra de Meta, podría obligar a la industria a buscar alternativas legales, impactando el desarrollo de modelos de inteligencia artificial.
¿Por Qué Importa Este Caso?
- Ética corporativa: Meta habría priorizado el acceso rápido a datos sobre el cumplimiento legal.
- Impacto en la industria: Si se confirma el uso ilegal, otras empresas podrían enfrentar demandas similares.
- Futuro de la IA: La escasez de datos legales podría ralentizar el avance de modelos como Llama.
Conclusión
Las acusaciones contra Meta revelan una práctica cuestionable en la recopilación de datos para IA, poniendo en duda los límites del fair use. Con la demanda en curso, el caso podría redefinir cómo las Big Tech utilizan contenido protegido.
¿Crees que las empresas deberían tener más restricciones al entrenar sus modelos con datos bajo copyright? ¡Déjanos tu opinión en los comentarios!