Privacidad y aprendizaje automático: el uso de datos personales en el entrenamiento de la IA

Las redes sociales se presentan a los usuarios como una especie de refugio personal, un espacio donde compartir recuerdos, pensamientos o momentos cotidianos de nuestro día a día. Pero lo que muchos aún desconocen (o prefieren ignorar en la mayoría de las ocasiones) es que esa aparente intimidad es, en realidad, una vitrina pública hacia el mundo exterior. Detrás de cada publicación, reacción o comentario, hay un flujo constante de datos personales que podrían estar alimentando a los sistemas de inteligencia artificial actuales.

Debemos plantearnos ciertas preguntas como las siguientes: ¿Qué se hace con esa información? ¿Realmente sabemos qué aceptamos cuando pulsamos “acepto” en los términos y condiciones? ¿Somos conscientes de que nuestros datos pueden ser utilizados para otros fines que van mucho más allá de la experiencia del usuario?.

Aclarar de antemano, que no estoy en contra del uso de la inteligencia artificial por parte de los usuarios. Al contrario, reconozco el potencial que tiene si se utiliza de la manera adecuada, como una herramienta, la cual puede facilitar ciertas tareas o aportar soluciones en varios ámbitos. Esta publicación, va orientada sobre todo a como las grandes empresas tecnológicas usan (de forma directa o indirecta) los datos e información pública de sus usuarios.

Datos útiles

Como mencionaba al principio, las redes sociales se han convertido en una herramienta casi indispensable. Además, nuestro perfil en redes sociales no solo muestra quiénes somos, sino que también cómo queremos ser percibidos.

Aunque el perfil público de empresas y organizaciones también son importantes, me centraré en escribir sobre el perfil o identidad digital del usuario común y del porqué es importante tener nuestro perfil bien configurado en términos de privacidad, seguridad e interacción en lo que respecta al entrenamiento de los algoritmos de inteligencia artificial que operan en las diferentes plataformas de redes sociales.

Todo lo que realizamos en una red social genera datos e información sobre el uso que le damos. Las plataformas no solo almacenan esa información, sino que la procesan en tiempo real. Y la pregunta que nos podemos hacer en estos momentos es: ¿Cuál es el objetivo principal?. Pues, el objetivo sería utilizar a los usuarios como fuente de datos para realizar un proceso de entrenamiento a través de los algoritmos y de la IA usada por las empresas que desarrollan una red social (como por ejemplo Meta, con Facebook o Instagram).

Este proceso de entrenamiento sirve para el funcionamiento de diferentes tecnologías o acciones como la detección automática de contenido, la segmentación publicitaria o incluso, el reconocimiento facial.

Por ejemplo, si subimos una imagen y etiquetamos a nuestros amigos estamos ayudando a los algoritmos en el aprendizaje del reconocimiento de los rostros. Si estamos viendo un vídeo, y lo pausamos durante un tiempo, sirve para enseñarle al algoritmo qué tipo de contenido nos atrae más. Esto, también ocurre con los “me gusta” que damos a cada publicación.

Sin saberlo, nosotros mismos somos los que estamos contribuyendo en el entrenamiento de la inteligencia artificial a través de nuestros datos e interacciones.

Casos concretos: Facebook, Instagram y WhatsApp

Desde el pasado mes de mayo, Meta cambió su política de privacidad de sus principales plataformas de redes sociales como lo son Instagram y Facebook. En sus nuevas políticas anunció que comenzarán a usar contenido público de los usuarios europeos para entrenar sus modelos de inteligencia artificial. Esto incluye publicaciones, fotos, comentarios e interacciones que hayan sido compartidas en sus plataformas, así como las conversaciones con su asistente Meta AI.

Facebook AI

El último día para oponerse a esta nueva política de privacidad, fue el 27 de Mayo de este año. A partir de esa fecha, esta opción de compartir con la IA toda la actividad pública de sus usuarios ha pasado a estar activada por defecto y sin derecho a poder revocar el consentimiento. Quedan exentos de ello, los menores de 18 años.

Meta justifica esta práctica argumentando que los datos públicos y las preguntas hechas a Meta AI ayudarán a sus modelos a comprender mejor los idiomas, referencias culturales e intereses locales en Europa.

Organizaciones como NOYB, sostienen que este cambio es especialmente preocupante porque afecta a los datos personales de unos 4.000 millones de usuarios de Meta.

Ante esta medida, es importante recordar que, aunque se trata de contenido público, no es lo mismo publicar algo que cederlo para entrenar un algoritmo. Como señaló NOYB, “la lógica de Meta es que si lo hiciste público, renunciaste a controlarlo”.

La compañía de Mark Zuckerberg (Meta), desde hace más de un año (mayo del año 2024), ya intentó aplicar esta decisión de usar las interacciones con la IA y datos públicos de los usuarios mayores de edad en la Unión Europea, aunque tuvo que detenerlo en junio de ese mismo año gracias a las autoridades de protección de datos europeas, debido a que esta medida provocaba una gran preocupación en lo que a la privacidad de los datos se refiere.

Respecto a WhatsApp, sigue usando la tecnología de Meta IA en la aplicación para ir agregando funciones como la siguiente (aun en beta). Recientemente, según el portal WABetaInfo, Meta está desarrollando una función, la cual, permitirá resumir las conversaciones de sus usuarios utilizando inteligencia artificial. Aunque esta función puede ser útil, ya que permitiría resumir mensajes en grupos con un alto volumen de mensajes, hay que tener en cuenta como WhatsApp maneja, usa y protege esta información.

En principio, la función será opcional y requerirá que los propios usuarios activen el “Procesamiento Privado” desde la configuración de la aplicación para que los mensajes puedan ser procesados y resumidos. Meta ha anunciado que esta novedad comenzará a desplegarse de forma progresiva durante las próximas semanas, aunque sin una fecha definitiva para su lanzamiento global.

Sin más está decir que existen preocupaciones en torno al tratamiento de los datos personales en las plataformas de Meta ya mencionadas, debido al historial de escándalos que acumula la compañía por vulnerar la privacidad de los usuarios. Por ello, personalmente recomiendo no usar WhatsApp como aplicación de mensajería, ya que existen alternativas mucho mejores, centradas en la privacidad, como Signal o Element, las cuales, ofrecen funciones similares sin comprometer la protección de la información.

Entre los escándalos más conocidos de vulneración de la privacidad de la compañía a sus usuarios se encuentra cuando Meta fue sancionada con una multa de 1.200 millones de euros por parte de la Autoridad de Protección de Datos de Irlanda. La sanción se debió al traslado de información de usuarios europeos a servidores en Estados Unidos, sin garantizar adecuadamente los derechos fundamentales de privacidad establecidos por la normativa europea.

Artículo de El Confidencial 
 

En otro caso de gran resonancia, La Comisión Federal de Comercio de Estados Unidos (FTC, por sus siglas en inglés) impuso a Meta una multa récord de 5.000 millones de dólares por las malas prácticas de seguridad y protección de datos de la plataforma. A Facebook, se le acusaba de compartir los datos de 87 millones de usuarios con Cambridge Analytica. Un ex empleado de la propia Cambridge Analytica afirmó que los datos e información de casi 50 millones de usuarios fue recolectada a través de redes de amigos en Facebook, afectando principalmente a usuarios estadounidenses.

¿Un cambio en 2026?

A finales de 2023, la Unión Europea finalizó su Ley de Inteligencia Artificial (AI Act por sus siglas en inglés), la primera ley integral que pretende regular el uso de la IA por parte de las empresas. Esta ley, entrará totalmente en vigor en agosto del año 2026, y se aplicará a cualquier empresa que opere en Europa. El principal objetivo de la Ley es garantizar que las empresas que desarrollen y utilicen sistemas de inteligencia artificial, lo hagan de forma segura, ética y respetando los derechos y la privacidad de los consumidores.

Conclusión

A modo de conclusión y resumen de todo lo mencionado en esta entrada, podría comentar que las redes sociales como tal no solo buscan conectar a las personas, sino que están diseñadas para fomentar el uso constante y prolongado de sus servicios. Esta aparente adicción tiene un propósito claro: convertir cada interacción del usuario en una fuente valiosa de datos.

En la práctica, somos los propios usuarios quienes, sin saberlo, alimentamos y entrenamos los sistemas de inteligencia artificial que operan tras estas plataformas. Cada "me gusta", comentario, publicación o búsqueda contribuye a perfeccionar los algoritmos que aprenden a reconocer patrones de comportamiento, intereses y preferencias individuales.

La recopilación masiva de datos permite a estas compañías analizar el contenido que se comparte, facilitando así el desarrollo de modelos predictivos cada vez más sofisticados. De este modo, la actividad cotidiana en redes sociales no solo refleja la vida o perfil digital de los usuarios, sino que también se convierte en la materia prima con la que las grandes tecnológicas (Google, Meta o Microsoft) afinan sus herramientas de inteligencia artificial.

El entrenamiento de la inteligencia artificial plantea interrogantes importantes sobre privacidad y el uso ético de la información personal extraída.

 

Y hasta aquí el final de esta entrada.

 

Bibliografía:

https://apnews.com/article/facebook-instagram-meta-ai-europe-c785dc3591ae3c49543c435fc15379fb

https://noyb.eu/en/noyb-urges-11-dpas-immediately-stop-metas-abuse-personal-data-ai

https://www.investopedia.com/eu-ai-act-11737033?utm_source=chatgpt.com

https://wabetainfo.com/whatsapp-beta-for-android-2-25-19-8-whats-new/

https://www.elconfidencial.com/empresas/2023-05-22/ue-multa-facebooj-datos-usuarios-europeos-eeuu_3634070/

https://www.bbc.com/mundo/noticias-49093124


Publicar un comentario

0 Comentarios