Hablar de privacidad de nuestros datos hoy en día es casi hablar de una fantasía. Prácticamente toda nuestra información es pública, lo queramos o no.
Antiguamente cuidábamos nuestro RUT, pensando que con eso estábamos protegidos. Hoy existen sitios públicos en que con sólo un nombre o apellido, cualquiera podría conseguir tus datos completos, incluyendo la última dirección registrada y el lugar en donde votas. Todo esto, gentileza del SERVEL y sus políticas de seguridad, que permitieron que muchos capturaran la información de todos los chilenos, cuando entró en vigencia el voto voluntario y nos auto-inscribieron en los registros electorales.
Pero una cosa son nuestros datos personales (nombre, rut, fecha de nacimiento, dirección, etc) y otra muy distinta es la información que generamos día a día. Lo que nos gusta, lo que odiamos, nuestros hábitos de consumo, por donde nos movemos o qué visitamos, qué comemos, leemos, nuestros horarios, costumbres, qué sitios visitamos en internet o qué productos compramos, lo que twitteamos o compartimos en facebook, etc.
Damos por hecho que esa información es privada, cuando en realidad no lo es. O al menos, no de la forma que pensamos.
Haz un ejercicio simple: En Instagram, pincha el corazón para ver quien le dio like a tus fotos y luego pincha seguidos en la cabecera y listo. Hacemos eso y nos damos cuenta que al parecer a Batman le gusta Margot Robbie (y quien lo podría culpar, eh?).
Obviamente este es un ejemplo medio burdo, pero pone en evidencia el hecho que Batman no tiene ninguna forma de evitar que nos demos cuenta que hizo like a una foto específica que podría representar algo. Y si esa foto fuese en pro o en contra de un político?… O de un partido o tendencia?… O una causa como salvemos el planeta o #NiUnaMenos?
Y antiguamente era peor: Instagram mostraba públicamente sin ningún tipo de restricción, el lugar exacto (con punto en el mapa) en donde estabas cuando publicaste una foto. Eso lo quitaron hace como 3 años atrás, pero deja en evidencia que están almacenando esa información, entre muchas otras cosas, sin que lo sepamos o autoricemos explícitamente.
Seguro algunos van a decir ‘ah, pero Batman puede poner su cuenta como privada y ya no verás esa info‘ y si, es cierto, pero eso sólo cerraría el acceso a los usuarios anónimos, no al big brother que es Facebook (actual dueño de Instagram) y que finalmente es quien saca provecho y vende estos datos al mejor postor.
Piénsalo de esta forma: Si tienes a una persona a tu lado día y noche, observándote. Tomando nota de las cosas que lees y compartes en redes sociales, los mensajes y fotos que envías en whatsapp, facebook, twitter o cualquier otra red. También revisando las compras que haces en línea, los sitios web que visitas, las aplicaciones que descargas y ocupas en tu celular… ¿Cuánto tiempo crees que le tomaría a esa persona armar un perfil de ti? De tu comportamiento y tus intereses? Un día?… Dos?… Tres?
Ahora piensa esto: Los comportamientos de las personas no son tan distintos cuando comparten intereses. Si este ‘espía‘ se demoró dos o tres días en armar tu perfil, cuánto crees que demoraría en crear el perfil de otra persona que tiene los mismos intereses que tú? ¿Cuánto crees que demorará en adivinar o predecir lo que esa persona podría querer o buscar, con un nivel de precisión más que aceptable?
Y ese es un ejemplo bastante básico.
Hoy en día los algoritmos aprenden de nuestra conducta. Las redes sociales entregan en bandeja los lugares a donde vamos, con quien vamos, lo que compramos, lo que nos gusta, lo que nos molesta, lo que compartimos y mucho más. Con eso (entre otras cosas), los algoritmos son capaces de predecir nuestro comportamiento y también el de otros.
Más de 2.000 millones de personas ingresan a facebook varias veces al día (si, leíste bien: dos mil millones de personas). Con esa cantidad de datos, se forman patrones y conductas que se reiteran y coinciden una y otra vez. Y eso es sólo facebook, si sumamos twitter o el rastreo que hacen de nuestros navegadores en distintos sitios web, se va completando un cuadro global de comportamiento.
Y, si por algún motivo estás pensando: «Yo ocupo modo incógnito en mi navegador, así que no me pueden rastrear!«, entonces te tengo una muy mala noticia.
¿Y para qué hacen todo esto?
La respuesta simple: Publicidad segmentada y selectiva con alto nivel de efectividad. Si eres un vendedor de algo, no hay nada que tenga más valor que el saber quienes quieren ese algo que vendes. Alguna vez has contratado anuncios en facebook? El nivel de segmentación y efectividad al que puedes llegar es simplemente sorprendente. Si tu producto son botas para la nieve, puedes segmentar exclusivamente que tu producto lo vea la gente interesada en ese tipo de viajes.
La respuesta compleja está relacionada con algo que va mucho más allá: La manipulación de la información es poder y ese poder ha permitido incluso manipular elecciones. Los mejores ejemplos son el referéndum del Brexit y las últimas elecciones presidenciales de, nada más y nada menos que, Estados Unidos, en donde resultó ganador Donald Trump.
En ambos casos, se podría decir que nadie esperaba una victoria del bando que resultó ganador. Y, también en ambos casos, los bandos ganadores utilizaron secretamente información de los votantes para segmentar y distribuir anuncios y noticias que se adaptaban/mejoraban a sí mismos de forma automática y en tiempo real.
Los autores de esta hazaña (si, lo considero una tremenda hazaña, perversa, pero hazaña a fin de cuentas) fueron dos compañías llamadas AggregateiQ (canadiense) y Cambridge Analytica (británica).
Estas empresas obtuvieron los datos de cientos de millones de votantes a través de sus redes sociales, capturando sus acciones, gustos, preferencias, qué cosas compartían, qué cosas amaban, cuales odiaban, a qué amigos les compartían noticias y qué tipo de noticias, cuales de esos amigos hacían eco de esas noticias y así, suma y sigue.
Con esa información, alimentaron sus algoritmos avanzados de comportamiento y voilá: El resultado fue una lista de millones de posibles votantes que pueden ser influenciados con anuncios o noticias dirigidas específicamente, en muchas ocasiones incluso con noticias falsas, que servían al mismo propósito.
La magia de esto, es que todo funcionaba de forma automática. El algoritmo era capaz de aprender sobre la marcha e identificar si un anuncio o noticia estaba siendo efectivo y en caso contrario, mejorarlo en tiempo real.
Por si esto fuera poco, el algoritmo adaptaba los anuncios y/o noticias de tal forma que tuviesen mayor impacto en una persona específica. Esto se traducía en que si entrabas a facebook y leías un titular de una noticia generada por este algoritmo, tu madre podía entrar a su propio facebook y veía la misma noticia pero con otro titular, contenido y fotografía, adaptado para que tuviera impacto especialmente en ella según sus gustos o preferencias.
Suena muy futurista para ti? Pues no lo es, más bien es el pasado. Todo esto pasó hace casi 4 años atrás.
Hoy en día la recolección de datos se ha vuelto mucho más sofisticada. Ya no es secreto que nuestros dispositivos nos están escuchando sin que lo sepamos o autoricemos. Incluso va más allá, gigantes como Google no tuvieron ningún empacho en incluir secretamente micrófonos en dispositivos para el hogar sin que los compradores lo supieran. Literalmente, es como si te compraras un par de zapatillas y el fabricante mete en la zuela un micrófono y un GPS, para escuchar lo que dices y trackear por donde te mueves… y ojo, ese fue Google. Osea… GOOGLE. La empresa que hoy en día prácticamente controla internet y lo que encontramos ahí.
Por otro lado, cuando Mark Zuckerberg testificó frente al congreso de Estados Unidos, recibió un par preguntas bastante concretas y concisas, como por ejemplo:
- ¿Rastrea facebook la actividad del usuario en internet incluso estando fuera de la aplicación?
- Si elimino mi cuenta de facebook, ¿Cuánto tiempo demoran en eliminar mis datos?
Y estaba todo bien, hasta que decidió no responder y ejercer su derecho a silencio. Osea, a ver… analicemos esto.
Ante la pregunta sobre si facebook rastreaba a sus usuarios, incluso sin estar ejecutando la aplicación, el tipo tenía la oportunidad de cerrarle la boca a miles de críticos y decir algo como «no, no rastreamos a nadie», sin embargo prefirió guardar silencio y no responder. ¿Qué te dice eso?
Voy a contar una anécdota personal. Esto es totalmente real, nos pasó a mi pareja y a mi hace unos meses:
Estaba en mi laptop, con mi teléfono a un lado, trabajando. Y mi pareja llega y me dice que le gustaría tomar clases de lettering. Lo conversamos un par de minutos, sobre los costos, el tiempo disponible, etc. Durante esa conversación, no toqué mi computador ni mi teléfono celular. No busqué en google ni facebook ni nada. Fue simplemente una conversación que inició y terminó ahí.
Pasaron un par de días y, tanto facebook como instagram, me bombardearon con anuncios y ofertas especiales en clases de lettering. Lo mismo le pasó mi pareja.
¿Significa eso que alguien escuchó lo que hablamos y reaccionó? Obviamente cuando hablo de alguien, no me refiero a una persona como tal, sino a un sistema automatizado que escucha e identifica palabras clave, que en nuestro caso me imagino que fueron clases y lettering. Después de eso ya es un simplemente un trámite el enviarme el anuncio.
Me puse a investigar un poco y resultó que no soy el único. Internet está plagado de denuncias similares.
Esto me lleva a pensar en otra cosa.
Si tenemos algoritmos que son capaces de escuchar una conversación, entender y reaccionar. Será que también tenemos algoritmos que pueden analizar una fotografía y hacer lo mismo?
En otras palabras, será que existe algún algoritmo que revisa tus fotografías de facebook/instagram e identifica los lugares o las cosas que estás haciendo? Podría un algoritmo identificar tus hábitos de alimentación si estás publicando fotos de tu almuerzo? Podría un algoritmo identificar tus hábitos de viaje si estás publicando tus fotos por el mundo? Podría un algoritmo identificar tus círculos sociales si te tomas fotos con tus amigos?… Y así, suma y sigue.
Bienvenido al futuro. Orwell no estaba tan equivocado después de todo.
#TengoMiedo
La respuesta a las preguntas del final es sí. Se puede hacer todo eso y más. Parte de mi trabajo actual se trata de eso.
Pero al menos en plataformas digitales puedes combatir fuego con fuego, puedes crear contenido fake para engañar a los algoritmos, como imágenes (ej https://thispersondoesnotexist.com/ ) texto (https://openai.com/blog/better-language-models/) y hasta hay herramientas que envian paquetes random por internet para confundir a google y cia sobre tus busquedas (era una herramienta del MIT, stanford o una de ellas, no recuerdo el nombre)
Lo terrible es que se pueda hacer lo mismo en el mundo real. A punta de cámaras y machine learning pueden rastrearte bastante bien, y ahi no tienes mucho que hacer mas que confiar en que estan usando tu cara y la info que generas para un buen fin.
No deja de ser macabramente entretenido jaja