Martín
Hilbert es alemán, Doctor en Ciencias Sociales y PhD en Comunicación. Es
profesor en la Universidad de California y asesor tecnológico de la Biblioteca
del Congreso de Estados Unidos, tiene un enfoque multidisciplinario que se
centra en las relaciones entre las comunicaciones, la información y la economía
desde la perspectiva de los sistemas complejos. Conversé con él sobre Big Data,
sus consecuencias en la vida cotidiana, su utilización en la política y los
problemas filosóficos que genera.
¿Qué
es el Big Data y cómo puede influenciarnos en nuestra vida cotidiana?
MH: La expresión Big Data se refiere a que los datos
son muy grandes y, realmente, son muy grandes. Los datos crecen a una tasa
anual del 30%, especialmente los datos digitales. La economía, cuando crece y
nos va bien, crece entre 1% y 5%. En el mundo de hoy, según mis estimaciones,
se pueden almacenar 5 zetabytes (ZB). Un zetabyte es un 1 con veintiún ceros
(1021 bytes), un número muy grande. Si usted tomaría esta
información y la pone en libros formando una pila, ¿hasta dónde cree que esta
pila llegaría? ¿llegaría hasta la Luna o hasta el Sol? La verdad es que, en el
año 2014, cuando hice la última estimación, esta pila llegaría 4.500 veces al
Sol y cada dos años se duplicaría. Hoy probablemente habría 8.000 pilas que
llegan al Sol. Por lo tanto, es mucha información cuando se la compara con la
información de la vida, incluso con la de nuestro ADN. La información digital ya
es cinco veces más grande que la información ADN en cada célula de cada ser
humano.
Creo que es importante entender qué masivo es esta
huella digital que dejamos sin saber. La dejamos, entre otros, con nuestros
celulares. En África, donde el 50% de la población no tiene certificado de
nacimiento y sin embargo poseen celulares que han penetrado en la sociedad en
un 90%, se supone que cuando un celular camina por la calle existe una persona
ligada a ese celular porque no se tiene otra evidencia de que existan estas
personas. Simplemente se está mapeando esta realidad social que antes no
existía.
Si usted tiene Gmail o Google Maps instalado en su
teléfono, hay una página (www.google.com/maps/timeline) donde se puede ir y ver
dónde usted estaba en los últimos tres años. En cualquier caso no lo comparta
con su esposo o su esposa porque lo va a llevar a discusiones muy interesantes (risas)
pero Google lo sabe y nosotros le damos el permiso cuando aceptamos los
términos de la licencia al instalar la aplicación. ¡Sí, todo el texto que hacemos
scroll hacia abajo sin leer! Del otro lado, Google nos dice: “nosotros le damos
estos servicios gratis y ustedes nos pagan con sus datos”. Es un modelo de
negocio y cuando hablás con la gente de Google no hay ninguna mala conciencia,
es un negocio donde hay servicios gratuitos como Gmail o Google Maps a cambio
de datos.
La tecnología de Big Data también está siendo
utilizada por diversas empresas privadas. Por ejemplo los Call Centers. Cuando
uno llama a una central de asistencia telefónica siempre escucha un mensaje
como: “Este llamado podría ser grabado…” y claro…usted piensa que puede ser el
jefe de recursos humanos que escucha para controlar que lo traten bien. Bueno,
eso no es lo que pasa. Serían muchas llamadas para el pobre jefe de recursos
humanos (risas). En un porcentaje grande de los Call Center son cerca de 10.000
algoritmos que lo escuchan a usted mientras habla, clasifican su personalidad
en seis diferentes cajas, si usted está motivado por emociones, acciones, etc. Este
análisis se hace en tiempo real y para que funcione sólo necesita tres o cuatro
frases suyas. Luego se lo conectará con una persona del Call Center que tenga
la misma psicología que usted para aumentar la satisfacción de su llamado.
En
un reciente artículo usted explica que en las campañas presidenciales 2012 de
Obama y 2016 de Trump se ha echado mano del Big Data. ¿Cómo es que los
políticos han obtenido ventajas de esta tecnología? ¿Cómo han logrado acercarse
a los votantes por medio de las redes sociales?
MH: Obama fue pionero en esto y en su campaña 2012
gastó 1.000 millones de dólares para contratar cuarenta ingenieros de compañías
como Twitter, Google, Facebook, tres profesionales de póker, un experto en
células madres etc. y estas personas crearon perfiles de 16 millones de
votantes indecisos en EE.UU. Antes se tenía una lista, unas pocas estimaciones
y menos categorías para cada persona. En 2012 ya eran 16 millones de personas
con innumerables características que se obtienen de diferentes bases de datos. El
resultado de esto es la posibilidad de hacer un marketing personalizado. Y si
estás a favor del aborto o en contra del aborto, dependiendo de eso, será el
mensaje que recibas. Y si Obama tiene 50 ideas con las que no estás de acuerdo
sólo te mandará las tres ideas con las que sabe que estarás de acuerdo. Con el
tiempo, te estará convenciendo hasta que llegues a decir: “Ah, mirá que bien
esto, me gusta lo que Obama dice”. Este es el target marketing que se hace uno por uno y, a través del cual,
también se puede contactar a los amigos de los indecisos. Esto posibilita
predecir con una exactitud impresionante los resultados de la votación, y la
posibilidad de cambiar el 80% de los votantes no decididos. Estos 1.000 millones
de dólares realmente valieron la pena porque hicieron ganar a Obama la
elección.
Cuatro años más tarde, en las elecciones del 2016, Trump
lo hizo con 250 millones de perfiles. En el debate con Hillary Clinton, Trump
planteó un argumento, los algoritmos crearon 175 mil versiones de este mensaje
con variaciones en la imagen, el color, el subtítulo, la explicación etc. y se
enviaron de manera personalizada. Si Trump decía “estoy de acuerdo con el
derecho a poseer armas”, las personas miedosas recibían ese mensaje con una
imagen de un criminal entrando en una casa y las personas patriotas recibían el
mensaje con una imagen de un tipo que se está yendo de caza con su hijo. Dos
versiones del mismo argumento de Trump, pero aquí crearon 175 mil versiones de
este mensaje.
Es un lavado de cerebro que nada tiene que ver con
la democracia. George Orwell se pegaría un tiro si estuviera vivo porque ni él
se imaginó algo así. Los mensajes te dicen exactamente lo que quieres escuchar.
Esto es populismo puro. La democracia siempre estuvo ligada a las posibilidades
informacionales que tenía cada sociedad. Para Aristóteles la democracia no
podía funcionar más allá de un radio de 70 km ya que la información no podía
viajar más que esa distancia en un día. En EE.UU. se crearon los colegios
electorales por cada Estado porque el viaje en caballo de costa a costa tardaba
una semana. Como la información no era accesible a la gente, se necesitó todo
este constructo representativo. En cambio, con la tecnología actual todo este
constructo puede ser convertido en una dictadura informacional. Esto es lo que
más me preocupa y hay que decirlo abiertamente ya que la democracia
representativa de esta manera no funciona y es completamente inútil.
En
una entrevista, el historiador israelí Yuval N. Harari sostuvo que si se
disponen de suficientes datos biométricos los algoritmos nos dirán qué
estudiar, a quién votar y con quién casarnos, ¿saben los algoritmos más de
nosotros que nosotros mismos? ¿tomarán ellos decisiones por nosotros?
MH: Una vez que hayas hecho entre 100 y 250 “Me
gusta” en Facebook, es posible predecir tu orientación sexual, tu origen
étnico, tus opiniones religiosas y políticas, si usas drogas y si tus padres
son separados o no. Con 150 “Me gusta”, los algoritmos pueden predecir el
resultado de tu test de personalidad mejor que tu pareja. Con 250 “Me gusta”,
mejor que tú mismo. Este estudio, realizado en Cambridge, fue tomado por un
empresario que creo Cambridge Analytica, la empresa que contrató Trump para la
campaña. Cuando usted le daba un “Me gusta” a la página de Facebook de Trump,
éste podía acceder a ti y a tus amigos. Así hizo la campaña. Por otro lado, Netflix,
por ejemplo, es capaz de saber exactamente quién eres con un 84% de exactitud
con los datos de entre seis a ocho películas que usted esté evaluando para ver.
En
el libro Big Data. La revolución de los datos masivos, V.
Mayer-Schönberger y K. Cukier, señalan la ventaja que significó la utilización
de las miles de consultas en Google para identificar a los afectados por el
virus de la gripe aviar y porcina H1N1 en el año 2009. Sin embargo estaría la
posibilidad de que una prestadora de servicios de salud, por ejemplo, posea
datos sobre los alimentos que compramos, nuestras actividades físicas, etc. y nos
rechacen como afiliados o aumenten el abono a aquellos que somos sedentarios y
comemos seguido en hamburgueserías rápidas. ¿Podrían los datos atentar contra
el individuo? ¿Se debe limitar el Big Data?
MH: Pues sí, el Big Data es una tecnología que se
puede usar para el bien o para el mal. Un martillo se puede usar para colgar un
cuadro y no se puede colgar un cuadro sin algo similar a un martillo, se necesita
uno. Pero también con un martillo se puede matar a alguien. No es la culpa del
martillo, es simplemente una herramienta y el Big Data es una herramienta
tecnológica. Obviamente la idea es usarla para lo bueno, para lo que se llama
constructivismo que es lo contrario al determinismo. Y el Big Data es una
tecnología y no es tecnológicamente determinística como ninguna tecnología lo
es. Por otro lado, no es tan nuevo el uso de datos para rechazar afiliados o
aumentar un abono sino que siempre se han usado para fijar o discriminar
precios. Un joven de 21 años con un auto deportivo va a pagar más seguro de
auto que una madre con un auto familiar y dos niños, porque la probabilidad que
el joven haga un accidente es más alta que la madre que lleva a los hijos en el
auto y que por eso va a manejar de manera más cautelosa. Ya es así y no
necesitamos el Big Data porque estamos muy acostumbrados a eso. También la
discriminación de precios para un economista no es nada malo porque la oferta y
la demanda van así y se pregunta: ¿cuánto estás dispuesto a pagar por un
producto? Con el ejemplo del seguro de salud, en algunos países, se dice que no
se debe discriminar por eso y ésto es una pregunta política. Si una sociedad
cree que no se debe discriminar en el caso de salud entonces hay que poner leyes.
En EE.UU. no es tan claro, se da la discusión si se debe discriminar o no en
salud. Pero no es cosa del Big Data, sino que la sociedad tiene que crear las
leyes para que la misma sociedad pueda hacer algo bueno con la tecnología.
Insisto: la tecnología no es determinista, hay que construirla socialmente.
Algunos
divulgadores del Big Data afirman que "los datos hablan por sí
mismos" y que en el futuro "el mundo se guiará más por datos que por
las hipótesis". C. Anderson lo ha dicho con todas las letras en un
artículo de la revista Wired: "es el fin de la teoría". Por el
contrario, algunos filósofos que piensan el tema, como el coreano Byung-Chul
Han, sostienen que hoy, frente a la abundancia de datos que hacen tanto ruido,
las teorías son más necesarias que nunca. Los datos masivos, ¿requieren de una
teoría que aclare el mundo antes de explicarlo o pueden prescindir de ella?
MH: Cada dato por definición viene del pasado. Tiene
que venir del pasado porque una vez que lo registramos, en ese momento ya pasó.
La expresión “tiempo real” no funciona. De los datos mismos la única
recomendación que se puede hacer es que el futuro sea igual al pasado. El
problema es que queremos que el futuro sea diferente del pasado. Queremos un
mundo sin contaminación, sin pobreza, sin guerras y no tenemos datos de un
mundo sin contaminación ni de un mundo sin pobreza. Los estadísticos dicen:
“tenemos en el norte de Europa un país donde no hay pobreza como Suecia y
podemos extrapolar sus datos para evaluar la pobreza de América Latina”. ¡No!
¡Así no es la cosa! El problema es que no tenemos datos sobre una América
Latina sin pobreza y lo que podemos hacer es “en teoría” imaginarnos una
América Latina sin pobreza, pero esto es “en teoría”. Los datos mismos no nos
lo pueden decir. Por lo tanto, la teoría, todavía, es muy importante.
Una teoría no siempre es una visión de un genio sino
que puede ser un modelo cuantitativo. Por ejemplo, hoy en día usamos muchas
simulaciones computacionales, es como jugar SimCity, donde recreamos sociedades
sin contaminación, sin pobreza y vemos lo que pasa y muchas veces nos
sorprende. De repente, jugando al SimCity, sube la tasa de desempleo y no sabes
porqué, es como el gobierno que tampoco sabe porqué (risas). Si quiero cambiar
el futuro necesito visión, teoría para hacer del futuro algo diferente al
pasado y ese es el problema. Si nos quedamos solamente con los datos, nos
quedamos en el pasado, nos quedamos discriminando mujeres, discriminando
diferentes razas, etc.
Mayer-Schönberger
y Cukier presentan el Big Data como una nueva certeza que ocupa el lugar del
"Dios muerto", expresión utilizada por F. Nietzsche, profeta del
nihilismo del siglo XX. ¿Estamos a la puerta de una nueva religión de los datos
o dataísmo como lo ha llamado Harari?
MH: No es una nueva religión. Simplemente es más
conocimiento. Los datos nos posibilitan obtener información, justamente a
partir del análisis de datos hecho con Inteligencia Artificial, porque nuestro
cerebro ya no da para procesar tanta información. De ahí obtenemos patrones que
nos permiten conocernos a nosotros mismos mucho mejor. Entonces el Big Data es
la última fase de un proceso muy largo que se podría llamar conciencia, es
decir, la “conciencia sobre nosotros mismos”. Ahora tenemos datos a un nivel
macro donde se puede observar la sociedad en tiempo real. Las grandes figuras
de las ciencias sociales como Adam Smith, Max Weber, Karl Marx se volverían
locos de qué fantástico es hacer observaciones hoy en día. ¡Adam Smith se fue
tantas veces a visitar y observar fábricas con su papel y su lápiz! Hoy en día
se podría sentar en su silla y, a través de la pantalla, observar todo lo que
pasa en la fábrica y hacer teoría económica. Max Weber podría observar la
sociedad en tiempo real y obtener sus teorías.
Con el Big Data estamos conscientes de nosotros
mismos, creamos una conciencia sobre lo que pasa en la sociedad y por eso
también las ciencias sociales van a ser cada vez más importantes. El Big Data
permite, realmente, hacer una ciencia de los estudios sociales ya que ahora
tenemos datos. Antes las ciencias sociales eran las ciencias con menos datos y
solíamos hacer algunos experimentos con estudiantes de pregrado y de ahí
sacábamos conclusiones. Teníamos un censo cada diez años pero la verdad es que
no teníamos muchos datos comparados con los físicos o los biólogos. Los
biólogos siempre dijeron sobre los estudios sociales “eso no es ciencia, no
tienen datos”. Pero ellos no saben dónde están las ballenas en el mar. Hoy
nosotros sí sabemos dónde están las personas, pero también sabemos qué compran,
qué comen, cuándo duermen, cuáles son sus amigos, sus ideas políticas, su vida
social etc. Hoy en día somos la ciencia tal vez más completa de datos porque
casi cada uno de los 7 billones de sujetos de estudio tienen un sensor encima
las 24 hrs. que deja una huella digital y que nos permite entender la sociedad
mejor, tener una conciencia, un conocimiento de qué pasa en la sociedad. Por lo
tanto, no es una religión sino simplemente un nuevo paso grande en el proceso
largo de conocernos a nosotros mismos, un proceso que existe desde cuando
existe la conciencia.
Prof. Nicolás Martínez Sáez