Ensayo sobre el documento “Six Provocations for Big Data”.
boyd, danah and Crawford, Kate, Six Provocations for Big Data (September 21, 2011). A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society, September 2011. Available at SSRN: https://ssrn.com/abstract=1926431 or http://dx.doi.org/10.2139/ssrn.1926431
INTRODUCCIÓN
En el siguiente ensayo se llevará a cabo una revisión analítica del texto “Six Provocations for Big Data” (boyd y Crawford, 2011). Procederemos a analizar los puntos clave del documento, no sin antes establecer como punto de partida una definición básica sobre qué se entiende por Big Data. Además, las ideas principales esbozadas por los autores —de cuya síntesis nos encargaremos— se verán acompañadas de referencias externas, con el objetivo de clarificar y, en lo posible, potenciar los supuestos teóricos más relevantes.
DATOS Y ESCENARIO ECONÓMICO
Enmarcados en el escenario de una era tecnológica en la que el acceso a la información —más allá de la disyuntiva sobre la veracidad o no veracidad de esta— se produce de manera inmediata, constante y veloz; en enormes e imparables flujos acelerados de datos, que luchan por hacerse con un hueco en la tan poblada arena de la economía de la atención. Una era, siguiendo a Srnicek (2018), de la llamada “economía digital” con la que hacemos referencia a aquellos negocios que dependen cada vez más de la tecnología de la información, datos e Internet para implementar sus modelos. Era en la que las plataformas son capaces de extraer y controlar inmensas cantidades de datos, provocando el ascenso de grandes compañías monopólicas (Srnicek, 2018).
En este nuevo paradigma económico, “[l]a economía del dato aspira a hacer de todo gesto, hálito o relación una ocasión de beneficio, pretendiendo de este modo no conceder ningún espacio vacante, intentando adosarse a cada instante de la vida y confundirse con la vida entera. La economía del dato es la economía integral de la vida integral” (Sadin, 2018).
A estas alturas poca duda cabe de la importancia trascendental a nivel socioeconómico de los datos. Pero ¿qué son estos realmente? Continuando con Srnicek, cabe distinguir entre datos —información de que algo sucedió— de conocimiento —información de por qué algo sucedió— (Srnicek, 2018). Según este autor “los datos son la materia prima que debe ser extraída, y las actividades de los usuarios, la fuente natural de esta materia prima” (Srnicek, 2018). Este apunte es especialmente importante, porque sitúa en el cuadro la activa importancia de los usuarios, de las personas “anónimas”, como piezas claves del mecanismo funcional de esta nueva economía digital. En un símil simple, básico y visual, los usuarios y los datos serían gasolina depositada en (casi)infinitas garrafas cuyo contenido es vertido en el motor que hace funcionar el sistema mecánico de la nueva economía en la ya llamada Cuarta Revolución Industrial.
BIG DATA
El surgimiento del Big Data se podría explicar por tres genéricos motivos principales. En primer lugar, el coste de almacenamiento se ha abaratado enormemente. Por otro lado, el precio de los dispositivos de almacenamiento también ha bajado. Finalmente, la velocidad de procesamiento ha aumentado enormemente (Pulido, 2016). Si bien, siguiendo a Di Bella, no existe consenso general en la literatura sobre la definición de Big Data (Di Bella, 2018), sí que es común el uso de las llamadas Cuatro Uves del Big Data: volumen, velocidad, variedad y veracidad. (IBM Big Data & Analytics Hub, 2014)1.
Adentrándonos al fin en el trabajo de boyd y Crawford sobre el que versa este somero ensayo, una de las primeras e interesantes puntualizaciones que llevan a cabo los autores es aquella en la explican que Big Data no hace referencia al tamaño (algo a lo que el uso de big [grande] podría llevarnos fácilmente a pensar) sino a la capacidad relacional que el Big Data atesora. Se conectan datos sobre un individuo, datos sobre grupos de gente, datos sobre la estructura de la información en sí… Al final, es este vasto amasijo de datos, este complejo entramado de relaciones, el que otorga cualidades de grandilocuencia al fenómeno Big Data, yendo pues, mucho más allá de una mera significación sobre el tamaño.
El fenómeno, en la línea con la importancia capital de los datos en la nueva economía digital ya comentada anteriormente, está jugando un importante papel en la industria y en la academia.
A continuación, pasamos a analizar los 6 puntos capitales, las six provocations del Big Data, enumeradas por boyd y Crawford.
- La investigación automática cambia la definición del conocimiento.
Con el cambio paradigmático desde el fordismo —y su producción en cadena y estandarizada como ónfalo dominante alrededor del cual giraba el progreso tecnológico y el desarrollo económico— hasta una economía digital —guiada por las nuevas tecnologías que definen una Cuarta Revolución Industrial que orbita aceleradamente en torno a continuos flujos de datos— tuvo también lugar un gran y radical cambio sobre la manera de investigar, sobre cómo se construye y almacena el conocimiento. En este punto surge el debate sobre si, con suficiente data, los números pueden hablar por sí mismos o no. boyd y Crawford se muestran contrarios a esta idea defendida, en cambio, por Anderson, quien acuña para esta era el término “The Petabyte Age”.
- Las proclamas de objetividad y exactitud se están perdiendo.
La cantidad de datos e información que circula constantemente por Internet (sobre todo por las redes sociales) y el papel del usuario como agente activo, en un novedoso sistema comunicativo teóricamente más horizontal y democrático (aunque escarbando un poco en él se pueden observar las mismas constricciones del poder), provoca tal maremagno informativo que constituye nuevas dificultades y nuevos retos a los que enfrentarse. El cómo se interpretan los datos es parte principal del análisis de estos. Las cámaras de eco y sus resonancias, la imposibilidad de filtrar toda la información continuamente vertida en las redes sociales, y demás problemáticos factores, hacen que la verdad objetiva sea un ideal valioso y de no fácil presencia.
- Data más grande no es siempre data mejor.
Ante la casi imperante tendencia a la búsqueda de macrodatos o la querencia por la acumulación fantasiosa de datos, los autores revelan cómo el “small data” puede tener en ocasiones un gran valor. En ocasiones, poner el foco sobre un solo individuo puede ser de extraordinario valor para llevar a cabo un análisis.
Por otro lado, se hacen constar algunas de las posibles falsedades que nos encontramos en las redes. Así, no han de confundirse conceptos como “cuentas” y “usuarios”, ya que un solo usuario puede tener muchas cuentas. Incluso fenómenos como los bots2 y demás herramientas que actúan como falseadoras de la (ciber)realidad, pueden tener un impacto significativo y dañino sobre los potenciales análisis que se lleven a cabo si no se presta la atención requerida a este tipo de “artimañas”.
- No toda la data es equivalente.
Contextualizar los datos obtenidos es un factor de importancia clave para el correcto uso de estos. No han de verse (los datos) como entes abstractos cuyo análisis es potencialmente extrapolable a cualquier contexto que se le pase por la cabeza a un determinado investigador. En su contexto, con sus peculiaridades intrínsecas, es donde una serie de datos se torna valiosa y donde adquiere significado.
- Solo porque sea accesible no significa que sea ético.
Viejas problemáticas como la privacidad adquieren nuevas formas bajo el novedoso panorama de una sociedad tecnológica donde datos e informaciones de los individuos circulan por toda la red ciberplanetaria con una facilidad (y en muchas ocasiones con igual ingenuidad) impresionante.
Los autores establecen una importante diferencia entre que los datos estén en un lugar público y que sean de facto públicos. Son frecuentes las ocasiones en las que un mal uso o un uso descontextualizado de una información causa grandes problemas a personas hasta entonces “anónimas”. Nuevas éticas han de ser planteadas, y la presencia o accesibilidad de una información no ha de justificar per se su (irresponsable) uso.
Acorde con estas nuevas formas adquiridas por problemáticas preexistentes, nuevas legalidades y nuevas regulaciones son planteadas y ejecutadas. En este sentido, Reglamentos como el RGPD de 20183 son una clara muestra de esta deriva.
- El acceso limitado al Big Data crea nuevas brechas digitales.
Como señalábamos con anterioridad, bajo la apariencia horizontal y la supuesta democratización de la información que trajo consigo el nuevo escenario presentado por Internet y, especialmente, por las redes sociales, viejas y nuevas líneas divisorias reproducen y (re)crean viejas y nuevas desigualdades.
Los autores diferencian entre aquellas compañías que restringen totalmente el acceso a los datos, aquellas que venden a gran precio el acceso a estos y, finalmente, otras que ofrecen pequeñas cantidades de datos para la investigación académica. Esta es una de las múltiples maneras de generar desigualdades sistémicas.
Otras formas de generar desigualdades nombradas por boyd y Crawford serían las universidades privadas con poder económico que pueden comprar acceso a esos datos; las habilidades tecnológicas y las jerarquías que estas generan; las brechas de género, etcétera.
Concluyen definiendo una divergencia entre Big Data rico y Big Data pobre.
Ahondando en esta onda de las nuevas desigualdades se muestran Aparici y García cuando dicen que “nuevos tipos de exclusividad que hacen de Internet un espacio donde los poderosos refuerzan su poder y los débiles apenas tienen oportunidad de ofrecer contrarrelatos alternativos” (Aparici y García, 2017). En similar línea lo expresa Jenkins cuando dice que si bien la cultura contemporánea es más colaborativa; no a todo el mundo se le permite participar, no todo el mundo es capaz de participar, no todo el mundo quiere participar y no todo aquel que participa lo hace en igualdad de condiciones (Jenkins, 2013).
CONCLUSIONES
Como se ha podido observar a lo largo de lo relatado en este breve ensayo, es indudable el potencial y la importancia de los datos en el actual paradigma socioeconómico en el que nos encontramos. Paradigma definido por un incesante flujo de informaciones, de datos, que fluyen en toda dirección a velocidades cada vez más aceleradas.
Este nuevo panorama del Big Data trae consigo nuevas problemáticas, nuevas disyuntivas o, en todo caso, nuevas reformulaciones de problemáticas preexistentes que atañen a la privacidad del individuo o al fomento de las desigualdades sociales. Ante estos nuevos escenarios, nuevas líneas de actuación son y serán implementadas con el objetivo de no perpetuar errores del pasado y con el foco puesto en destapar el velo de las falsas informaciones en favor de una veracidad y una objetividad informativa cada vez más castigada.
Ante el rápido fluir de los acontecimientos y del devenir del mundo tecnológico, nuevas realidades y nuevos conceptos se irán asentando entre la cotidianidad más elemental. Especialistas del Big Data hablan del Machine Learning o Aprendizaje Automático4 como tendencia en crecimiento para el futuro más inmediato. Del mismo modo, nuevas figuras laborales como el Chief Data Officer (Responsable de Datos) tendrán cada vez más presencia en las grandes empresas5.
NOTAS
- Las Cuatro Uves del Big Data. Fuente: http://www.ibmbigdatahub.com/infographic/four-vs-big-data
- ¿Qué es Bot? https://www.youtube.com/watch?v=aqd3flIkQOo
- Resumen del Reglamento General de Protección de Datos: https://futurlegal.com/2018/05/16/resumen-del-reglamento-general-proteccion-datos/
- https://www.campusbigdata.com/big-data-blog/item/130-predicciones-de-la-tecnologia-big-data-para-el-2019
- https://www.marketingdirecto.com/marketing-general/tendencias/las-7-tendencias-del-big-data-para-2019
BIBLIOGRAFÍA
- Anderson, C. (2008) “The End of Theory, Will the Data Deluge Makes the Scientific Method Obsolete?”, Edge, http://www.edge.org/3rd_culture/anderson08/ anderson08_index.html
- Aparici, R. y García, D. (2017). “¡Sonríe, te están puntuando! Narrativa digital interactiva en la era de Black Mirror”. Gedisa Editorial. Barcelona
- boyd, d. and Crawford, K., “Six Provocations for Big Data” (September 21, 2011). A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society, September 2011. Available at SSRN: https://ssrn.com/abstract=1926431 or http://dx.doi.org/10.2139/ssrn.1926431
- Di Bella, E. (2018). “Big Data”. 10.1002/9781118445112.stat08114.
- IBM “Big Data & Analytics Hub”. (2014). The Four V’s of Big Data. [ONLINE] Available at: http://www.ibmbigdatahub.com/infographic/four-vs-big-data
- Jenkins, H. (2013). “Spreadable media: creating value and meaning in a networked culture”. New York; London: New York University Press.
- Pulido, E. (2016). “Big data: ¿Solución o problema?” Encuentros Multidisciplinares 54 (2016): 1-12. http://hdl.handle.net/10486/677785
- Sadin, É. (2018). “La Silicolonización del Mundo. La irresistible expansion del liberalismo digital”. Buenos Aires, Argentina. Caja Negra Editora.
- Srnicek, N. (2018). “Capitalismo de Plataformas”. Buenos Aires, Argentina. Caja Negra Editora.