Category: show in Big Data from the South

[BigDataSur] A widening data divide: COVID-19 and the Global South

COVID-19 shows the need for a global alliance of experts who can fast-track the capacity building of developing countries in the business of counting.

Stefania Milan & Emiliano Treré

The COVID-19 pandemic is sweeping the world. First identified in mainland China in December 2019, it has rapidly reached the four corners of the globe, to the point that the only “corona-free” land is reportedly Antarctica. News reports globally are filled with numbers and figures of various kinds. We count the number of tests, we follow the rise of the total individuals who tested positive to the virus, we mourn the dead looking at the daily death toll. These numbers are deeply ingrained in their socio-economic and political geography, as the virus follows distinct diffusion curves, but also because distinct countries and institutions count differently (and often these distinct ways of counting are not even made apparent). What is clear is that what gets counted exists, in both state policies and people’s imaginaries. Numbers affect our ability to care, share empathy, and donate to relief efforts and emergency services. Numbers are the condition of existence of the problem, and of a country or given social reality on the global map of concerns. Yet most countries from the so-called Global South are virtually absent from this number-based narration of the pandemic. Why, and with what consequences?

Data availability and statistical capacity in developing countries

If numbers are the conditions of existence of the COVID-19 problem, we ought to pay attention to the actual (in)ability of many countries in the South to test their population for the virus, and to produce reliable population statistics more in general–let alone to adequately care for them. It is a matter of a “data gap” as well as of data quality, which even in “normal” times hinders the need for “evidence-based policy making, tracking progress and development, and increasing government accountability” (Chen et al., 2013). And while the World Health Organization issues warning about the “dramatic situation” concerning the spread of COVID-19 in the African continent, to name just one of the blind spots of our datasets of the global pandemic, the World Economic Forum calls for “flattening the curve” in developing countries. Progress has been made following the revision of the United Nations’ Millennium Development Goals in 2005, with countries in the Global South have been invited (and supported) to devise National Strategies for the Development of Statistics. Yet, a cursory look at the NYU GovLab’s valuable repository of data collaboratives” addressing the COVID-19 pandemic reveals the virtual absence of data collection and monitoring projects in the South of the emisphere. The next obvious step is the dangerous equation “no data=no problem”. 

Disease and “whiteness”

Epidemiology and pharmacogenetics (i.e. the study of the genetic basis of how people respond to pharmaceuticals), to name but a few amongst the number of concerned life sciences, are largely based on the “inclusion of white/Caucasians in studies and the exclusion of other ethnic groups” (Tutton, 2007). In other words, modeling of disease evolution and the related solutions are based on datasets that take into account primarily–and in fact almost exclusively–the caucasian population. This is a known problem in the field, which derives from the “assumption that a Black person could be thought of as being White”, dismissing specificities and differences. This problem has been linked to the “lack of social theory development, due mainly to the reluctance of epidemiologists to think about social mechanisms (e.g., racial exploitation)” (Muntaner, 1999, p. 121). While COVID-19 represents a slight variation on this trend, having been first identified in China, the problem on the large scale remains. And in times of a health emergency as global as this one, risks to be reinforced and perpetuated.

A succulent market for the industry

In the lack of national testing capacity, the developing world might fall prey to the blooming industry of genetic and disease testing, on the one hand, and of telecom-enabled population monitoring on the other. Private companies might be able to fill the gap left by the state, mapping populations at risk–while however monetizing their data. The case of 23andme is symptomatic of this rise of industry-led testing, which constitutes a double-edge sword. On the one hand, private actors might supply key services that resource-poor or failing states are unable to provide. On the other hand, however, the distorted and often hidden agendas of profit-led players reveals its shortcomings and dangers. If we look at the telecom industry, we note how it has contributed to track disease propagation in a number of health emergencies such as Ebola. And if the global open data community has called for smoother data exchange between the private and the public sector to collectively address the spread of the virus,in the absence of adequate regulatory frameworks in the Global South, for example in the field of privacy and data retention, local authorities might fall prey to outside interventions of dubious nature. 

The populism and racism factors

Lack of reliable numbers to accurately portray the COVID-19 pandemic as it spreads to the Southern hemisphere also offers fertile ground to distorted and malicious narratives mobilized for political reasons. To name just one, it allows populist leaders like Brazil’s Jair Bolsonaro to announce the “return to normality” in the country, dismissing the harsh reality as a collective “hysteria”. In Italy, the ‘fake news’ that migrant populations of African origin would be “immune” to the disease sweeped social media, unleashing racist comments and anti-migrant calls for action. While the same rumor that has reportedly been circulating in the African continent as well and populism has been hitting hard in Western democracies as well, it might be have more dramatic consequences in the more populous countries of the South. In Mexico, left-wing populist president Andrés Manuel López Obrador responded to the coronavirus emergency insisting that Mexicans should “keep living life as usual”. He did not stop his tour in the south of the country and frequently contradicted the advice of public health officials, systematically ignoring social distancing by touching, hugging and kissing his supporters and going as far as considering the pandemic as a plot to derail his presidency. These dangerous comments, assumptions and attitudes are a byproduct of the lack of reliable data and testing that we signal in this article. 

The risk of universalising the problem

Luckily, the long experience and harsh familiarity in coping with disasters, catastrophes and emergencies has also prompted various countries from the Global South to deploy effective measures of containment more quickly than many countries in the Global North. 

In the lack of reliable data from the South, however, modeling the diffusion of the disease might be difficult. The temptation will likely be to ”import” models and “appropriate” predictions from other countries and socio-economic realities, and then base domestic measures and policies on them. “Universalizing” the problem as well as the solutions, as we warned in a 2019 article, is tempting, especially in these times of global uncertainty. Universalizing entails erroneously thinking that the problem manifests itself in exactly the same manner everywhere, disregarding local features to “other” approaches. Coupled with the “whiteness” observed earlier, this gives rise to an explosive cocktail that is likely to create more problems than it solves. 

Beyond the blind spot? 

While many have enough to worry about “at home”, the largest portion of the world population today resides in the so-called Global South, with all the very concrete challenges of the situation. For instance, for a good portion of the 1,3 billion Indian citizens now on lockdown, staying at home might mean starving. How can the global community–open data experts, researchers, life science scholars, digital rights activists, to name but a few–contribute to “fix” the widening data divide that risks severely weakening any local effort to curb the expansion of COVID-19 to populations that are often already at the margins? We argue that the issue at stake here is not simply whether we pump in the much-needed resources or how we collaborate, but it is also a matter of where do we turn the eye–in other words, where we decide to look. COVID-19 will likely make apparents the need of a global alliance of experts of various kinds who, jointly with civil society organizations, can fast-track the capacity building of developing countries in the business of counting. 

This article has been published simultaneously on the the Big Data from the South blog and on Open Movements / Open Democracy.

Cover image credits: Martin Sanchez on Unsplash


[BigDataSur] Cuba y su ecosistema de redes después de la revolución

Por: Yery Menéndez García y Jessica Domínguez.

En Cuba la información, la comunicación y los datos son “recursos estratégicos del estado” [1] y “asunto de seguridad nacional” [2]. En la práctica, pero también en la mayoría de los documentos normativos del país, queda establecida la propiedad estatal sobre el capital simbólico de la nación.

A lo anterior se suman niveles de acceso y existencia de plataformas de redes telemáticas considerados entre los más bajos del planeta, importantes restricciones internacionales para el acceso a infraestructura, financiamientos, circuitos de telecomunicaciones y conectividad, y la existencia de programas que usan las TICS para intentar desestabilizar abiertamente al gobierno cubano.

Ante este contexto, y debido a los altos precios de conexión, grupos ciudadanos desarrollan prácticas de circulación de información que se adaptan a un contexto híbrido (off-on line). Estas iniciativas asumen un carácter autónomo, deslocalizado y auto gestionado e intentan satisfacer demandas diarias fuera de los mecanismos del estado. Algunas de las más relevantes en los últimos diez años son:

  1. Nuevos medios alternativos de comunicación

Un grupo de jóvenes periodistas graduados de universidades cubanas y otros profesionales están utilizando un grupo de recursos socio-técnicos para generar otras matrices de información.

Estas nuevas plataformas de información de interés público vienen a llenar vacíos dejado por los medios oficiales, únicos permitidos de existir. Algunos actúan como proyectos sombrilla o repositorios, albergando otras iniciativas ciudadanas de información.

Durante diez años y ante carencias de acceso a redes para resolver cuestiones infraestructurales, de fortalecimiento de capacidades y de acceso a fuentes, estas iniciativas han desarrollado formas de gestión creativas e innovadoras en concordancia con las más recientes tendencias globales.

A pesar de esto, la principal fuente de financiamiento de estos proyectos continúa siendo donaciones y becas provenientes de organizaciones internacionales. Este sigue siendo el principal punto de ataque usado para desacreditarlos por representantes del gobierno.

Entre los más relevantes y reconocidos se encuentran:

  • On Cuba, una plataforma en inglés y español dirigida, sobre todo a la comunidad cubana emigrada.
  • El Toque, un medio generalista, enfocado principalmente a los jóvenes y gestionado por jóvenes que cuenta historias de ciudadanía. El Toque pertenece a un grupo mayor de “emprendimientos de comunicación” reunidos dentro del Colectivo +Voces y que incluye también una radio digital llamada “El Enjambre” y un suplemento de humor gráfico, Xel2.
  • Periodismo de Barrio, una revista dedicada a tratar temas medioambientales y vulnerabilidades sociales.
  • El Estornudo, medio especializado en periodismo literario.
  • Joven Cuba y La Tizza, ambos son blogs colaborativos para promover el debate político.

Todos estos medios tienen como principal forma de socialización sus portales online. Pero desde que la distribución de formatos impresos es prohibida por el código penal cubano y el acceso online es caro, estos medios han tenido que innovar en sus interacciones con sus comunidades. La manera fundamental que han encontrado es la creación de una base de datos que se descarga una vez por semana. Con la base de datos descargada se actualiza la aplicación móvil de los sitios y desde entonces se puede acceder a todo el contenido offline.

Existe una clara diferencia entre estos medios y los medios abiertamente opuestos al gobierno de la isla. Los primeros están enfocados en producir información fuera de la égida del departamento ideológico del Partido Comunista de Cuba, estructura encargada de regular toda la producción simbólica del país, mientras los segundos subordinan la información que producen a su activismo político.

  1. El paquete semanal

El paquete es un producto-servicio que capitaliza redes sociales ya desarrolladas y las extiende. Si bien el objetivo final de esta expresión socio-técnica es el lucro y no la práctica de sentido de ciudadanía, si vale la pena comprender como esas redes de datos interactúan con redes sociales y como son producidas socialmente.

Dentro del paquete se recopila alrededor de 1 terabyte de contenido pirata, semana por semana. Este contenido se descarga de internet desde diferentes nodos o matrices que todo el mundo conoce, pero que permanecen ocultas, como secretos a voces. Una vez descargado el contenido, se entrega a un grupo de personas que a su vez, lo distribuyen mediante discos extraíbles a otras ciudadanos y así sucesivamente, por módicos precios.

De esta manera, en una especie de bola de nieve, los cubanos tienen acceso a internet offline y se mantienen actualizados de todo cuanto acontece en materia de información. Los contenidos del paquete incluyen desde cine hasta publicidad no permitida en los canales oficiales cubanos; desde música hasta bases de datos de otras plataformas de todo tipo. El paquete semanal es la principal forma de distribución de los medios y revistas mencionados anteriormente y de otros tantos, religiosos, humorísticos y políticos que no tienen otros espacios donde posicionarse.

La mejor descripción para el paquete es la de fenómeno híbrido de socialización de datos que media entre interacciones sociales no dependientes de algoritmos. Para la realidad semi-conectada de Cuba, el paquete semanal es hoy el recurso de distribución más popular y asequible. Y aunque no es legal, su carácter reticular, su distribución por nodos y de mano a mano y la calidad en la gestión y jerarquización de sus contenidos, hace imposible para las autoridades detenerlo completamente.

  1. The Street Network

La SNET (Street Network, por sus siglas en inglés) o Red de la calle, fue otra popular experiencia de distribución de contenidos y de creación de comunidades que, a diferencia del paquete, no tenía ánimo de lucro. En esta red, conectada por cables y Wi-Fi, sus “miembros” comenzaron a agruparse en nodos por toda la Habana con la intención de jugar partidas online. Con el paso del tiempo, la SNET fue creciendo y perfeccionando en estructura y organización, llegando a otras provincias del país. Y su objetivo primario pasó de ser el espacio de la comunidad gamer cubana a convertirse en un esquema para la generación de prácticas conectadas de ciudadanía mediadas por software.

La SNET, a pesar de ser un tejido ilegal, desarrolló un complejo sistema jerárquico, principios y éticas de funcionamiento bien establecidas, llegando a desplegar un nivel de infraestructura de red nunca antes visto, fuera de los márgenes del estado.

Convertida en un verdadero movimiento de activismo de datos, en 2019 el gobierno trató de institucionalizarla dentro de los Jóvenes Clubs de Computación y Electrónica. Este intento de cooptar la iniciativa generó protestas y demostraciones públicas que llevaron al gobierno, por primera vez, a sostener diálogos y llegar a consenso con los representantes de los nodos de SNET. A pesar de los acuerdos entre ambas partes, la red está hoy casi extinta.

  1. Articulaciones ciudadanas en redes sociales

En enero del pasado 2019 un tornado azotó la Habana devastando el ya vetusto fondo habitacional de la capital cubana. Luego de este fenómeno natural, una oleada de ciudadanos organizados congregaron a cubanos residentes y emigrados para brindar ayuda a los necesitados. Convocándose principalmente mediante Facebook, se crearon directorios colaborativos con los contactos de aquellos dispuestos a ayudar, bases de datos abiertas con los nombres y datos demográficos de los más necesitados e iniciativas de mapping para localizar los lugares donde fue mayor el daño.

Esta iniciativa fue, en su mayoría, impulsada por jóvenes profesionales y artistas. El nivel de movilización demostrado superó a las capacidades del estado, el que una vez más trató de institucionalizar las ayudas. En este caso, el movimiento siguió operando paralelo a los esfuerzos estatales y solo concluyó una vez que la mayoría de las personas afectadas recibieran kits básicos de apoyo.

  1. Plataformas comerciales

También existe una extensiva red de repositorios comerciales colaborativos como que intentan generar una alternativa dinámica al desprovisto mercado oficial. En estos repositorios se crea, gestiona, jerarquiza, recupera y socializa información referente a bienes y servicios que son adquiridos con otros bienes y servicios, moderados por reglas que toda la comunidad que utiliza la plataforma debe seguir.

En una situación de a-legalidad conviven estas comunidades de interpretación, creación y resistencia ante la información estatalizada. Ante un estado centralizador, estas nuevas relaciones sociales de producción dirigidas a llenar vacíos de sentidos que no pueden ser llenados de otra manera, mediadas o no por algoritmos; representan hoy alternativas cada vez más articuladas, populares y endógenas y de eso depende enteramente su supervivencia.

[1] Lineamientos de la política social del Estado (PCC, 2011, updated in 2016)

[2] Decreto Ley 370 de MInisterio de Información y Comunicaciones


Yery Menéndez García es periodista y profesora de la Facultad de Comunicación de la Universidad de La Habana. MA in Media Practice for Development and Social Change por la Universidad de Sussex en Reino Unido. Gestora de Audiencias en el medio independiente cubano El Toque.

[BigData Sur] Exploring Facebook’s role in Ethiopia’s rising ethnic tensions

by Syver Petersen

As the world’s most widely used social media platform, Facebook has become a vehicle for extreme political forces and a breeding ground for pernicious stories bent on instigating conflict among groups. In Myanmar for example, an independent United Nations Human Rights Council Fact-Finding Mission found that Facebook played a ‘determining role’ in the recent mass atrocities committed against Rohingya people. Parallel to this, Facebook seeks to expand its userbase in the Global South(s) and, underpinned by modernisation narratives it proclaims its services as supportive of international development agendas.

In Ethiopia, recent ethnic conflict and resulting mass displacement are being linked to social media disinformation and hate speech. This blog reflects on my research on the role of Facebook in this politically polarised and culturally diverse country, with more than 80 languages and ethnic groups and undergoing a historical political transition.


In Africa’s second most populous country, ethnic-based violence has sharply risen in the last couple of years. Since Prime Minister and recent Nobel Peace Prize Laurate Dr. Abiy Ahmed took office in early 2018 Ethiopians have experienced a small ‘political revolution’. The Ethiopian government has gone from using widespread authoritarian practices to releasing political prisoners and journalists, even inviting back previously banned opposition groups.

However, in terms of ethnic relations, political commentators have referred to the opening the political space as taking the lid off a pressure cooker. Mass protest and violence has left more than a thousand dead, and in 2018 close to thee million were displaced due to ethnic conflict and violence, the largest increase in internal displacement globally that year.

Broadly speaking, ethnicity has been and still is one of the most important identities structuring the Ethiopian society. Especially since the fall of the ‘communist’ Derg regime in 1991, ethnic identity has been intentionally emphasised and promoted by the ruling political elites, and the country’s administrational regions were re-organised along ethnic lines. This only further entangled ethnic identity and politics.

The government largely assigns blame to social media for the recent ethnic turmoil. Upon receiving the Nobel Peace Prize, Prime Minster Abiy Ahmed stated that “The evangelists of hate and division are wreaking havoc in our society using social media”. Although social media cannot take full responsibility for the current situation, there is no doubt it plays an important role in shaping political discourse.  

In a context where neighbours kill each other on the basis of ethnic identity, and ethnic tension has the very real potential spin out of control, the potentially conflict-inducing effects of social media is an urgent issue. 

As has been noted in other countriesfilter-bubbles, as a result of algorithms personalising online experiences such as the Facebook News Feed, can trap individuals and groups in a state of intellectual isolation. This can reinforce already held viewpoints without challenging them, encouraging partisanship and tribalism. In the highly polarised situation Ethiopia finds itself, I believe this phenomenon merits particular concern. As speech aimed at creating suspicion, spreading fear and encouraging violence, increasingly circulates on Facebook in Ethiopia, Facebook’s personalised algorithmic filtering might further polarise ethnic relations.

Furthermore, in August 2020, Prime Minister Abiy Ahmed plans to hold Ethiopia’s first ‘free and fair’ election since 2005. As the election approaches, the ethnic-based tension and conflict has taken centre stage and the challenge poses a real threat to the country’s political stability. 

Social media use in Ethiopia

Ethiopians using social media are a subset of a subset of another subset–those who have access to electricity, those who have access to the internet and finally those who have accounts on social media. This group is estimated to be only 6 percent of the population. Much of the ethnic-based violence occurs in areas where even electricity is scarce, let alone internet access, like in the case of Guji-Gedeo in Southern Ethiopia, where recent conflicts have displaced close to one million people. Despite this, Ethiopia has one of the world’s fastest growing social media user rates, and social media are becoming increasingly important especially among the massive youth population. Furthermore, through word of mouth, which is still the main source of news for many Ethiopians, social media content appears to reach far beyond the fraction of the population with direct access to social media services. 

My research

As a case for exploring how Facebook influences Ethiopian ethnic-based conflict, I will study its role in recent conflicts between students at the Debre Berhan University, situated in central Ethiopia, about 120 kilometres North-East of the capital Addis Ababa.

Ethiopian universities have long been a hotspot for ethnic riots and violence. In Debre Berhan University, two dormitories were set on fire and a student was killed just off campus last year. Both incidents are suspected to be connected to the wider ethnic conflicts around the country. 

The potentially divisive effects of personalisation algorithms have sparked debates across various scientific disciplines. Some claim that effects are negligible while others highlight them as determining. My study seeks to contribute to this debate by exploring filter-bubble effects in the Facebook News Feed, but also how the students in this specific socio-cultural context relate to and are influenced by their social media information diets.

In order to get access to the student’s personalised Facebook News Feeds, I have asked participants, in their presence, to share access to their social media accounts. I have then used the web browser extension– developed as part of the Algorithms Exposed project, a DATACTIVE spin-off– to collect, sort and analyse content from the student’s News Feeds. The idea is to compare the information diets of students from the two main conflicting groups. This will hopefully reveal the extent of filter bubbles, as well as what content participants are actually exposed by the News Feed algorithm. 

As Facebook aggressively expands into new market territory, critical engagement with its context-specific societal effects is pivotal. This is particularly urgent in the context of the fragile Ethiopian political situation, where there is a pressing need for more knowledge about the role of social media in mediating ethnic conflict. 

Syver Petersen

Syver is studying a MSc in International Development Studies at the University of Amsterdam. His academic interests are oriented around how digital technology and big data impact power relations, political engagement and conflicts in the Global South(s). 

New Paper Out: Institutional Resistance To Transparency

Guillén published a paper in the latest number of the Journal Of Resistance Studies. You can download a pre-print version of it here. And read the abstract here:

Despite the popularization of progressive Freedom of Information and Open Data policies, both transparency practitioners and academia have warned about an increase in attempts to control and reduce the information that flows from the state to citizens. Within the literature dedicated to investigate this phenomenon, the notion of resistance to transparency has been used often to characterize instances of problematic governmental information control. However, within this body of research, the concept of resistance has been stripped of its contentious elements and treated as a synonym of reluctance, unwillingness or foot-dragging, rather than a category with an inherent political dimension. As a result, what is institutional resistance to transparency and what are its political consequences remains vague. Drawing from the theoretical toolbox of the fields of Resistance Studies and Science and Technology Studies, this paper explores the politics of institutional resistance to transparency through a case study of Mexican information activists. By focusing on activists’ experiences, I suggest that institutional resistance originates in how transparency mechanisms allow some citizens to make the state more legible, controllable, and accountable. Furthermore, I argue that institutional resistance is carried out mostly through everyday, subtle, seemingly non-political strategies implemented by the state’s institutions, which reduce citizens’ ability to produce and/or process data regarding governmental action.

[BigDataSur] El Sur Global podría nacionalizar sus datos

Por Ulises Alí Mejías

(An English version of this article appeared in Al Jazeera on December 2019)


Las grandes empresas de tecnología están extrayendo datos de sus usuarios en todo el mundo, sin pagarles por éstos. Es hora de cambiar esta situación.


Big tech corporations are extracting data from users across the world without paying for it. This process can be called “data colonialism”: a new resource-grab whereby human life itself has become a direct input into economic production. Instead of solutions that seek to solve the problem by paying individuals for their data, it makes much more sense for countries to take advantage of their scale and take the bold step to declare data a national resource, nationalise it, and demand that companies like Facebook and Google pay for using this resource so its exploitation primarily benefits the citizens of that country.

Nacionalización de datos 

El reciente golpe de estado en Bolivia nos recuerda que los países pobres, pero que son ricos en recursos naturales, continúan siendo plagados por el legado del colonialismo. Cualquier iniciativa que pretenda obstruir la capacidad de las compañías extranjeras para extraer recursos de manera barata se arriesga a ser prontamente eliminada.

Hoy, aparte de los minerales y el petróleo que abunda en algunos rincones del continente, las empresas están persiguiendo otro tipo de recurso, uno que quizás es más valioso: los datos personales. Al igual que los recursos naturales, los datos personales se han convertido en el blanco de ejercicios extractivos llevados a cabo por el sector dedicado a la tecnología.

Como el sociólogo Nick Couldry y yo hemos argumentado en nuestro libro, Los costos de la conexión (The Cost of Connection: How data is Colonizing Human Life and Appropriating It for Capitalism – Stanford University Press), hay un nuevo tipo de colonialismo emergiendo en el mundo de hoy: el colonialismo de los datos. Con este término queremos sugerir que estamos observando una nueva ola de apropiación de recursos en la cual la vida human en sí misma, expresada en los datos extraídos desde los mismos usuarios, se convierte en una aportación directa a la producción económica.

Reconocemos que este concepto puede resultar controversial dada la extrema violencia física y las estructuras aún presentes del racismo colonial histórico. Pero no queremos decir que el colonialismo de datos es igual al colonialismo histórico. Más bien, que la función esencial del colonialismo es justamente la misma. Esa función fue -y sigue siendo- la extracción, la explotación, y la apropiación de nuestros recursos.

Como el colonialismo clásico, el colonialismo de datos va transformando violentamente las relaciones sociales en elementos de producción económica. Elementos como la tierra, el agua, y otros recursos naturales fueron valuados por los primeros pueblos en la era precolonial, pero no de la misma manera que los colonizadores -y más tarde los capitalistas- llegaron a valorarlos, es decir, como una propiedad privada. De la misma manera, estamos viviendo en una situación en la que cosas que antes estaban fuera de la esfera económica -tales como las interacciones privadas con nuestros amigos y familiares, o nuestros archivos médicos- ahora han sido privatizadas y convertidas en parte del ciclo económico de la extracción de datos. Un ciclo que claramente beneficia principalmente a unas cuantas grandes empresas.

¿Pero qué pueden hacer los países de este “Sur Global” para evitar la explotación del colonialismo de datos?

Soluciones para el Sur Global

Una clara opción para este conjunto de países sería la de promulgar propuestas como las del escritor Jaron Lanier y el candidato presidencial estadounidense Andrew Yang, quienes han sugerido que cada uno de nosotros debería ser remunerado por los datos que producimos, a través de algún mecanismo de compensación. Pero estas propuestas neoliberales que buscan resolver el problema a nivel individual pueden al mismo tiempo diluir el valor de los recursos agregados. Si enfrentamos el problema así, los pagos a los usuarios serán difíciles de calcular, y tal vez muy pequeños.

En vez de esto, es mucho más lógico que los países del Sur Global aprovechen su tamaño y posición en el escenario internacional y tomen el paso audaz de declarar los datos generados por sus ciudadanos como un recursos nacional, demandando que compañías como Facebook o Google paguen por utilizar este recurso. Así, los principales beneficiarios del uso de datos personales serían justamente los ciudadanos que los producen.

Hagamos unos cálculos utilizando a México como un ejemplo: Facebook cuenta con 54.6 millones de usuarios en este país. En promedio, cada usuario global produce para Facebook $25 dólares al año en ganancias, lo que representa alrededor de $1.4 billones de dólares que la compañía se termina embolsando gracias a los mexicanos. Supongamos entonces que México nacionalizara sus datos y por lo tanto demandara quedarse con una parte substancial de esta suma. Y supongamos, ya que estamos haciendo este ejercicio, que arreglos similares se aplicaran al mismo tiempo con compañías como Google, Amazon, TikTok, etc.

Con billones de dólares recuperados a través de la nacionalización de los datos, el gobierno mexicano podría invertir en el desarrollo de campos como la salud, la educación, o la crisis migratoria por la cual atraviesa el país actualmente.

Sin embargo, una cosa es segura: cualquier intento de nacionalizar los datos por los países que conforman el Sur Global se enfrentaría con una intensa oposición. México nacionalizó su petróleo en 1938, gracias a una acción realizada por el presidente Lázaro Cárdenas, hoy considerado un héroe nacional, que enfureció a las compañías extranjeras. Lo anterior resultó en el boicoteo inmediato por parte de Estados Unidos, el Reino Unido, Holanda, y otros países. México solo podría librarse de esta situación por el eventual estallido de la Segunda Guerra Mundial.

También está el ejemplo de Chile. Salvador Allende amenazó en la década de 1970 con nacionalizar el sector telefónico, (que en ese minuto era controlado por la compañía norteamericana International Telephone & Telegraph), así como otras industrias. Antes de que se pudiera llevar a cabo, la CIA organizó un golpe de estado en 1973 que terminó con la muerte de Allende y una dictadura que duraría hasta 1990.

Y a Evo Morales, que experimentó con formas blandas de nacionalización que beneficiaron a los sectores más pobres de Bolivia mientras que mantenían a los inversionistas extranjeros moderadamente satisfechos, ahora lo han sacado por la fuerza de su país. No ayudó a su causa el hecho de que Morales, en un acto controversial, enmendó la constitución para poder volver postular a la presidencia luego de servir los dos periodos que ya eran permitidos por la ley boliviana.

Cualquiera sea el caso, la derecha en Bolivia y en Estados Unidos hoy están celebrando lo que algunos ven como un desarrollo interesante en la lucha por el control de minerales como el litio o el indio, los cuales son esenciales para la producción de dispositivos electrónicos.

Aún si los países que decidieran nacionalizar sus datos sobrevivieran a la represalia esperada, la nacionalización de datos no pondría fin a la raíz del problema; la normalización y legitimación de las extracción de información que ya se encuentra en proceso.

El futuro de la nacionalización de datos 

La nacionalización de datos no detendrá necesariamente la colonización que vive la región. Por eso, es una medida que debe ser pensada y entendida como una respuesta limitada a un problema mayor. Este es la razón por la cual la nacionalización de datos debe tener como objetivo final la separación de la economía del Sur Global de esta nueva especie de colonialismo.

La riqueza recuperada podría utilizarse también para desarrollar infraestructuras públicas que brinden versiones menos invasivas o explotadoras de los servicios ofrecidos por las grandes compañías tecnológicas de China y Estados Unidos. Parece difícil imaginar hoy algunas de estas alternativas, pero ya existen modelos que el Sur Global podría adoptar para desarrollar servicios que respeten la privacidad del individuo y no abusen del deseo humano de socializar.

Para evitar la corrupción y la mala administración, la sociedad civil deberá estar directamente involucrada en la toma de decisiones sobre el futuro de esta riqueza, incluyendo la capacidad de bloquear aplicaciones y usos abusivos de parte de compañías extranjeras sobre los datos generados por ciudadanos. Son, después de todos, sus datos, y es el público el que deberá tener un asiento en la mesa cuando se decida de qué manera se pueden ocupar esos recursos.

La propuesta de nacionalización de datos, aunque parezca inalcanzable y poco práctica, nos obliga por los menos a cuestionar la extracción de datos que continúa de manera indiscutible, a veces bajo el pretexto de que es un tipo de progreso que nos beneficia a todos.


[BigDataSur] Inteligencia artificial y soberanía digital

Por Lucía Benítez Eyzaguirre


La autonomía que van logrando los algoritmos, y en especial la inteligencia artificial, nos obliga a repensar los riesgos de la falta de calidad de los datos, de que en general no estén desagregados y los sesgos y aspectos ocultos de los algoritmos. Las cuestiones de seguridad y éticas están en el centro de las decisiones a adoptar en Europa relacionadas con estos temas. Todo un reto, cuando todavía no hemos logrado ni la soberanía digital.


The autonomy that the algorithms are achieving and, especially, artificial intelligence forces us to rethink the risks of lack of quality in data, the fact that in general they are not disaggregated, and the biases and hidden aspects of the algorithms. Security and ethical issues are at the center of the decisions to be taken in Europe related to these issues. It looks like a big challenge, considering that we have not yet achieved even digital sovereignty.

IA y soberanía digital

Los algoritmos organizan y formatean nuestra vida. Como si fueran un software social y cultural, éstos se van adaptando a los comportamientos humanos, y avanzan en su existencia autónoma. Sin embargo, vivimos de forma ajena a su capacidad de control sobre la desigualdad, sobre la vigilancia de nuestras vidas o al margen del desarrollo inminente del internet de las cosas o de la inteligencia artificial (IA): como si pudiéramos darnos el lujo de ignorar cómo se van independizando cada vez más de las decisiones humanas. Ahora, por ejemplo, por primera vez se ha planteado si habrá que modificar los criterios de patentes después de la intención de registrar como propiedad intelectual los inventos y diseños hechos por una inteligencia artificial. De momento, ni la Unión Europea (UE) ni el Reino Unido se han mostrado dispuestos a aceptar una iniciativa de este tipo sin un debate sobre el papel de la IA y del escenario de incertidumbre que esta situación abre.

Es en este contexto que comienza a oírse una pluralidad de voces que piden una regulación de las tecnologías asociadas a la IA; un freno al futuro de un desarrollo autónomo e inseguro. Algunas de las corporaciones de los GAFAM -el grupo que concentra las cinco empresas más grandes en tecnología en el mundo-, como Microsoft o Google ya han pedido esta regulación. Es más, incluso pareciera que estos gigantes tecnológicos comienzan a avanzar hacia la autorregulación en cuestiones éticas o de responsabilidad social, a la vista del impacto que no hacerlo puede tener sobre su reputación. La cuestión para la UE supone valorar y reconocer los riesgos del devenir incontrolable de la IA, sobre todo en asuntos como la salud o la vigilancia. De ahí que parece que el reconocimiento facial en lugares públicos se frenará en los próximos años en algunos países de Occidente, para así prevenir los riesgos detectados en China.

Para combatir los riesgos de la IA hay que comenzar por asegurar la calidad de los datos y los algoritmos, investigar sobre los sesgos que producen y la responsabilidad sobre los errores y criterios. La IA se entrena en muchos casos con datasets no desagregados y a menudo ya sesgados, por lo que conducirá a algoritmos deformados y poco representativos de la población y a desarrollos parciales, de baja calidad y dudosos resultados. Frente al cada vez más numeroso trabajo que se realiza con datos masivos, apenas hay estudios técnicos sobre su impacto humano y social. Por lo mismo, trabajos como los del profesor Matthew Fuller son un clásico recurso para tomar conciencia de la importancia de la transparencia sobre el funcionamiento de los algoritmos. Fuller plantea la aplicación de sistemas que garanticen la condición verdadera de los resultados, la mejora del modelo a partir de un mayor número de conexiones, un funcionamiento que muestre las conexiones sociales o que ponga en evidencia que a menudo se supera la capacidad de los propios sistemas que se analizan con algoritmos.

Si queremos atender a los riesgos de la IA hay que comenzar por el logro de la “gobernabilidad algorítmica”. Este concepto supone la prevención del abuso y del control con el que los algoritmos regulan nuestra vida o con el que la programación rige nuestro quehacer, nuestras rutinas. Esta gobernanza es una garantía de la transparencia, con la supervisión colectiva de usuarios y empresas de los resultados, y la responsabilidad ante el uso de la información. Los algoritmos deben garantizar la transparencia y calidad de los datos (concepto conocido como open data en inglés), ofrecer su propio código de fuente abierto, que sea auditable por sus usuarios y que pueda responder a las reclamaciones fruto de los controles ciudadanos. Pero también es imprescindible que el algoritmo sea leal y justo, es decir, que evite la discriminación que sufren las mujeres, las minorías, o cualquier otro colectivo desfavorecido. Y si se trata de un algoritmo en línea, hay que tener también en cuenta las API (Application Public Programming Interface) públicas porque condicionan tanto la recolecta de datos como la forma en que se aplican técnicas comerciales, que oculta cómo se apropian de la información.

Este espíritu también se recoge en la Declaración de Zaragoza de 2019 a partir del debate de profesionales y académicos sobre los efectos adversos, y los riesgos potenciales. Sin embargo, esta declaración también señala las recomendaciones de uso de la IA, da a conocer sus impactos y su evolución en la sociedad. Esto lo hace a través de cinco puntos sobre las dimensiones humana y social, el enfoque transdisciplinar con el que abordar la AI, la responsabilidad y el respeto a los derechos, a partir de un código deontológico propio.

La Declaración pone el acento en la necesidad de desarrollos para las políticas de interés público y la sostenibilidad, pero siempre a partir de sistemas trazables y auditables, con un compromiso con los usuarios para evaluar el cumplimiento de sus objetivos y separar los defectos o desviaciones. En cuestiones éticas, la Declaración propone la formación de los programadores no sólo técnica sino ética, social y humanista, ya que los desarrollos de software también deben contemplar estas dimensiones, así como diferentes fuentes de conocimiento y experiencia.

La Declaración de Zaragoza también incluye un “derecho a la explicación” sobre las decisiones algorítmicas, siempre y cuando éstas entren en juego con los derechos fundamentales de las personas. A pesar del que el Reglamento General de Protección de Datos de la Unión Europea ha avanzado en derechos digitales, todavía estamos muy lejos de una soberanía tecnológica al estilo de la francesa. Desde 2016, Francia se rige por la “Ley de la república digital” que impulsa los algoritmos auditables, la neutralidad de la red, la apertura de datos, la protección de la privacidad y lealtad de las plataformas con la información de sus consumidores, el derecho a la fibra y a la conexión a Internet, el derecho al olvido, la herencia digital, la obligación de informar de las brechas de seguridad detectadas, las multas en materia de protección de datos.


Magma guide release announcement

January 29, 2020

By Vasilis Ververis, DATACTIVE

We are very pleased to announce you that the magma guide has been released.

What is the magma guide?

An open-licensed, collaborative repository that provides the first publicly available research framework for people working to measure information controls and online censorship activities. In it, users can find the resources they need to perform their research more effectively and efficiently.

It is available under the following website:

The content of the guide represents industry best practices, developed in consultation with networking researchers, activists, and technologists. And it’s evergreen, too–constantly updated with new content, resources, and tutorials. The host website is regularly updated and synced to a version control repository (Git) that can be used by members of the network measurements community to review, translate, and revise content of the guide.

If you or someone you know is able to provide such information, please get in touch with us or read on how you can directly contribute to the guide.

All content of the magma guide (unless otherwise mentioned) is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License (CC BY-SA 4.0).

Many thanks to everyone who helped make the magma guide a reality.

You may use any of the communication channels (listed in contact page) to get in touch with us.


Vasilis Ververis is a research associate with DATACTIVE and a practitioner of the principles ~ undo / rebuild ~ the current centralization model of the internet. Their research deals with internet censorship and investigation of collateral damage via information controls and surveillance. Some recent affiliations: Humboldt-Universität zu Berlin, Germany; Universidade Estadual do Piaui, Brazil; University Institute of Lisbon, Portugal.

[BigDataSur] How Chilean activists used citizen-generated data to fight disinformation

by Tomás Dodds

For over 80 days now, and with no end in sight, Chile has been in the grip of waves of social protests and cultural manifestations with tens of thousands of demonstrators taking to the streets across the country. For many, the upsurge of this social outburst has its roots in a civil society rebelling against an uncaring economic and political elite that has ruled the country since its return to democracy in 1990. Mass protests were soon followed by a muddle of misinformation, both online and in the traditional press. In this blog post, I provide insights into how Chilean activists, including journalists, filmmakers, and demonstrators themselves, have started using citizen-generated data to fight media disinformation and the government’s attempts to conceal cases of human rights violations from the public.

The evening of October 18th 2019 saw how Chileans started to demand the end of a neoliberal-based economic system, perceived among citizens as the main cause for the social inequalities and political injustices that occurred in the country over the last decades. However, demonstrations were met with brutal police repression and several corroborated cases of human rights violations, including sexual torture. To this day, information gathered by national and international non-governmental organizations show at least that 26 people have died and more than 2.200 have been injured during the rallies.

Although I was raised in Chile, today I am living in Amsterdam. Therefore, I could only follow the news as any other Chilean abroad; online. I placed a screen in my room streaming in a loop the YouTube channels of the prime-time late-night news of major media outlets. During the day, I constantly checked different social media platforms like Facebook or Twitter, and from time to time I would get news and tips from friends and fellow journalists in the field over WhatsApp or Signal. Information started flooding every digital space available: a video posted on social media in the morning would have several different interpretations by that evening, and dissimilar explanations would be offered by experts across the entire media spectrum by night.

And this was only the start. Amidst the growing body of online videos and pictures showing evidence of excessive military force against demonstrators, Chilean President Sebastián Piñera sat in on a televised interview for CNN’s Oppenheimer Presenta where he claimed that many recordings circulating on social platforms like Facebook, Instagram, and Twitter have been either “misrepresenting events, or filmed outside of Chile.” The President effectively argued that many of these videos were clearly “fake news” disseminated by foreign governments seeking to destabilize the country, like those of Venezuela and Cuba. Although Piñera later backed down from his claims, substantial doubts were already planted in Chileans’ minds. How could the public be sure that the videos they were watching on their social networks were indeed real, contemporary, and locally filmed? How could someone prove that the images of soldiers shooting rubber bullets at unarmed civilians were not the result of a Castro-Chavista conspiracy, orchestrated by Venezuelan President Nicolás Maduro, as some tweets and posts seem to claim with a bewildering lack of doubt? How could these stories be corroborated when most of them were absent from the traditional media outlets’ agendas?

As a recent study suggests, unlike their parents or grandparents, the generation that was born in Chile after 1990 is less likely to self-censor their political opinions and show a higher willingness to participate in public discussion. After all, they were born in democracy and do not have the grim memories of the dictatorship in their minds. This is also the generation of activists who, using digital methods, have taking it up to themselves to mount the digital infrastructure that makes relevant information visible and, at the same time, accessible to an eager audience that cannot find on traditional media the horror tales and stories that reflect the ones told by their friends and neighbors. Thus, different digital projects have started to gather and report data collected by a network of independent journalists, non-governmental organizations, and the protestors themselves in order to engage politically with the reality of the events occurring on the streets. Of these new digital projects, here I present only two that stand out in particular, and which I argue help to alleviate, or at least they did for me, the uncertainty of news consumption in times of social unrest.


(Image courtesy of Osvaldo Pereira) 

From singular stories to collective data
Only four days after the beginning of the protests, journalists Miguel Paz and Nicolás Ríos started (or Chile-Records in English), a depository of audio-visual material and information regarding the ongoing protests. Chile-Registra stores and distributes videos that have been previously shared by volunteers and social networks users who have attended the rallies. According to these journalists, traditional media could not show videos of human rights violations shared on social networks because they were unable to verify them, and therefore would only broadcast images of riots and barricades, which would later produce higher levels of mistrust between the demonstrators and the press.

As a response to this problem, the project has two main purposes; First, to create a “super data base” with photos and videos of the protests, and military and police abuses. Second, to identify the creators of videos and photos already posted and shared on social networks, in order to make these users available as news source or witness for both traditional media and the prosecutors. National newspaper La Tercera and Publimetro, among other national and international media outlets, did already use this platform to published or broadcast data collected within the depository. By using this project, users were able to easily discredit Piñera’s claims that many of these videos were being recorded abroad.

The second project I would like to draw attention to is Proyecto AMA (The Audio-visual Memory Archive Project in English). AMA is a collective of journalists, photographers, and filmmakers who have been interviewing victims of human rights violations during the protests. Using the Knight Lab’s StoryMap tools, AMA’s users can also track where and when these violations have taken place, and read the personal stories behind the videos that they most probably saw before online. According to their website, members of this project “feel the urgent need to generate a memory file with the images shared on social networks, and give voice and face to the stories of victims of police, military and civil violence in Chile.”

These two projects have certainly different approaches for how they generate content. While ChileRegistra relies on collecting data from social media and citizen journalists uploading audio-visual material, Proyecto AMA’s members interview and collect testimonies from victims of repression and brutality. Although the physical and technological boundaries of each media platform are still present, these projects complement each other in a cross-media effort that precisely plays with the strengths of each of the platforms used to inform the work activists do.

New sources for informed-activism
These projects are at the intersection between technology and social justice, between the ideation and application of a new digital-oriented, computer assisted reporting. Moreover, the creation and continuous updating of these “bottom-up” data sets detailing serious human rights violations have not only been used to further the social movements, but they also indicate the necessity that digital activist have to gather, organize, classify, and perhaps more importantly, corroborate information in times of social unrest.

As long as Chileans keep taking to the streets, this civil revolution presents the opportunity to observe new ways of activism, including the use of independently-gathered data by non-traditional media and the collection of evidence and testimonies from victims of police and military brutality in the streets, hospitals, and prisons.

What can we, only relying on our remote gaze, learn from looking at the situation going on today in Chile? This movement has shown us how the public engagement of a fear-free generation and the development of a strong digital infrastructure are helping to shape collaborative data-based projects with deep democratic roots.

Lastly, let’s hope that these projects, among others, also shed some light on how social movements can be empowered and engaged by new ways of activism actively creating their own data infrastructure in order to challenge existing power relations, seemingly resistant to fade into history.


new article out: “Enter the WhatsApper: Reinventing digital activism at the time of chat apps” (First Monday)

Our first article of 2020 is out! Entitled “Enter the WhatsApper: Reinventing digital activism at the time of chat apps”, it reflects on the evolution of political participation and digital activism at the time of chat applications. It is part of a special issue of the open access journal First Monday dedicated to the (first) ten years of WhatsApp. The abstract is below. The article can be read at this link.

This paper investigates how the appropriation of chat apps by social actors is redesigning digital activism and political participation today. To this end, we look at the case of #Unidos Contra o Golpe (United Against the Coup), a WhatsApp “private group” which emerged in 2016 in Florianópolis, Brazil, to oppose the controversial impeachment of the then-president Dilma Rousseff. We argue that a new type of political activist is emerging within and alongside with contemporary movements: the WhatsApper, an individual who uses the chat app intensely to serve her political agenda, leveraging its affordances for political participation. We explore WhatsApp as a discursive opportunity structure and investigate the emergence of a repertoire specific to chat apps. We show how recurrent interaction in the app results into an all-purpose, identity-like sense of connectedness binding social actors together. Diffuse leadership and experimental pluralism emerge as the bare organizing principles of these groups. The paper is based on a qualitative analysis of group interactions and conversations, complemented by semi-structured interviews with group members. It shows how WhatsApp is more than a messaging app for “hanging out” with like-minded people and has come to constitute a key platform for digital activism, in particular in the Global South. DOI:

Cite as 

Milan, S., & Barbosa, S. (2020). Enter the WhatsApper: Reinventing digital activism at the time of chat apps. First Monday, 25(1).

Call for papers: Palabra Clave special issue

Please note an exciting upcoming special issue of Palabra Clave, titled “Latin American perspectives on datafication and artificial intelligence” with Stefania Milan & Emiliano Treré as guest editors of this special issue.
More information on the CfP here:
Call for papers (Español):

Call for papers (English):

Call for papers en (Portugués):