Concepto
Big data, es un término que viene del inglés que se podría traducir al español como "datos masivos".
Se trata de un concepto relativamente nuevo y se refiere al gran conjunto de datos, que pueden llegar a ocupar varios gigabytes o terabytes, y a su análisis por parte de las compañías u otras organizaciones para obtener información relevante y poder tomar decisiones.
Hay que considerar que el big data no es una tecnología específica, sino que engloba varias tecnologías complejas dedicadas principalmente a recopilar cantidades enormes de datos y procesarlos para extraer información útil.
Por ejemplo, los sensores que miden los niveles de dióxido de carbono (CO2) en el aire recopilan sistemáticamente una serie de datos que dan información sobre los niveles de contaminación que se pueden llegar a alcanzar en las ciudades.
Big data es un conjunto de tecnologías que consisten en la recopilación de grandes cantidades de datos y su procesamiento para transformarlos en información, y de ahí en conocimiento para tomar decisiones acertadas y pasar a la acción.

El reto para las organizaciones está en saber manejar esa gran proporción de datos y ser capaces de extraer información útil a partir de ellos.
¿Qué permite el análisis de datos?
Lo que hace que el big data sea tan beneficioso es su capacidad de dar respuestas a la hora de tomar decisiones de cara a mejorar el negocio o cumplir con los objetivos de las organizaciones a partir de los datos que se manejan.
Un análisis de los datos con técnicas de big data permite:
• Identificar nuevas oportunidades de negocio.
• Encontrar patrones repetitivos y predecir cambios.
• Implementar procesos automatizados de producción para reducir costes.
• Satisfacer necesidades individuales y personalizadas de la clientela.
• Identificar tendencias de gustos, intereses y de consumo de la población.
• Tomar decisiones que contribuyan a mejorar la calidad de vida de las personas.
Siguiendo con el ejemplo anterior, el análisis de los datos sobre CO2 nos da información de los niveles de contaminación, lo que puede servir de base para que los ayuntamientos tomen medidas para mejorar la calidad del aire en las ciudades, como peatonalización de calles o creación de carriles bici.
¿Dónde se aplica Big Data?
Las técnicas de big data se aplican principalmente en áreas o servicios que recopilan gran cantidad de datos como por ejemplo los gestores de correo electrónico, los navegadores y buscadores web, los servicios de mensajería SMS o las redes móviles.
También en aplicaciones que detectan temperaturas, niveles de contaminación, pasos que damos al día o nuestra ubicación, como las que instalamos en nuestros smartphones.
Como puedes observar, el big data está muy presente en muchas de las tecnologías y aplicaciones que utilizas a diario.
Un ejemplo de big data es el proyecto LUCA de Telefónica que analiza la información que recogen las antenas de telefonía en las carreteras para reducir los atascos o descubrir los destinos turísticos favoritos de la ciudadanía.
El gigante de las redes sociales: Facebook + WhatsApp + Instagram
Para que te hagas una idea de la importancia del big data, Facebook, también dueño de Messenger, WhatsApp e Instagram, ha basado su éxito como modelo de negocio en la recopilación y análisis de toda la información que recogen estas aplicaciones, con el consentimiento de las personas usuarias, para llevar a cabo campañas personalizadas que les han reportado grandes beneficios económicos.
La sencilla opción "Me gusta" que popularizó Facebook supuso un hito a la hora de recopilar información muy valiosa sobre los gustos y preferencias de las personas.
Otro ejemplo lo podemos encontrar en la red social de empleo LinkedIn en el que cada persona registrada recibe ofertas personalizadas de trabajo de acuerdo a la información de su perfil, relaciones que establece con sus contactos y publicaciones que realiza.
¿Cómo recopilan la información las aplicaciones y sitios web?
1. Cesión de datos personales
Veíamos que al dar de alta una cuenta de correo electrónico la aplicación pedía cierta información personal a la persona usuaria a cambio de poder utilizar el servicio y recibir recomendaciones o información personalizada. Estos datos que facilitamos son los que emplean muchas aplicaciones web en sus técnicas de big data.
Como persona usuaria debes saber que tienes el derecho de recibir avisos sobre los criterios de privacidad y que tienes el derecho de gestionarlos como mejor te convenga, incluso de cancelar tu consentimiento de ceder tus datos, si así lo deseas.
En el caso de que detectes un uso indebido de tus datos personales puedes denunciar a la compañía por incumplimiento de la Ley de Protección de Datos.
Reflexiona...
La información personal tiene mucho valor para las compañías porque dice mucho de ti y de tus preferencias, pero se trata de información privada y solo tú decides cómo cederla o compartirla. Revisa siempre las políticas de privacidad y uso de datos personales de las aplicaciones y servicios web.
2. Cookies de seguimiento
Nuestro comportamiento al interactuar con las opciones que ofrecen las aplicaciones y sitios web también da mucha información personal. Para recopilar toda esta información están las cookies de seguimiento.
Cuando accedes a cualquier página web o aplicación móvil, aparece una petición de consentimiento del uso de cookies. Una cookie es un paquete de datos que el navegador web almacena en tu dispositivo cuando visitas una página web.
Estos son algunos ejemplos:
• Ubicación
Al aceptar las cookies de navegación, proporcionas la información del lugar físico en el que te encuentras.
• Información de las búsquedas
Las cookies obtienen datos sobre la información que buscas, las palabras clave que usas, los resultados que visitas, las tiendas en las que compras, etc.
• Los "me gusta"
Muchas aplicaciones, sobre todo, las redes sociales, pero también publicaciones digitales como periódicos o revistas, pone a disposición de las personas usuarias la opción de "Me gusta" (like en inglés) lo que les permite recopilar datos a través de las cookies sobre gustos, intereses y preferencias.
• Las páginas que se visitan
Las cookies almacenan y rastrean todas las páginas que visitas: cuándo lo haces, durante cuánto tiempo e incluso si te instalas una aplicación o haces una compra.
Reflexiona...
La Ley de Protección de Datos Personales y Garantía de los derechos digitales, obliga a todas las webs a notificar a la persona usuaria su política de recopilación y uso de la información que lleva a cabo del tal modo que la persona interesada pueda aceptarla o rechazarla.
3. Identificación de contactos cercanos
Has de ser muy consciente de que cuando etiquetas a alguien con nombre y apellidos en una foto que compartes en redes sociales, estás identificando a la persona y ofreciendo información a la aplicación sobre quiénes son tus vínculos más cercanos.
Por otro lado, las técnicas de reconocimiento facial están cada vez más avanzadas por lo que el reconocimiento de las personas a través de fotografías será también posible.
Antecedentes del big data
Alan Turing y la Computación Moderna
¿Quién fue Alan Turing?
Alan Turing, matemático británico (1912-1954), es considerado el padre de la computación moderna. En los años 30, Turing teorizó sobre la posibilidad de crear una máquina capaz de realizar tareas automatizadas mediante la recolección de datos e identificación de patrones.
Contribuciones Durante la Segunda Guerra Mundial
Durante la Segunda Guerra Mundial, Turing lideró un equipo que descifró los mensajes codificados por los alemanes usando la máquina Enigma. Este logro acortó la guerra entre 2 y 4 años.
Desarrollo de la Teoría Matemática de la Comunicación
Claude Shannon
En 1948, Claude Shannon publicó la Teoría Matemática de la Comunicación, determinando los requisitos mínimos para transmitir información a través de canales, lo que ayudó a reducir el volumen de datos.
Memoria Virtual
Más tarde, se desarrolló el concepto de "memoria virtual", permitiendo el almacenamiento ilimitado y el procesamiento de datos sin restricciones de hardware.
Primeros Usos de Datos Masivos
Censo en Estados Unidos
En los años 80, organizar y tabular el censo en Estados Unidos tomó ocho años. Con la tecnología existente y el trabajo manual, habría tomado 10 años. Esto resaltó la necesidad de avances tecnológicos.
Invento de Herman Hollerith
Máquina Tabuladora
Herman Hollerith inventó la máquina tabuladora, reduciendo el tiempo para organizar el censo a un año. Sin embargo, el aumento de datos presentó nuevos desafíos incluso para esta máquina.
Funcionamiento de la Máquina Tabuladora
La máquina tabuladora contaba los datos del censo usando un sistema compuesto por un contador, un clasificador y un tabulador.
¿Sabías qué?
La máquina tabuladora de Hollerith se utilizó para contar y organizar los datos del censo en Estados Unidos, mostrando cómo la tecnología puede acelerar el procesamiento de grandes volúmenes de información
Los datos son el petróleo del siglo XXI. El despliegue de sensores y el incremento de la capacidad del procesamiento son claves en la transformación de muchos sectores y en la creación de un mundo más medible y programable
César Alierta, presidente Fundación Telefónica
Ciencia de datos y big data
La ciencia de datos es la disciplina que convierte los datos en conocimiento útil.
Ya hemos visto que el objetivo del big data es transformar los datos en información útil. Para ello el big data se basa en la ciencia de datos que combina diferentes técnicas de las matemáticas y ciencias informáticas con el fin de unificar estadísticas y datos de distinta naturaleza para interpretarlos correctamente.
La digitalización produce tal cantidad de información, que solo es posible analizarla mediante la ciencia de datos que utiliza programas y procesos específicos para ello.
Y entonces, ¿qué es un dato?
Un dato es la unidad mínima de información. Un dato se define como la representación de una variable (cualitativa o cuantitativa). En otras palabras, un dato es información.

Tipos de datos
Actualmente, se pueden distinguir dos tipos de datos: estructurados y no estructurados.
• Datos estructurados.
Datos estructurados son aquellos que tienen una estructura y una organización fácil de identificar. Suelen ser archivos de texto que se almacenan en formato de tablas, hojas de cálculo o bases de datos relacionales con títulos reconocibles para cada unidad de información.
Por ejemplo: un informe de ventas del último mes.
• Datos no estructurados.
Este tipo de datos, como su nombre indica, no tienen una estructura identificable y se almacenan en múltiples formatos de imagen, correos electrónicos, mensajes de texto o información multimedia como audios o videos.
Dentro de esta categoría se incluye la información generada por máquinas como las imágenes de satélite o la información que generan los sensores de tráfico o meteorológicos, por ejemplo.
Importancia del big data
Los datos que se manejan para esta tecnología son realmente abrumadores: hablamos de miles de millones de móviles y dispositivos conectados y terabytes de información transmitida alrededor de todo el mundo en tiempo real.
En este contexto, no solo las empresas se están dando cuenta de la necesidad de regirse por los datos para lograr beneficios en sus negocios, también las organizaciones e instituciones públicas y gubernamentales empiezan a mirar al big data como una herramienta que puede contribuir a lograr los objetivos marcados para mejorar la vida de las personas.
Los datos son indispensables para todo en la actualidad, y se están convirtiendo en una pieza clave para la toma de decisiones estratégicas.
El big data y las empresas
No cabe duda de que el big data es una herramienta de gran utilidad para las empresas pues el análisis de los datos que, por ejemplo, proporcionan su clientela sobre sus productos o servicios permite a las compañías adaptarlos a sus intereses específicos o identificar nuevas necesidades a las que dar respuesta.
Al incorporar big data en las empresas es posible lograr nuevos objetivos, nuevas líneas de negocio y capacidades:
1. Costes: se detectan e implementan procesos más eficientes que reducen costes.
2. Toma de decisiones eficaz y rápida: el análisis de los datos permite determinar, incluso predecir, causas de fallos, problemas o defectos en la producción.
3. Nuevos productos y servicios: permite conocer las necesidades concretas de la clientela y su nivel de satisfacción, pudiendo ofrecer productos y los servicios adaptados a sus necesidades.
Cuando buscas en la red, por ejemplo, alojamientos y planes para un viaje, no es extraño que después te aparezcan anuncios en páginas web y redes sociales asociados a ese viaje que has estado buscando, como anuncios de trajes de baño, artículos para la playa o publicidad de planes de viajes. Esto es el resultado del uso del big data.
El big data y las organizaciones institucionales
El big data también es una herramienta de gran utilidad a la hora de identificar y medir problemáticas para poder ofrecer soluciones alineadas con los Objetivos de Desarrollo Sostenible (ODS) de la Agenda 2030.
Por ejemplo, los datos de satélites ayudan a identificar zonas de sequía y se ayuda antes a las poblaciones afectadas. También los datos de sensores en las fuentes de agua informan sobre si es potable. El uso de teléfonos móviles y las redes sociales avisan de situaciones de desastres (terremotos, inundaciones) y permiten enviar las ayudas más rápida y directamente a los lugares donde se necesitan
Tecnologías de big data : recogida de información, procesamiento y almacenamiento
El ordenador Q System One de IBM ha logrado resolver en unos tres minutos un problema de generación de números aleatorios en el que los superordenadores clásicos más potentes del planeta habrían invertido 600 millones de años. Revista Science. Diciembre 2020.
¿Cómo se analizan e interpretan esos datos?
Al inicio de esta unidad didáctica se explica que el big data aglutina varias tecnologías que se podrían resumir en las siguientes:
- Tecnologías para recopilar datos relacionados con las visitas a páginas web, publicaciones en redes sociales y registros de llamadas.
- Tecnologías orientadas al procesamiento de la información que se encargan de preparar y etiquetar los datos para que puedan ser analizados.
- Tecnologías de almacenamiento de datos para salvaguardar toda esa información y que sea accesible.
"La tecnología es importante, pero lo único que realmente importa es qué hacemos con ella". Muhammad Yunus, premio Nobel de la Paz 2006 por el desarrollo del "Banco del Pueblo" dirigido a personas pobres y mujeres de la India.
Un proyecto Big Data
Fases de un proyecto big data
Todo proyecto de big data, sea cual sea su aplicación o caso de uso, pasa por cuatro fases principales que a continuación pasamos a describir brevemente.
1. Definición de los recursos básicos: objetivo y equipo
El primer paso será determinar la finalidad o los objetivos que se desean lograr aplicando las técnicas de big data. Así, será más sencillo decidir los recursos que se necesitarán y desglosar un plan de tareas.
2. Determinar los datos a integrar
En esta etapa del plan se deciden las fuentes que van a proporcionar los datos que se van a analizar, es decir, de dónde se van a extraer los datos.
3. Integrar los datos
En este punto se define la tecnología big data que se va a implementar para el análisis e integración de los datos obtenidos.
4. Estudio de datos dentro del plan
La fase final del proyecto es el análisis de los propios datos para extraer la información sobre la que se basará las futuras tomas de decisiones.
Aplicaciones como Cabify o Uber utilizan el dato de la ubicación del automóvil para informar a la persona usuaria el tiempo que va a tardar en llegar. Traducir ese dato en información útil para las personas usuarias es posible gracias al uso de big data.
4 V del big data
Todas las acciones que realizamos a través de las redes sociales, aplicaciones web, correos electrónicos, etc. generan datos. Cada vez que haces una transacción bancaria, una compra en una tienda online o buscas algo en Internet se queda registrado.
Para dar sentido a todos estos datos, es necesario comprender su composición, por lo que los analistas de datos se apoyan en el método de las 4 V del Big Data para fijar las propiedades de estas gigantescas bases de datos y poder asegurarse de que de ellas podrán obtener conclusiones válidas.
• Volumen
Además de los datos internos propios de la empresa, también se usan datos externos como la web, redes sociales, interacciones con la clientela o incluso datos procedentes de procesos automatizados que realizan máquinas en algunas compañías.
• Variedad
Los datos poseen gran cantidad de formatos, como imágenes, vídeos, metadatos, etc. y provienen de diferentes fuentes, como webs, redes sociales, bases de datos, correos electrónicos, etc. Contar con datos muy diversos permitirá cubrir un amplio rango de casuísticas.
• Velocidad
El proceso que va desde la recopilación de datos hasta el retorno del análisis debe ser ágil y en tiempo real.
• Veracidad
Distinguir los datos válidos para obtener información útil para lograr objetivos de lo que es ruido.
¿Sabías que...?
Justin King era consejero delegado de la cadena de supermercados británica Sainsbury, y explicaba cómo el manejo de los datos establecía relaciones curiosas. Por ejemplo, mostraba una relación entre las compras de productos dietéticos y que la persona estuviera planeando irse de vacaciones. Y esa información sirvió a la cadena de supermercados, por ejemplo, para hacerle llegar publicidad directa de bronceadores.
Lectura facilitada
Big Data: Concepto y Aplicaciones
¿Qué es Big Data?
Big Data, traducido del inglés como "datos masivos", se refiere a grandes conjuntos de datos que pueden llegar a ocupar gigabytes o terabytes. Este concepto no es una tecnología específica, sino que incluye varias tecnologías complejas para recopilar y procesar enormes cantidades de datos, transformándolos en información útil para tomar decisiones.
Ejemplo de Uso
Los sensores que miden los niveles de dióxido de carbono (CO2) en el aire recopilan datos sobre la contaminación en las ciudades, ayudando a tomar medidas para mejorar la calidad del aire.
Beneficios del Análisis de Datos
El análisis de Big Data permite a las organizaciones:
- Identificar nuevas oportunidades de negocio.
- Encontrar patrones y predecir cambios.
- Automatizar procesos para reducir costes.
- Satisfacer necesidades personalizadas de los clientes.
- Identificar tendencias de consumo.
- Mejorar la calidad de vida de las personas.
Por ejemplo, analizar los datos de CO2 puede ayudar a los ayuntamientos a tomar medidas para reducir la contaminación.
Áreas de Aplicación
Big Data se aplica en áreas que recopilan muchos datos, como:
- Gestores de correo electrónico.
- Navegadores y buscadores web.
- Servicios de mensajería y redes móviles.
- Aplicaciones de smartphones que detectan temperatura, contaminación, pasos diarios, o ubicación.
Un ejemplo es el proyecto LUCA de Telefónica, que analiza información de antenas de telefonía para reducir atascos y descubrir destinos turísticos favoritos.
Ejemplos de Big Data en Redes Sociales
- Facebook, WhatsApp e Instagram: Facebook recopila y analiza datos de estas aplicaciones para realizar campañas personalizadas y obtener beneficios económicos.
- LinkedIn: Ofrece empleos personalizados según el perfil y contactos de los usuarios.
¿Cómo se Recopila Información?
- Cesión de Datos Personales: Al registrarse en aplicaciones, se pide información personal a cambio de servicios. Los usuarios tienen derecho a gestionar sus datos y cancelar el consentimiento.
- Cookies de Seguimiento: Al navegar, las cookies recopilan información sobre ubicación, búsquedas, páginas visitadas y "me gusta".
- Identificación de Contactos Cercanos: Al etiquetar a personas en fotos, se ofrece información sobre los vínculos cercanos.
Importancia del Big Data
Big Data es esencial para las empresas y organizaciones gubernamentales. Permite tomar decisiones estratégicas y mejorar servicios basados en datos. Las empresas pueden reducir costes, mejorar la producción, y ofrecer productos personalizados. Organizaciones públicas pueden usar Big Data para solucionar problemas alineados con los Objetivos de Desarrollo Sostenible.
Tecnologías de Big Data
Big Data incluye tecnologías para:
- Recopilar datos de páginas web, redes sociales y llamadas.
- Procesar y etiquetar datos.
- Almacenar información para que sea accesible.
Fases de un Proyecto Big Data
- Definición de Objetivos y Recursos: Determinar los objetivos y recursos necesarios.
- Determinar Datos a Integrar: Decidir las fuentes de datos.
- Integrar los Datos: Implementar la tecnología Big Data para análisis.
- Estudio de Datos: Analizar los datos para tomar decisiones informadas.
Las 4 V del Big Data
- Volumen: Gran cantidad de datos internos y externos.
- Variedad: Diversidad de formatos y fuentes de datos.
- Velocidad: Rapidez en la recopilación y análisis de datos.
- Veracidad: Calidad y validez de los datos para obtener información útil.
Reflexión
La información personal es valiosa para las empresas, pero los usuarios deben ser conscientes de sus derechos y cómo gestionar sus datos. Revisa siempre las políticas de privacidad y uso de datos de las aplicaciones y servicios web.