Qué es exactamente el big data Buena pregunta. Al fin y al cabo, desde hace mucho tiempo hay grandes cantidades de datos de todo tipo de fuentes: recibos de compras, datos de tarjetas, informes médicos, declaraciones de impuestos y un largo etcétera.
Se trata de la gestión y análisis de enormes volúmenes de datos que superan los límites y capacidades de las herramientas habitualmente utilizadas.
Laurie Miles, jefa de análisis de la empresa especializada en el tema SAS, explica: "El concepto de grandes datos existe desde hace décadas, y hemos estado haciendo análisis durante todo este tiempo. Pero ahora no es grande (big), es enorme".
En efecto, lo que hizo que se acuñara este término es la velocidad, la variedad y el volumen que ahora tienen los datos.
Por qué es tan grande
Cada motor de un avión en un vuelo de Londres a Nueva York genera 10 terabytes de datos cada 30 minutos.
En 2013, los datos de internet, en su mayoría aportados por los usuarios, representaron 1.000 exabytes.
Los datos meteorológicos recogidos en Estados Unidos por la Administración Nacional Oceánica y Atmosférica tienen un valor anual estimado de unos US$10 mil millones.
Todos los días creamos 2,5 trillones de bytes de datos.
El 90% de los datos en el mundo de hoy se ha creado en los últimos dos años.
Cada minuto se envían 100,000 tuits a nivel mundial.
Google recibe dos millones de peticiones de búsqueda por minuto.
La mayoría de los datos tradicionalmente se estructuraron en bases de datos.
Fue entonces cuando el mundo se volvió digital y llegó internet.
La mayor parte de lo que hacemos se puede traducir en cadenas de unos y ceros que puedan ser registrados, almacenados, registrados y analizados.
Luego hubo una proliferación de los llamados "datos no estructurados", generados por todas nuestras interacciones digitales, desde el correo electrónico a las compras en línea, los mensajes de texto, los tuits, las actualizaciones de Facebook y los videos de YouTube, entre otras.
Y el número de aparatos de grabación y transmisión de datos, desde smartphones hasta neveras inteligentes, sensores industriales a cámaras de circuito cerrado de televisión, ha aumentado en todo el mundo, dando lugar a una explosión en el volumen de datos.
Estos conjuntos de datos son ahora tan grandes y complejos que necesitamos nuevas herramientas y enfoques para sacar el máximo provecho de ellos.