¿Sabías que tu próxima acción ya ha sido adivinada?

¿Sabías que tus gustos han sido descubiertos?

¿Eres consciente de que Facebook te conoce mejor que tu madre?

Todo esto, que parece el argumento de una película de ciencia-ficción, tiene una clara explicación: el Big Data.

Y en este post te cuento qué es y para qué sirve el Big Data.

¿Qué es el Big Data?

No es fácil definir una tecnología como el Big Data.

Podemos definirlo desde dos puntos de vista:

  • Desde la perspectiva del tamaño de los datos, puede definirse como una cantidad tan grande de datos que no caben en una sola máquina, que se producen de una forma muy rápida y que, a veces, también es necesario interpretarlos y procesarlos en tiempo real.
  • Desde un punto de vista puramente tecnológico, se define como un conjunto de procesos y tecnologías que permiten recoger y almacenar cantidades enormes de datos de distintas procedencias y tipologías, siendo la base tanto de la digitalización masiva del mundo analógico, como del almacenamiento de los propios datos generados en el mundo digital.

Algo de historia

Actualmente, términos como Big Data, inteligencia artificial y robótica están en boca de todos.

Pero, ¿sabes cuál es el origen de los mismos?

Durante siglos el ser humano ha tratado de almacenar, primero lo físico y ahora lo digital.

El objetivo siempre ha sido similar: almacenamos con el propósito de organizar nuestros recursos y facilitar la forma de acceder a ellos.

Y así, el primer indicio de almacenamiento de datos se produce hace más de 20.000 años cuando nuestros antepasados pintaban los techos de las cuevas en las que vivían. No sólo para recordar eventos sino también como base de la narrativa que permitió transmitir sus historias a las siguientes generaciones.

Para evitar nuestra tendencia natural a olvidar, hemos buscado mecanismos para guardar lo que nos interesa y poder recuperarlo más tarde. Y precisamente usando formas similares las que usa nuestro propio cerebro, para guardar y recuperar información.

Es con el desarrollo de la informática a mediados del siglo XX cuando surge una auténtica revolución en la forma de almacenar datos.

Las cinco Vs del Big Data

Los expertos en Big Data consideran que esta tecnología se caracteriza a través de cinco Vs:

1. Volumen

No hay una determinada cantidad de datos a partir de la cual se considere Big Data. Sin embargo, podemos considerar que el volumen de datos que maneja esta técnica sería de muchos Terabytes.

Imagina, por ejemplo, los datos de actividad de una empresa. Una mediana empresa puede utilizar un volumen de los datos que puede alcanzar cientos de Gigabytes. Esa información no se considera Big Data. De hecho, una empresa que guarde ese volumen de datos no utiliza la tecnología Big Data.

Si se usa, en cambio, por empresas muy grandes. Por ejemplo, de comercio electrónico o por entidades financieras que generan enormes cantidades de datos.

2. Velocidad

Los datos usados en Big Data se trabajan a mayor velocidad que los gestionados en bases de datos tradicionales.

De esta forma, el Big Data se ocupa de datos que se generan en tiempo real, o incluso a velocidad superior de un dato por segundo.

Un ejemplo de ello son las transacciones que se realizan en la Bolsa de Nueva York en un día, donde las operaciones se ejecutan en menos de un nanosegundo.

Igualmente, Internet ha pasado a ser sin duda en el mayor motor de generación de contenidos. Y, por ello, en el gran generador de datos a gran velocidad.

En un minuto se envían más de 2.000 millones de e-mails, se realizan más de cuatro millones de búsquedas en Google o se suben una media de 300 horas de vídeo a YouTube.

3. Variedad

Si en alguna ocasión has trabajado con una base de datos sabrás que, en su mayoría, los datos que contiene son texto y números, a menudo relacionados entre sí en una base de datos relacional.

En el caso del Big Data los datos son más variados, no se trabaja solo con textos y números.

El Big Data trabaja con fotografías, vídeos, audio, series de datos temporales, y muchos otros tipos de datos. Y hay que tener en cuenta que a menudo estos datos son no estructurados como puede ocurrir por ejemplo con el contenido que se genera en un blog, o en Twitter.

4. Veracidad

Se trata de la integridad de los datos.

Estos datos serán más veraces siempre y cuando el programa que los registre no esté comprometido. Partiendo de este supuesto, podemos confirmar que a mayor información, más fácil será que esta pueda ser constatada como información auténtica.

Sin embargo, debido a la infoxicación que se vive hoy en día y a la dificultad existente de contrastar las fuentes y de mejorar dicha información, es conveniente andar con cuidado para no ser manipulados con noticias falsas o fake news que puedan contaminar nuestras bases de datos.

5. Valor

El valor del Big Data está unido a la ventaja que podamos obtener de los datos, además del propio valor que los datos poseen.

Sin embargo, el verdadero valor del Big Data se encuentra en la conversión de los datos a información práctica a través de la analítica.

Así, si se usa adecuadamente esta tecnología, las empresas podrían:

  • Optimizar procesos
  • Conocer mejor a sus clientes
  • Ofrecerles publicidad asociada a sus gustos.

En definitiva, mejorar la competitividad.

Aquí podemos comprender claramente por qué se considera a los datos como el petróleo del siglo XXI.

El Big Data sería el equivalente a la extracción de la materia prima mientras que la analítica (esto es, la aplicación de algoritmos sobre los datos) supondría la acción de refinar esos datos a fin de darles un valor añadido en el mercado, siendo muchas veces el paso previo para la creación de una inteligencia artificial.

Elementos

Junto con los datos, la tecnología Big Data necesita tres elementos fundamentales para garantizar que dispondrá de la capacidad suficiente para proporcionar los servicios.

Sistema de almacenamiento

Se trata de la infraestructura, física y lógica, necesaria para almacenar de forma eficiente las grandes cantidades de datos que se usan como fuente para el Big Data.

No solo la cantidad es importante, también lo es la velocidad de estos sistemas. De nuevo, no nos sirven las estructuras de los medios tradicionales de almacenamiento.

Empezando por el hardware, se desarrollaron nuevas formas de estructura para conseguir el almacenamiento usando muchos servidores con poca capacidad individualmente. Pero con enorme capacidad de forma conjunta.

El software tradicional tampoco era válido para los fines del Big Data. Por eso se crearon nuevos gestores de datos como puede ser Hadoop.

Sistema de procesamiento

Es necesario extraer información inteligente a partir del Big Data.

Por eso, además de ser capaces de almacenar los datos, debemos poder realizar cálculos y operaciones matemáticas partiendo de los mismos.

Sistema de comunicación

Este sistema es esencial para el funcionamiento efectivo y el rendimiento de los otros dos anteriores.

Y es que, tanto para poder almacenar datos, como para poder acceder a ellos, resulta necesario una infraestructura de red.

¿Para qué sirve?

Una de las claves del Big Data es el uso de la analítica y la estadística.

Gracias a su uso se puede interpretar una enorme cantidad de datos, obtener información y aprovecharla para que sea utilizada en nuestro favor.

La analítica trata de ahondar en los datos para así encontrarles un sentido e interpretarlos.

A partir del análisis de dichos datos podemos comprender cuestiones que eran desconocidas, como:

  • Conocer la situación de un determinado elemento (por ejemplo, las ventas de una compañía) y las razones por las que sucede.
  • Predecir el futuro más cercano, a partir de los datos, para prepararnos y anticipar decisiones.

Todo ello ha originado el aumento de nuevos profesionales que ahora se necesitan para interpretar los datos (Data scientist) así como para adoptar decisiones estratégicas con respecto a los mismos (Chief Data Officer).

Las aplicaciones de la analítica, en una empresa, se dan en multitud de áreas.

Puede aplicarse prácticamente a todos los departamentos de una compañía, con independencia de su sector o rama de actividad.

Por ejemplo, se pueden aplicar a las ventas, marketing, experiencia de clientes, riesgo financiero, y muchas más.

Ventajas para las empresas

La digitalización, la globalización y la conectividad rompen las viejas estructuras y permiten abordar al consumidor de una manera distinta, presentándole una oferta que aporte más valor.

Las grandes empresas supieron ver el valor potencial de las técnicas del big data y la minería de datos hace años.

Y así Axciom, Google, IBM o Facebook llevan años invirtiendo en descubrir nuevos usos de los datos, cómo tratarlos y cómo transformarlos en valor.

Este nuevo conocimiento, permite a las empresas crear nuevos servicios y productos más adaptados a las necesidades de las personas, lo que les permite tener una gran ventaja competitiva.

De entre todas, podemos decir que en el área de experiencia del cliente la analítica está jugando un papel más importante.

Así, en la actualidad y gracias al Big Data podemos conocer a cada cliente de manera individual, entendiendo más allá de una compra aislada y haciendo proyecciones al futuro. Además de descubrir patrones de comportamiento de los clientes.

Con el avance del big data nos encontramos con la creación de la publicidad conductual o publicidad dirigida, que es una forma de predecir, mediante el comportamiento de los usuarios, qué servicio o
producto podría interesarte comprar.

Con esto las empresas pueden llegar a un público más interesado en sus anuncios, lo que significa vender más.

También se benefician:

  • Administraciones Públicas
  • Sector sanitario
  • Sector financiero y bancario

El uso de los macrodatos supone:

  • Tomar decisiones de forma más rápida y eficaz
  • Realizar análisis predictivos
  • Mejora continua de los sistemas de trabajo
  • Mejorar la eficiencia.

Beneficios para particulares

Ahora bien, las empresas no son las únicas que se pueden beneficiar de esta tecnología, también los particulares.

Pensemos por ejemplo en los datos recogidos por nuestros dispositivos wearables como un reloj inteligente que mide tus constantes vitales, entre otras cosas. También es gracias al Big Data, que a partir de datos de salud conseguidos por medio de medidores puede conseguir el diagnóstico precoz de enfermedades.

Inconvenientes

Como era de prever, no todos son ventajas en la implantación del uso del big data.

Principalmente hay tres aspectos en los que puede ser negativa la aplicación del big data. Estos son:

  1. El riesgo de incurrir en conclusiones erróneas que una persona no revise, ya que estamos expuestos a establecer conexiones entre datos o información, que no tienen ningún tipo de relación entre sí, y que pueden únicamente deberse a la casualidad o al puro azar.
  2. El riesgo para las personas que pueda tener la toma de decisiones automatizadas sin una supervisión humana, ya que confiar ciegamente en los algoritmos lleva a que en muchas ocasiones las empresas tomen decisiones sobre nosotros sin que podamos saber por qué las han tomado. Como por ejemplo, cuando acudimos a una tienda para realizar una compra a plazos, se realiza un estudio que se basa en introducir nuestros datos en un programa y éste decide, en base a puntuaciones y a información contenida en bases de datos, si nos conceden o no ese crédito.
  3. El riesgo para la privacidad de las personas y el tratamiento de sus datos personales para realizar elaboración de perfiles. El empleo de los macrodatos implica en muchas ocasiones una intrusión en nuestro derecho fundamental a la protección de datos personales que deriva directamente de la Constitución y que se encuentra regulado en el RGPD y la actual Ley Orgánica de Protección de Datos Personales y Garantía de Derechos Digitales (LOPDGDD).

Big Data vs Business Intelligence

¿Cuál es la diferencia entre Business Intelligence y Big Data?

A través del Big Data podemos tratar una gran cantidad de datos, tanto estructurados como desestructurados, que se reciben a una gran velocidad.

Con esta información, las herramientas de Business Intelligence nos permiten realizar análisis predictivos y avanzados, que nos facilitan la toma de decisiones estratégicas a través de una predicción de comportamiento fundamentada en datos reales con los que es posible reducir el margen de error. Es decir, son soluciones accesorias.

Con el Big Data también podemos incorporar más fuentes de datos. Aparte de las fuentes internas ordinarias, es posible incluir información de máquinas, smartphones, sensores, texto no estructurado como Tweets, redes sociales, tendencias de mercado, etc.

El Business Intelligence, por su parte, nos aporta las herramientas para el análisis de los datos que conforman el Big Data.

Estas herramientas dan un valor añadido a la obtención de datos que nos acompaña en la estrategia del negocio.

Por ejemplo, Amazon y Yahoo se basan en Business Intelligence para llevar a cabo cambios comerciales.

Ejemplos

Para terminar, unos ejemplos prácticos.

Netflix

¿Eres usuario de Netflix?

Netflix es una de las plataformas llamadas Over The Top (OTT), o plataforma de transmisión libre que da gran flexibilidad al usuario cediéndole un nuevo poder: elegir qué ver dentro de un amplio catálogo de películas, series y documentales.

Actualmente, la plataforma cuenta con alrededor de 300 millones de usuarios.

Pero ¿quién decide el contenido que van a ver los usuarios?

Normalmente, es la compañía la que decide las series y películas que estarán disponibles para los clientes, pero esto no es siempre así.

De hecho, la serie House of Cards, producida por Netflix e incluida en 2013 entre los títulos disponibles en la plataforma, se creó a partir de las preferencias de los usuarios.

Todos en Netflix estaban seguros del éxito que tendría la serie y, por eso, en vez de elaborar un primer programa piloto y analizar su impacto, rodaron los 13 capítulos de la primera temporada y los subieron a la plataforma, suponiendo uno de los mayores éxitos de la empresa.

Te preguntarás cómo se consiguió, la respuesta, una vez más es: Big Data.

Netflix usó un algoritmo que examinaba grandes cantidades de información de sus usuarios.

De esta forma, llegaron a la conclusión de que a los clientes les interesaban series con drama político. Incluso sabían a qué personajes tenían que matar para mantener a los espectadores pegados a la pantalla hasta el final de la serie.

Es más, el Big Data se utilizó no sólo para decidir el contenido de los capítulos, sino también para su distribución.

Analizando de datos observaron que a los suscriptores les gusta hacer maratones de series los fines de semana. Por ello, la productora puso a su disposición los 13 capítulos de la primera temporada de la serie, en lugar de seguir la práctica habitual de subirlos progresivamente.

NBA

La tecnología Big Data también se está aplicando al mundo de los deportes.

Así ha ocurrido en la NBA, donde se utilizan datos para reconocer buenos jugadores. Y usa las estadísticas para comprobar los mejores tiros de cada jugador.

Este es el ejemplo de lo ocurrido con Stephen Curry, jugador del equipo de baloncesto de la NBA Golden State Warriors.

Stephen Curry había sido conocido a lo largo de su carrera como el penúltimo tirador de triples.

Pero el Big Data mostró que el promedio de acierto de Curry apenas variaba al retirarse de la línea de tiro, que está a 24 pies de distancia de la canasta, hasta una distancia de entre 28 o 30 pies.

La analítica de datos demostró que recurrir a los tiros triples llevaba al equipo a ganar más puntos que los tiros de dos puntos que se realizan cerca de la canasta.

Como resultado, los entrenadores comenzaron a animar a sus jugadores a que realicen tiros triples. Así, se pasó de una media de 18,4 tiros triples en 2012 a 27 en 2017.

Los avances tecnológicos son buenos pero, como todo, pueden volverse en nuestra contra.

Por eso es importante una buena educación en las TIC y en tener en consideración nuestros datos personales, ya que son los datos que nos diferencian y que nos hacen ser nosotros mismos, son nuestra identidad y, como tal, hay que protegerlos.

¿Tú qué piensas? Espero tus comentarios.

Escribe aquí tu comentario

Deja un comentario

Las siguientes reglas del RGPD deben leerse y aceptarse:
Este formulario recopila tu nombre, correo electrónico y contenido para que podamos realizar un seguimiento de los comentarios dejados en la web. Para más información revisa nuestra política de privacidad, donde encontrarás más información sobre dónde, cómo y por qué almacenamos tus datos.