Saltar al contenido
Papeles de Inteligencia Competitiva

Guía para entender qué es el big data de una maldita vez

qué-es-el-big-dataLlevo bastante tiempo leyendo sobre Big Data, Small Data, Internet de las cosas etc… y hablando con decenas de profesionales en las empresas sobe este tema. Lo que termino de concluir es que hay mucha confusión derivada, consciente o inconscientemente sobre el termino y que esto provoca que no respondamos adecuadamente qué es el big data.

Así, el big data se ha convertido en un termino de moda para consultores y directivos sin saber en muchos casos de lo que hablan.

¿Cómo un director que no sabe lo que es Google Analytics puede saber algo sobre el big data?

Da igual, lo importante es que nadie nos pase por la derecha y si hay que decir que «yo soy el big data» lo haremos.

En este sentido y como primera aproximación al entorno en el que nos movemos, gestión de información-datos generados fuera de las empresas, me he atrevido a hacer esta primera clasificación que quiero compartir con vosotros para poder recibir la crítica u orientación oportuna, dado que es mi intención darle aire en este blog al debate sobre qué es el big data y hacia donde debería ir dentro de la empresa.

Curso de experto en Big Data

Sin Internet no podemos entender qué es el big data

El llamado Big Data, está generando una enrome confusión derivada de una visión parcial del observador.

La inmensa profusión de datos e informaciones que aparecen derivados del proceso de digitalización que esta sufriendo el mundo, nos está llevando a una auténtica revolución en la forma de gestionar procesos productivos, aplicaciones y nuestra propia vida.

Así como la manera de entenderlos y de compartirlos.

los tres niveles del big data
Infografía cortesía de Iñaki Oroz

El Big Data se da a mi entender en tres niveles:

Nivel 1 o Nivel Consciente del World Wide Web:

Esta es la información y datos puestos en la Red por decisión consciente  de personas y empresas:

  • Webs, Blogs, medios…
  • Redes sociales: Twitter, LinkedIn, Facebook
  • Bases de datos

Los volúmenes de esta informacion y estos datos son claramente inferiores a los de otros niveles y aun así, su tamaño es abrumador. Van desde los pequeños cambios que pueden apreciarse en una web (precios, anuncios, descripciones) a artículos o publicaciones científicas o la informacion que compartimos en redes sociales.

Millones de items diarios.

¿Cual es el valor de todo esta información? Su valor reside en comunicar, compartir conocimiento. analizar, relacionar y facilitar predicciones de comportamiento, avances tecnológicos, prevenir epidemias (Twitter), identificar inversiones, detectar oportunidades y amenazas. En la vida personal reconocer objetos y disponer de información avanzada, o simplemente el tráfico o el mejor  estacionamiento, o la mejor oportunidad para hacer una compra…

Sus aplicaciones son muchísimas y están al alcance de la gran mayoría de las organizaciones.

Nivel 2 o Nivel inconsciente de la generación de datos

Es lo que se conoce como el Automatic Personal Data (APD) o datos generados por uso de dispositivos por parte de las personas, como ordenadores, smartphones y apps de dispositivos.

La generación de estos datos es inconsciente por parte de los individuos pero proveen de un montón de información sobre donde estamos, nuestros gustos, y actividades. Como comprenderás aquí se generan una cantidad brutal de datos que las empresas están dispuestas a explotar.

El valor de estos datos es muy alto ya que permiten:

  • La reducción de costos de todo tipo,
  • El análisis de comportamientos,
  • La gestion y optimizacion de la publicidad,
  • La geolocalización y gestion del tráfico,
  • Así como la planificación de suministros, seguridad, salud, gestión avanzada de recursos al servicio de los ciudadanos,

Sus aplicaciones son muchísimas pero los datos pertenecen a un grupo selecto de compañías a los que les cedemos la propiedad de estos datos y que pueden hacer el uso que más les convenga.

No son datos de dominio publico como ocurre con los del nivel 1 y por lo tanto solo pueden ser explotados por empresas de telecomunicaciones o de nuevas tecnologías.

Nivel 3 o Nivel impersonal de los datos, la Internet de cosas

El tercer nivel es el nivel de donde se producen e intercambian datos entre máquinas. Es lo que se conoce como el Internet de las cosas.

La generación de estos datos tiene como origen la interactuación de las máquinas entre ellas.

Las aplicaciones pueden ser amplísimas pero sobre todo se habla en este campo de las Smart cities o plantas de producción autogestionadas.

¿Te suena eso de almacenes totalmente controlados por máquinas o las redacciones de periódicos sin periodistas o  los vehículos sin conductor, la ropa inteligente, electrodomésticos, controles de fuga de agua o consumo eléctrico?

Pues esta es la Internet que lo hace posible.

Su gran valor reside en:

  • Reducción de costos de todo tipo.
  • Control eficiente de máquinas, organizaciones, cultivos, agua, petróleo, energía, suministros, transporte de mercancías, prevención de catástrofes. …

Son muchas las aplicaciones que pueden desarrollarse en ese campo y donde la figura del científico de datos cobra especial relevancia.

¿Lo que no quieren que sepas sobre qué es el big data?

El problema del termino Big Data no es el mismo termino en si, sino el significado interesado que le pretenden dar.

Está claro que Big data es tratamiento masivo de datos. ¿Pero de que datos?

Lo que planteo. No es aclarar el termino, sino intentar al menos diferenciar los tres grandes campos en los que se mueve la información y los datos que aparecen derivado de la digitalización.

En este sentido, el problema es que los periodistas, los consultores, los ponentes etc… cuando nombras la palabra “big data» solo parecen querer dar espacio para el Internet de las cosas y ahora poco a poco también al APD.

Tal vez porque es el nivel que más esperanzas suscita o porque es el más tangible o porque determinados agentes de la industria están trabajando descaradamente en ello para monopolizar el termino y concionar las inversiones.

Hice la prueba el otro día en una conferencia del presidente de ANFAC, haciendo una mención al termino centrado en el nivel 1 y a la salida estaba rodeado. ¿Por qué? Porque la mayoría de las personas y directivos solo oye hablar sobre Big Data casi exclusivamente relacionado con el nivel 3 y algo con el 2.

Y claro las empresas que pueden hacer uso del Big Data en esos dos niveles no son muchas. Sin embargo desde el punto de vista del Big Data de nivel 1 cualquier empresa puede empezar a explotar esos datos porque para empezar su titularidad es pública.

Curso de experto en Big Data

Aquí todas las organizaciones tienen la oportunidad de auto mejorarse.

Corresponde al mundo de las empresas y a sus directores tener al cliente en el centro de sus decisiones, controlar a la competencia y observar lo que se dice y hace en la WWW por parte de otras personas, empresas e instituciones.

El APD, según mis investigaciones, va estar en manos de empresas especializadas donde su modelo de negocio se base claramente en la explotación de los datos obtenidos por sus dispositivos o aplicaciones.

Esto ya lo hacen Google y Amazon. Pero iremos viendo cantidad de Start Ups que se posicionaran en este espacio.

De hecho por lo que he podido informarme hablando con operadores, agencias y empresas,  es un mercado ya estructurado donde hay vendedores de espacios (medios y nuevos agentes con públicos fidelizados, google, blogs..), integradores distribuidores de espacios, y al otro lado estamos las personas escrutadas por nuestros Smart, dibujando nuestro perfil de compartimiento, que leído por quien dispone de estos datos (las telefónicas, Apps, Google..) venden a los primeros o a los distribuidores el target de perfiles concretos para hacer la publicidad más precisa que hayamos podido conocer.

En el APD es donde más dinero se está metiendo y donde creo el Big Data más va a desarrollarse en los próximos años. Dando lugar a servicios avanzados que las empresas podremos adquirir.

Para mí, lo importante es saber dónde estamos, donde están los demás, y luego ser capaces de integrar de manera consciente a la organización cada uno de los niveles del Big Data si fuera necesario.

Pero sin atragantarse.

Todavía la mayoría de los directivos desconocen términos como RSS o Google News así que imagínate lo que es hablar del tratamiento de datos en la empresa al nivel del BIG DATA.

En este sentido, creo que ante el interés que suscita Big Data, debemos tener muy claro cuál de sus tres niveles es que nos puede ayudar.

En conclusión qué es el Big Data

La popularización de conceptos como “Big Data” asimilado a la gestión masiva de datos está facilitando una creciente confusión que iguala de forma muy frívola una parte del fenómeno con el todo.

Lo hemos vivido con el “marketing”, concepto que hoy muchas personas lo asimilan a publicidad, cuando es un concepto mucho más rico y profundo. “Este producto lo único que tiene es mucho marketing”, para querer decir que no vale nada, que es puro resultado de un esfuerzo publicitario.

La aparición de INTERNET, o la incorporación de técnicas digitales a nuestra forma de relacionarnos, entendernos, documentarnos etc, está produciendo un tremendo “shock” en todos los agentes.

A finales del siglo pasado nace INTERNET y aun hoy pocas personas están siendo capaces de asimilar la información que nos facilita. Por si no fuera poco, en la primera década del presente siglo, nosotros como personas nos convertimos en fuente masiva de información, como consecuencia de dos grandes fenómenos:

  1. El primero derivado de acciones voluntarias de las personas, relacionado con las  “redes sociales, blogs”, etc
  2. Y  el segundo, la producción inconsciente de información y datos, que aparecen por el uso de dispositivos que  permiten a terceros conocernos y predecir nuestro comportamiento como nunca antes hubiéramos imaginado.

En esta contexto y para complicarlo todo nos encontraremos con una jerga de nombres para intentar poner “apellidos” a las diferentes formas de definir esta serie de fenómenos tan dispares para decir lo mismo. Lo cual dificulta a las organizaciones algo que debería ser una prioridad, tener un plan en el que ir incorporando los datos, la información y los hechos a sus procesos productivos.

Curso de experto en Big Data

Para poder enfrentarnos a este contexto, lo mejor es tener muy en cuenta cuales son las ventajas de tener una estrategia de análisis de datos para tu empresa.

Deja una respuesta

Responsable » Digital Research S.L con CIF/NIF: B86680667
Finalidad » gestionar los comentarios.
Legitimación » tu consentimiento.
Destinatarios » los datos que me facilitas estarán ubicados en los servidores de Hostgator (proveedor de hosting de Papeles de Inteligencia) Fuera de la UE.
Derechos » podrás ejercer tus derechos, entre otros, a acceder, rectificar, limitar y suprimir tus datos.

Comentarios (9)

Ramón, simplemente excelente. Efectivamente de una vez por todas he entendido qué es el Big Data. Ahora me pregunto por sus aplicaciones al mundo de la Dirección de personas….
Enhorabuena y gracias por dar conocimiento de valor.

Javier L. Crespo

Responder

Gracias Javier por tu comentario.

En el tema de la dirección de personas yo no estoy muy metido. Pero si se están dando pasos interesantes al respecto. Te dejo unos artículos de Josh Bersin al respecto publicados en la revista Forbes:

  • El big data en los recursos humanos
  • La datacificación de los recursos humanos
  • Aplicando el big data a la función de recursos humanos
  • Están en inglés.

    Un saludo
    Ramón

    Responder

    Gracias Ramón, los leeré con gusto.
    Un cordial saludo

    Responder

    Muy didáctica la guía!!

    Responder

    ¡Gracias Aintzane!

    Responder

    Permíteme felicitarte Ramón por este excelente artículo. Para los no muy impuestos en el tema su contenido resulta claro e inteligible.

    Responder

    Gracias Josep!

    Responder

    Muy interesante el artículo, sobre todo cuando hablas de la cantidad de nombres que se le ponen a las cosas que llevamos años haciendo. Para mí, Big Data no deja de ser una evolución de hacer Data Mining sobre un conjunto de datos. La diferencia es el repositorio de los datos que en el caso de Big Data es Internet. Muchas gracias por el artículo. Un saludo.

    Responder

    Hola Antonio, pues tienes mucha razón en todo lo que dices. Al final es una cuestión de rebautizar términos y disciplinas.

    Saludos
    Ramón

    Responder