Big data: ¿Síndrome de Diógenes informático?
Vaya preguntita… Antes de contestar y ver si esto es posible, vamos a pararnos a pensar qué datos pueden tener nuestros y cómo se pueden utilizar.
Diariamente, podemos manejar y proporcionar ingentes cantidades de datos. Consultar nuestra cuenta bancaria, realizar transacciones, comprar por internet, indicar nuestra posición a través del móvil, publicar contenidos en redes sociales, etc. Como dato curioso, en Twitter se publican cerca de 12 Terabytes de tweets, y en Facebook se almacenan alrededor de 100 Petabytes de fotos y videos. Por otra parte, las diferentes empresas manejan diariamente multitud de datos de nuestro consumo (agua, luz, teléfono) hábitos de compra, preferencias…
Así mismo, las empresas mantienen grandes cantidades de datos transaccionales, reuniendo información acerca de sus clientes, proveedores, operaciones, etc. De la misma manera sucede con el sector público, (datos de población, impuestos, historial crediticio, renta, patrimonio, registros médicos, etc.)
Otra fuente de datos importante es la comunicación denominada máquina a máquina, “M2M machine-to-machine”. Se estima que hay más de 30 millones de sensores interconectados en distintos sectores (transporte, industria, servicios, comercial…).
En resumen, los seres humanos estamos creando y almacenando información constantemente y cada vez más en cantidades astronómicas.
En realidad, desde siempre se ha tratado de explotar esta información. En nuestro caso, llevamos muchos años desarrollando proyectos con aplicaciones de business intelligence o herramientas de integración, capaces de mezclar información de diferentes bases de datos, transformando la información en conocimiento para mejorar la toma de decisiones.
Pero en ocasiones esto no es suficiente, y es entonces cuando entra en juego el concepto de Big Data. Término aplicado al conjunto de datos que superan la capacidad del software habitual para ser capturados, y sobre todo gestionados y procesados en un tiempo razonable.
A priori, no hay nada fundamentalmente novedoso en el Big Data. Incluso muchos expertos en la materia, afirman que no es más que un ‘gancho comercial’ para denominar a la estadística que siempre hemos conocido, y simplemente se trata de la evolución natural de las técnicas y en cómo los expertos enfocan los problemas.
En este sentido, dos de las empresas que mejor uso hacen de los datos que recolectan son Google y Facebook. Pero se están abriendo nuevas oportunidades también para las PYMES. Un ejemplo, es la empresa de reciente creación ASThRO con la que colaboramos desde sus inicios. Esta empresa modelizan redes, explicando y prediciendo su comportamiento, demostrando que el comportamiento humano colectivo es predecible. Han realizado publicaciones de su método en The Royal Society, The American Physical Society, MIT y otros.
Como conclusión, podemos afirmar que una de la característica distintiva del Big Data es la capacidad de modelizar y predecir ciertos comportamientos del ser humano en base al rastro que deja en la red la acción humana. Sería prematuro contestar a la pregunta con un rotundo SI, pero sin duda con el tiempo se podrán montar modelos estadísticos que lo consigan.
Desde nuestro punto de vista, el éxito de los proyectos Big Data no vendrá dado por el tratamiento ilógico de una cantidad ingente de datos, eso nos llevaría irremediablemente a un “síndrome de Diógenes informático”. Sino en la utilización inteligente de los mismos; sabiendo el resultado que se quiere buscar, poniendo los medios tecnológicos que minimicen el volumen de datos a almacenar y su procesamiento eficiente.
CEO Besoftware BSW
Artículo incluido en la Revista Vida Económica Big data: ¿Síndrome de Diógenes informático? (pdf)