Hablar de datos y tecnología puede resultar un poco redundante. No hay gestión ni enfoque hacia los datos sin las tecnologías de la información y las comunicaciones que lo posibilitan. En este post me propongo descifrar de manera sencilla que herramientas y soluciones tecnológicas nos permiten desarrollar nuestra competencia de data mindset.
Data Mindset: ”El interés y capacidad de las personas para gestionar los datos y apoyarse en ellos para trazar estrategias, definir planes, tomar decisiones, liderar equipos o influir tanto dentro como fuera de la organización”
Partimos de la base que un ser humano no puede consumir una gran cantidad de datos en bruto, requieren de la ayuda de soluciones donde almacenarlos y de algoritmos que puedan darles sentido a los datos. En el almacenamiento de la información, la evolución en los últimos años ha sido muy relevante: Hemos pasado de las cintas magnéticas a grandes discos magnéticos, de estos al almacenamiento óptico en CDs, de estos a lápiz USB y de estos al concepto de la nube. Se estima que alrededor del 60% del total de la información almacenada globalmente son datos llamados “fríos”. Se necesitan conservar, pero no tener un acceso rápido y constante a ellos
“La cinta es la única tecnología que dispone ya de los prototipos capaces de cubrir las necesidades de los usuarios durante los próximos 10 años”
Anna Baldrís, Fujifilm
Lograr sistemas de almacenamiento que sean más longevos, seguros y que generen menos emisiones a la atmósfera es una prioridad global.
Por otro lado, el análisis de datos es responsable de crear los algoritmos. La Ciencia de Datos podría ser entendida como una disciplina que combina campos como la estadística, los métodos científicos y el análisis de datos, para extraer el valor de estos últimos. La ciencia de datos involucra aspectos relacionados con el análisis de datos propiamente dicho y a herramientas de captación y reconocimiento de patrones, como Analytics y machine learning. Las organizaciones han aprendido a conjugar distintas tecnologías de análisis de datos para obtener los mejores resultados. Python lidera en lenguajes de desarrollo de Machine Learning debido a su simplicidad y facilidad de aprendizaje. Es utilizado por muchos científicos de datos y desarrolladores para la construcción y análisis de modelos
Ya en el campo de las soluciones, la categoría clave para el análisis de datos sería el Business Intelligence (BI). Según distintos informes, el 30,5% de las empresas tenía implantada una solución de BI. Dentro del mundo del BI hay múltiples soluciones posibles. Las más habituales están las basadas en la creación de informes tanto predefinidos como a medida, junto a su distribución de forma automatizada.
Las soluciones de BI se han democratizado: Antes era un producto que IT entregaba y gestionaba para los usuarios finales (jefes de departamento, ejecutivos, etc.) ahora su uso ya no se limita a los dominios del departamento de IT. Cualquier persona podría utilizarlos en modo autoservicio para generar sus propios análisis.
También ha cambiado de enfoque hacia datos en tiempo real y externos. El BI siempre ha estado relacionado con procesos de tratamiento de los datos muy sofisticados, como el data mining, o ETL (extracción, transformación y carga), ahora las nuevas soluciones de Inteligencia de negocio se orientan hacia el cruce de datos internos con otros externos (relativos a la situación del mercado, la competencia, etc.), las funciones predictivas y otras funcionalidades que se suelen vincular con técnicas de Big Data, Data Science, etc. El líder de esta categoría de soluciones es Microsoft. Otros proveedores que figuran en el cuadrante mágico de Gartner en 2020 son Salesforce/Tableau Sotware, Qlik o Thoughtspot.
Aunque si tenemos que mencionar una tecnología que todos utilizamos para gestionar los datos sería Excell. Excel es una herramienta que sigue teniendo gran relevancia en la empresa. Ademas de utilizarla como una calculadora, excell es una herramienta de datos. Las tablas dinámicas son para el analista de datos la principal herramienta en Excel. En los últimos años han surgido alternativas a excell en la nube. Las soluciones como Row https://rows.com/ o spredsheet. com https://www.spreadsheet.com/ que integran el trabajo colaborativo, las automatizaciones con el uso tradicional del análisis de datos.
Uno de los cambios importantes en el ámbito del análisis de datos es empezar a tratar los datos como un producto y como tal, estos productos deben mantenerse o proveer un cierto nivel de servicio. En este campo surgen los Data Mesh que es una infraestructura de datos distribuida y descentralizada que exponen sus propios datos, llamados “productos de datos”, al resto de la organización, o los data lake que es un repositorio centralizado diseñado para almacenar, procesar y proteger grandes cantidades de datos estructurados, semiestructurados o no estructurados.
Otro apartado interesantísimo de las tecnologías de datos son las herramientas de visualización. “La visualización de datos es la representación gráfica de información y datos. Al utilizar elementos visuales como cuadros, gráficos y mapas, las herramientas de visualización de datos proporcionan una manera accesible de ver y comprender tendencias, valores atípicos y patrones en los datos”1. En el mundo del big data, las herramientas y tecnologías de visualización de datos son esenciales para analizar grandes cantidades de información y tomar decisiones basadas en los datos. Los expertos que escriben libros y dan clases sobre la teoría detrás de la visualización de datos también tienden a mantener blogs donde analizan las últimas tendencias en el campo y discuten nuevas tendencias (ver aquí). Con relación a herramientas, además de las capacidades de visualización de las herramientas de BI, Google Data Studio puede definirse como la herramienta más democrática de visualización de datos, entre todas las disponibles. Amazon QuickSight, lanzada en 2021 como propuesta para acercar el Machine Learning y el Business Intelligence a la mayoría de usuarios, ofrece un entorno autoescalable adaptado a grandes volúmenes de datos.
Aun nos quedaría mucho por descubrir y desarrollar. El campo de las soluciones ya sea para fines organizativos o personales, sigue evolucionando y creciendo cada día, porque responde a la necesidad de entender mejor la realidad y perfeccionar el proceso de toma de decisiones.