TCO

Optimización de Plataformas de datos (II): Reducir el TCO

Siguiendo con nuestra serie de artículos orientados a la optimización de plataformas de datos, en el primer artículo de la serie comentábamos que la optimización de una plataforma de datos se puede efectuar desde diferentes ámbitos o con diferentes enfoques. En el artículo de hoy vamos a profundizar en uno de esos ámbitos, reducir el TCO.

¿Qué es el TCO?

Aunque seguramente muchos de vosotros lo sepáis, en primer lugar, vamos a establecer el significado del TCO, concepto en torno al cual se desarrolla este artículo.

El TCO, siglas del término anglosajón Total Cost Ownership, es el cálculo que permite concretar el coste total de una solución tecnológica. Para poder conocer ese coste total, se han de tener en cuenta los gastos tanto directos como indirectos. En resumen, se trata del coste total de adquirir, utilizar, gestionar y retirar una solución a lo largo de todo su ciclo de vida.

Hacer el cálculo de TCO debería ser siempre un paso preliminar de análisis previo a la implementación de una solución tecnológica, dado que es un factor muy importante; pero también se ha de ir haciendo de manera periódica, dado que el ámbito tecnológico es dinámico y de cambios constantes, y el TCO irá cambiando a medida que evolucione la solución tecnológica y los casos de uso.

Optimización de plataformas de datos

A la vez que se evalúa el TCO, es importante tener en cuenta también el ROI. Parece evidente la necesidad de saber qué porcentaje del TCO recuperas con las mejoras y beneficios de la solución implementada, pero lo cierto es que en muchas ocasiones no se hace (porque es difícil, lo sabemos). Es difícil establecer si una solución resulta “cara” sin analizar el valor aportado. Con un ROI del 1,5… ¿Seguiríamos pensando que es cara?

¿Qué tener en cuenta en el TCO de una plataforma de datos?

Licencias

Un punto muy importante para tener en cuenta a la hora del cálculo de TCO de plataformas de datos es el coste de licencia.

En el mercado hay muchas soluciones de datos, y muchos tipos de licenciamientos. Hay que tener en cuenta si tiene coste de licencia, y en tal caso cómo aplica: Por número de usuarios, por volumen de datos diario, por uso de recursos, por capacidades/funcionalidades disponibles, por tamaño de la arquitectura, etc.

Además, en caso de ser soluciones licenciadas, hay que analizar en qué escenario futuro nos podemos encontrar si la plataforma crece y qué escalado tiene la licencia.

Infraestructura

La infraestructura es un elemento clave y que en ocasiones supone gran parte de los gastos en el cálculo del TCO, es por lo que cada vez más compañías se decantan por soluciones como servicio.

En caso de soluciones on premise, respecto a la infraestructura hay que contar, por supuesto, con los costes de los servidores que albergarán la solución. No todas las plataformas de datos tienen los mismos requerimientos: hay plataformas distribuidas, clusterizadas, que necesitan un número mínimo de nodos, y, además, en función de la plataforma serán necesarios unos recursos u otros (CPU, RAM, discos, velocidad de red…).

TCO

Otro aspecto clave para tener en cuenta en costes es el almacenamiento. ¿Qué volumen de datos albergará la solución? ¿Durante cuánto tiempo? ¿Qué tipo de almacenamiento necesito? Además, es importante tener en cuenta la gestión del dato que hará la solución: metadatos, ratio de compresión, rotado, etc.

Se deberá tener en cuenta también la política de backups que requiera la necesidad como la periodicidad, el tamaño previsto o el tiempo que necesitamos mantenerlos.

Coste inicial de la puesta en marcha

Poner a trabajar la solución de datos conllevará un tiempo u otro en función de la solución y las herramientas que la compongan.

Se deberán tener en cuenta dichos tiempos de instalación y configuración inicial para que la solución comience a estar productiva. No es lo mismo un ecosistema de datos que se implementa en días que uno que pueda conllevar semanas.

Mantenimiento y soporte

En este ámbito se han de tener en cuenta los servicios relacionados al mantenimiento, gestión y soporte mínimo de la solución. En este caso, las soluciones maduras y robustas conllevan un menor impacto en el TCO.

Aquí hay que tener en cuenta costes de actualizaciones, aplicaciones de parches o resolución de bugs, renovación de licencias, o gestiones propias de la plataforma. Una plataforma en la que constantemente hay que estar aplicando parches de bugs tendrá un mayor impacto en TCO que plataformas estables en las que apenas hay que hacer mucho más que actualizaciones periódicas; así como plataformas con actualizaciones mensuales y costosas tendrán mayor impacto que plataformas con actualizaciones anuales y sencillas.

En el caso de las plataformas de datos, dentro de mantenimiento y soporte, un aspecto que a nuestro parecer es fundamental es el gobierno de la plataforma, como comentábamos en el post anterior. Hay que tener en cuenta en este punto el coste de tener la plataforma “bajo control”, es decir, la gestión óptima del dato, de los casos de uso, la revisión del rendimiento y la capacidad de la plataforma, etc. Cuantas más herramientas dé una plataforma para lograr lo anterior, menores serán los costes asociados.

Tiempos de operación y desarrollo

Dado que las plataformas de datos se crean para implementar casos de uso que permitan procesar y extraer valor de los datos, es clave tener en cuenta el coste del desarrollo e implementación de casos de uso.

Hay algunos puntos principales en este ámbito:

  • Datos: Por ejemplo, si tenemos un caso de uso con datos de un log, de una base de datos y de una API, será infinitamente más sencillo de implementar teniendo los conectores adecuados para la integración del dato en la plataforma de manera sencilla.
  • Procesamiento: Si la solución aporta las funcionalidades necesarias para procesar los datos de manera sencilla, contando con un lenguaje potente de consulta, conseguiremos mejores resultados y más rápido.
  • Visualización: Igual que con la parte de integración de datos, muchas plataformas de datos cuentan con plugins con diversas visualizaciones (mapas, gráficos de líneas, de barras, de tarta, de burbujas, mapas de calor, diagramas de flujos, etc.) que permiten representar la información procesada de manera intuitiva para el consumo por parte del usuario. Si en este punto se necesita desarrollar una visualización a medida, o incorporar complejas librerías que permitan la visualización, el tiempo de implementación de los casos de uso se verá ampliado.

En resumen, hay que tener en cuenta los tiempos necesarios para implementar nuevas necesidades. Cuanto más intuitiva sea una solución, y cuente con más funcionalidades out of the box, menor será la dedicación para obtener valor de esta.

Training – Curva de aprendizaje

Para llegar a operar y mantener la solución hará falta conocimiento técnico respecto a la misma. En muchas ocasiones se delega el servicio de operación y mantenimiento a terceros por el valor que aporta un equipo especializado y con años de experiencia en la solución, pero en caso de que no sea una opción se debe tener muy en cuenta la formación y la curva de aprendizaje de la solución adoptada como plataforma de datos.

Las soluciones muy complejas de aprender, con costes muy elevados de formación o sin documentación o comunidad a la que recurrir para adquirir conocimiento resultan en una ampliación del TCO.

TCO

¿Cómo reducir el TCO en una plataforma de datos?

  • Gestionando, gobernando y manteniendo de manera proactiva las plataformas de datos. No hay que esperar a que el gato se convierta en un tigre, como comentábamos en el artículo anterior, para plantearse una optimización de plataforma en todos los ámbitos, TCO incluido.
  • Aplicando revisiones de la infraestructura para detectar si se puede definir alguna estrategia para mejorar su rendimiento u optimizar el almacenamiento de datos.
  • Diseñando una rearquitectura de la plataforma. Como hemos comentado en múltiples ocasiones, las plataformas de datos están en constante evolución y crecimiento, y a menudo nos encontramos con plataformas que se diseñaron para un caso de uso X y, ahora con la evolución, necesita una redefinición para seguir operativa de manera óptima en funcionalidad y costes.
  • Siendo selectivo con los datos y los casos de uso. No siempre el incluir todos los datos en una plataforma “por si algún día hacen falta” es la mejor opción, ni la que mejor se lleva con el TCO. En muchas soluciones de datos, dado que no todas tienen por qué ser data lakes, se hace necesario seleccionar de manera clave los datos a integrar y los casos de uso a implementar, teniendo foco en aquellos que aportan valor o van a dar un retorno (teniendo impacto en el ROI).
  • Definiendo nuevas estrategias en cuanto a datos, como filtrado de datos previo a su integración en la plataforma, reducción de información no útil, eliminado de información duplicada, enriquecimiento de información previo a su integración para aportar más valor, o routing de ciertos datos a otros sistemas/almacenamientos más baratos. En definitiva, extrayendo más valor de los datos.
  • Teniendo un plan y siguiendo un roadmap. Es clave definir las necesidades, establecer su valor y diseñar un plan para llegar al objetivo. De esta manera lograremos una plataforma de datos estable y controlada, y con casos de uso de valor.
  • No sólo es el coste, sino el beneficio. Hay que pasar de ver el árbol a ver el bosque. Quizás la implementación de un caso de uso concreto tenga un coste alto, pero haciendo un análisis nos demos cuenta de que el beneficio aportado es mayor que el gasto, por ejemplo: la automatización de reporting económico en la plataforma de datos permite que la persona que lo hacía a mano extrayendo información de distintas fuentes pueda dedicar su tiempo a tareas de más valor (reducción de dedicación de las personas), la implementación de analytics sobre datos de marketing permite generar campañas dirigidas aumentando los clientes (mejora de negocio), o el control del estado de un servicio de negocio permite detectar de manera rápida problemas disminuyendo tiempos de indisponibilidad (mejora operacional y de negocio). Como comentábamos al principio, no sólo importa el TCO sino también el ROI.

Desde Open3s te podemos ayudar en la optimización de tu plataforma de datos. Si necesitas la implementación de una nueva plataforma de datos podemos definir, diseñar e implementar la mejor solución en base a tus necesidades. Si quieres saber más, contáctanos.

Nerea Sánchez Fernández, manager del área Data into value