Optimización de plataformas de datos

Optimización de Plataformas de datos (I): Roadmap y otras claves de éxito

A diario vemos la importancia de explotar los datos con el fin de obtener información de valor que, a su vez, pueda mejorar los procesos y el negocio de las compañías, así como facilitar la toma de decisiones. Para arrojar algo de luz sobre cómo adaptarnos a esta nueva era del dato, comenzamos una serie de artículos orientados a la optimización de plataformas de datos. En este artículo queremos hacer una pequeña introducción a las plataformas de datos y cuáles son, en base a nuestra experiencia, las claves de éxito de estas.

Para conseguir extraer valor de los datos hacen falta plataformas flexibles, escalables y estables que lo consigan. Cada vez hay más en el mercado, y una vez que los clientes ven el potencial de estas, crecen los casos de uso a implementar, a menudo sin control.

Nos encontramos en muchas ocasiones organizaciones con plataformas de datos que comenzaron sin un objetivo claro o con cierta indefinición, y que han ido creciendo de manera descontrolada sin un plan óptimo. La flexibilidad en este punto es un arma de doble filo: te permite implementar casi cualquier caso de uso, pero precisamente por el amplio abanico de posibilidades que ofrece hay que gobernar de manera idónea y tener claros los objetivos. Muchos clientes se encuentran con que adquirieron un gatito y con el paso del tiempo y el crecimiento sin gobierno, no saben qué hacer con el tigre en que se ha convertido.

Optimización de plataformas de datos

Roadmap para evitar futuros problemas de optimización

Para nosotros el roadmap inicial en las plataformas de datos debería cumplir, como mínimo, los siguientes puntos para garantizar la optimización de estas:

  1. Definición del objetivo y la necesidad

Sin tener claro este punto, arrastraremos equivocaciones e ineficiencias a lo largo del resto de fases. A menudo las plataformas que no cubren la necesidad de los clientes o que se han descontrolado, en su punto inicial no tuvieron una definición clara del objetivo que permitiese definir y diseñar correctamente el plan de datos a llevar a cabo.

Dentro de la definición de la necesidad, es muy importante adelantarse al momento actual y tener en cuenta cuál es la posible necesidad en un escenario futuro. De esta forma, garantizamos el crecimiento de la plataforma de datos sin limitantes y evitaremos sorpresas.

  1. Análisis del entorno actual de cliente

Hay que tener en cuenta el ecosistema de soluciones actual de cliente de cara a diseñar la mejor estrategia de datos.

  1. Análisis de soluciones

Es el punto más importante. Lo que se derive de este análisis definirá la arquitectura que tendrá tu plataforma o ecosistema de datos. Lo más importante en esta fase es tener en cuenta la cobertura de las necesidades establecidas en la fase 1.

Aquí hay que considerar la capacidad de cada solución para cubrir las necesidades que se hayan establecido, como, por ejemplo:

  • Retención
  • Almacenamiento
  • Capacidades de análisis y procesamiento avanzado
  • Visualización de la información de valor
  • Integración con otros sistemas
  • Tipología de datos
  • Perfilado de roles

De cada solución planteada es muy importante tener en cuenta:

  • Costes asociados (TCO)
  • Infraestructura necesaria
  • Facilidad de implementación
  • Flexibilidad
  • Escalabilidad
  • Estabilidad
  • Madurez

  1. Diseño de arquitectura

Se diseñará de acuerdo con las necesidades del cliente y la/s solución/es en fase 3.

  1. Implementación de la solución de datos y casos de uso

Esta fase estará condicionada por la solución elegida. Cuanto más flexible y fácil sea, menor será el coste de servicios asociado (y por tanto menor TCO). Por eso es importante tenerlo en cuenta en el análisis de las soluciones.

Optimización de plataformas de datos

Gobierno y mejora continua

Después de implementar nuestro roadmap, ahora tenemos nuestra plataforma de datos operativa y con los casos de uso implementados. Es el momento crítico y decisivo para que la misma tenga éxito y crezca de manera controlada, o nos encontremos con un tigre al que domar. A partir de aquí comienza, para nosotros, una fase continuada en el tiempo que es la de gobierno y mejora continua, indispensable para la optimización de plataformas de datos. Para ello se necesita ayuda experta que acompañe en el gobierno.

En esta fase de gobierno, se han de controlar diferentes aspectos de la plataforma:

Rendimiento

Es un factor clave de éxito. Las plataformas de datos tienen que cumplir las necesidades existentes, y lo tienen que hacer de manera rápida y óptima. Si la plataforma no es capaz de recoger datos con el rendimiento adecuado nos podemos encontrar con una pérdida de datos, que derive en inconsistencias en la información de valor resultante. Además, si el rendimiento no es el adecuado nos podemos encontrar con tiempos altos de procesamiento o demoras de los procesos para obtener la información de valor.

Por eso, en nuestro plan de gobierno apostamos por revisiones del rendimiento periódicas de la plataforma, para garantizar su óptimo funcionamiento y encontrar posibles problemas de manera anticipada antes de que supongan disrupciones o degradaciones del servicio que presta la plataforma.

Capacidad y crecimiento

Las plataformas de datos han de ser capaces de albergar los casos de uso para los cuales han sido diseñadas. Un punto crítico para tener en cuenta de manera continua es la capacidad de la plataforma. Es posible que inicialmente la plataforma tuviera capacidad para los casos de uso para los cuales se diseñó, pero debido al crecimiento incontrolado nos podemos encontrar con escenarios en los cuales la plataforma ha llegado a su capacidad máxima. Esto no es sólo crítico de cara a implementar nuevos casos de uso, sino también a mantener los existentes si los mismos crecen.

Optimización de plataformas de datos

Los casos de uso de datos están “vivos” y es habitual enfrentarnos a problemas de capacidad. Imaginemos una plataforma que se diseñó inicialmente para obtener datos de valor de los clientes de una organización. Cuando se definió, el número de clientes era de 500.000. Ahora el negocio ha crecido y, un año después, nos encontramos con que ese número ha aumentado en 150.000 (crecimiento de un 30%). Si no se tiene en cuenta dicho crecimiento para la plataforma de datos, nos encontraremos con que la misma se queda pequeña, teniendo problemas en diferentes aspectos como rendimiento, procesamiento, retención, etc.

Es importante analizar y controlar el crecimiento de los casos de uso para que la capacidad de la plataforma crezca proporcionalmente al mismo. Tener un buen plan de capacidad es clave para garantizar el éxito de las plataformas de datos.

Además, para asegurar el crecimiento de estas de manera ágil son necesarias plataformas de datos flexibles y escalables, para poder asumir el crecimiento sin que ello suponga morir en el intento.

Disponibilidad

La disponibilidad es un punto crítico en las plataformas de datos. Una indisponibilidad puede conllevar múltiples consecuencias de alto impacto, desde pérdida de datos, inconsistencia de indicadores clave, falta de información crítica necesaria, impacto en procesos de otros sistemas, etc. Al diseñar la plataforma es importante tener este punto en cuenta, optando por alta disponibilidad cuando el caso de uso lo requiera. Además, es necesario diseñar las recepciones de datos de manera que sean tolerantes a las indisponibilidades de la plataforma siempre que sea posible.

En este punto, aplicar la monitorización adecuada es clave para garantizar la disponibilidad y actuar de manera rápida ante problemas. Sin la monitorización, lo habitual es que los problemas de disponibilidad los detecte el usuario que necesita consumir los datos o el administrador de la plataforma y, cuando eso pasa, puede que el impacto por la indisponibilidad sea ya irreversible. La monitorización que se aplique ha de ser tanto técnica como funcional, con el fin de controlar todos los posibles problemas que pueden impactar en la plataforma.

Datos y casos de uso

Como comentábamos previamente, es posible que sin darte cuenta te encuentres con que el gatito se ha convertido en un tigre. A menudo, cuando los clientes ven el potencial de las plataformas de datos, comienzan a incluir más y más datos y casos de uso en las mismas, derivando en un crecimiento descontrolado. Por eso, consideramos que uno de los puntos más importantes es el control de los datos y los casos de uso. Es crítico saber qué hay en la plataforma de datos y por qué.

Llegados al punto en que ya se ha perdido el control es imprescindible hacer una labor de auditoría sobre la plataforma con el fin de tener controlado lo que hay y que la auditoría derive en acciones de mejora e higienización de la plataforma. Es más que posible, si no se ha llevado el control oportuno, que nos encontremos con elementos que no sabíamos que estaban en la plataforma (datos, cálculos, lógicas, procesamientos, dashboards, alertados, etc.) y que están afectando tanto al rendimiento como a la capacidad.

Acompañamiento

Para garantizar todo lo anterior, en Open3s apostamos por servicios de acompañamiento que permitan controlar todos los puntos críticos de las plataformas de datos.

Para nosotros, este servicio ha de dar seguimiento a la plataforma y ayudar a los clientes a domar al tigre. Como parte del acompañamiento, se debe dar seguimiento a la plataforma, ofrecer al cliente la visión del estado en cuanto a rendimiento, gestionar la capacidad y el crecimiento de manera controlada, garantizar la disponibilidad y ayudar al cliente a manejar los datos y casos de uso existentes y futuros.

extremeCloud IQ

Conclusiones

Como hemos comentado, una plataforma de datos está viva, y debemos garantizar que crece de manera óptima, con flexibilidad y agilidad para cubrir las necesidades actuales y futuras de los clientes.

La optimización de plataformas de datos debería ser un aspecto clave para los clientes. En próximos artículos de la serie profundizaremos en la optimización de plataformas de datos: desde qué ámbitos se puede hacer y cómo.

Si tienes una plataforma de datos y te has sentido identificado con alguno de los puntos comentados en este artículo, o si te estás planteando la implementación de una plataforma de datos en tu organización y quieres hacerlo de manera controlada siguiendo un plan que ayude a su éxito futuro, no dudes en contactarnos.

Nerea Sánchez Fernández, manager del área Data into value