Cómo estimar los costes de su plataforma de cloud analytics
Abordar los casos de uso del mundo real moderno requiere la aplicación de múltiples funciones que trabajen conjuntamente sobre los datos. Aquí hay algunas cosas que hay que saber para calcular el coste de la plataforma de Cloud Analytics de forma eficaz.
William McKnight, Presidente, McKnight Consulting Group analiza los costes del Cloud Analytics.
Las organizaciones de hoy en día necesitan un amplio conjunto de servicios de nube de datos empresariales con funciones de datos clave para modernizar los proyectos y utilizar el aprendizaje automático. Necesitan una plataforma diseñada para abordar necesidades multifacéticas ofreciendo gestión de datos y analítica multifuncional para resolver los retos de datos y analítica más apremiantes de la empresa de forma racionalizada. Necesitan una selección que permita una experiencia sin preocupaciones con la arquitectura y sus componentes.
Abordar los casos de uso del mundo real requiere la aplicación de múltiples funciones que trabajen juntas en los mismos datos. Construir el ecosistema de datos para dar soporte a este caso de uso de datos convergentes puede ser una tarea desalentadora. Hay muchas soluciones y alternativas, y demasiados reclamos de los proveedores. La creación de una plataforma tecnológica completa en la nube para abordar los retos y necesidades de datos de toda la empresa puede lograrse de tres maneras: crear el stack dentro del mismo paraguas de productos del proveedor de la nube; unir las ofertas de productos de varios proveedores; o utilizar un stack polivalente de un solo proveedor.
Algunas arquitecturas parecen integradas, pero pueden ser más complejas y más caras. Cuando casi todas las demandas adicionales de rendimiento, escala o análisis sólo pueden satisfacerse añadiendo nuevos recursos, resulta caro. Los stacks son innumerables, aquí recogemos algunos de los más populares.
Stacks populares
Los aspectos más destacados del stack de Azure incluyen Synapse, Synapse SQL Pool, Azure Data Factory, Azure Stream Analytics, Azure Databricks Premium Tier. Adicionalmente encontramos HDInsight, Power BI Professional, Azure Machine Learning, Azure Active Directory P1 y Azure Purview.
El stack de AWS incluye Amazon Redshift, Glue, Kinesis, EMD, Spectrum, Quicksight, SageMaker, IAM y AWS Glue Data Catalog.
El stack de Google es BigQuery, Dataflow, Dataproc, Cloud IAM y Google Data Catalog.
Otro stack podría llamarse Snowflake Stack, ya que Snowflake es el proveedor destacado para la computación, el almacenamiento y la exploración de datos dedicados, pero en realidad es un stack heterogéneo de varios proveedores. Esto incluye una herramienta de integración de datos como Informatica o Talend, Kafka Confluent Cloud, Azure Databricks Premium Tier, Cloudera Data Hub + S3, Tableau, SageMaker, Amazon IAM, y un Catálogo de Datos como Alation o Collibra.
Los costes del Cloud Analytics
Las cifras de costes que se indican a continuación se centran en los costes del stack de proyectos, incluidos los costes de desarrollo. Si usted está haciendo un ROI completo para estos proyectos, tendría que considerar el costo del dinero, una distribución de probabilidad, los beneficios n-ordenados y determinar y utilizar sólo lo que es tangible.
Además, cuando los proyectos se hacen de forma ágil con la funcionalidad dosificada, puede ser difícil decir cuándo terminan los costes iniciales del proyecto y los costes pasan al mantenimiento. Yo utilizo la norma habitual de las empresas. Trazo la línea entre los costes iniciales y el mantenimiento en torno al punto en el que se entrega la mayor parte de la funcionalidad. En este contexto, es muy importante tener en cuenta tanto los costes acumulados hasta ese momento como los costes de «mantenimiento» para la corrección de errores, las mejoras y las actualizaciones posteriores.
Desglose de los costes
Un proyecto único (de varios trimestres) sobre estos stacks, incluidos los costes de personal, costará entre 2,7 y 8 millones de dólares en una empresa mediana y entre 7 y 23 millones de dólares en una empresa grande. El uso del stack moderno, la primera vez, allanará el camino para futuros usos.
Para todos los usos de la plataforma moderna por parte de las empresas, incluidos los costes de producción, el coste total de propiedad en dos años para las empresas medianas oscila entre 6 y 15 millones de dólares. Para las grandes empresas, es decir, con ingresos superiores a 1.000 millones de dólares, el coste oscila entre 17 y 42 millones de dólares.
Dejando a un lado los peligros de la medición del coste total de propiedad, los proyectos empresariales deberían obtener un alto rendimiento. Sin embargo, si la aplicación no se está implementando con un estándar moderno, utilizando un stack de aprendizaje automático, hay enormes ineficiencias y brechas competitivas en la funcionalidad. Por lo tanto, muchas empresas están considerando subir de nivel o migrar estos casos de uso ahora y cosechar los beneficios.
Categorías de un stack de análisis
Una plataforma analítica completa en la nube es algo más que un almacén de datos, un almacenamiento en la nube y una solución de inteligencia empresarial. Hay al menos 11 categorías necesarias para establecer tanto la equivalencia entre las ofertas de los stacks de análisis como una estimación justa del coste. Todos estos componentes son esenciales para disponer de un stack analítico completo preparado para la empresa.
Las categorías, o componentes de una stack de análisis empresarial moderna, que he incluido en los cálculos del TCO son las siguientes:
Computación dedicada
Almacenamiento
Integración de datos
Streaming
Análisis de Spark
Exploración de datos
Lago de datos
Inteligencia de negocio
Aprendizaje automático
Gestión de identidades
Catálogo de datos
Estos stacks pueden utilizarse para una gran variedad de proyectos de aprendizaje automático, como el análisis de clientes, la detección de fraudes, la optimización de la cadena de suministro y el análisis del IoT. Por supuesto, cada proyecto podría utilizar un conjunto de componentes ligeramente diferente, o cantidades diferentes de cada componente.
Fuente: www.informationweek.com