5 formas de acelerar la migración a la nube
En este artículo especial, Christian Romming, CEO de Etleap, cree que hay demasiado en juego como para permitir que un descuido provoque un fallo de seguridad o un tiempo de inactividad. Etleap es una empresa de canalización de datos gestionados que presta servicios a empresas como Moderna, PagerDuty y Morningstar. Christian fundó Etleap en 2013 tras una carrera en ingeniería de datos. Es originario de Noruega y licenciado en informática por la Universidad de Warwick y la Universidad de Stanford. Relata en este artículo los factores a tener en cuenta en la migración de datos a la nube.
¡Enhorabuena! Ha investigado, evaluado varias opciones de almacenes de datos en la nube (CDW), obtenido la aceptación y las aprobaciones adecuadas en toda su organización y está listo para seguir adelante con Snowflake, Redshift, Delta Lake u otro CDW. Las nuevas oportunidades de inteligencia empresarial (BI), análisis y aprendizaje automático están ahora claramente a la vista. Los CDW presentan ventajas en cuanto a velocidad, eficiencia y coste frente a sus predecesores locales. Pero aún queda un duro trabajo por delante, y las decisiones que tome ahora pueden significar la diferencia entre días, meses o años para cuando alcance ese éxito.
Aunque el mundo de la extracción, transformación y carga (ETL) ha evolucionado desde sus orígenes en las instalaciones, la creación y gestión de las canalizaciones de datos que proporcionarán datos listos para el análisis a los consumidores de datos todavía puede requerir muchos recursos. A continuación se presentan cinco formas de reducir esos requisitos de recursos y acortar los plazos para un lanzamiento con éxito de CDW (migración de datos a la nube).
1. 1. Encuentre un conector para cualquier fuente de datos
Es posible que cuente con un equipo sólido y sólido de ingenieros de datos que hayan escrito código para integraciones de fuentes en el pasado. Puede que incluso les guste este trabajo, aunque la mayoría están contentos de dejar atrás este trabajo a menudo tedioso. En cualquier caso, ésta es una de las mayores oportunidades para acelerar la migración de su almacén de datos. Muchos equipos antes que usted han necesitado conectores para bases de datos, archivos, aplicaciones o flujos de eventos.
Existen varias herramientas de conectores prediseñadas que cubren la mayoría de las fuentes de datos de la mayoría de las organizaciones. Y, por supuesto, es probable que también tenga algunas fuentes de datos exclusivas de su sector o incluso de su empresa. Pero al igual que con los conectores preconfigurados, se beneficiará de la experiencia de un proveedor con marcos de trabajo y experiencia específicos para gestionar fuentes personalizadas.
2. Automatizar la infraestructura
Al trasladarse a la nube, ha abandonado el mundo de la gestión de servidores físicos en un centro de datos, pero aún puede abrumar a su equipo con el trabajo de infraestructura si no tiene cuidado. Gestionar el movimiento y la preparación recurrentes de los datos requiere programar tareas y sus dependencias, aprovisionar clústeres informáticos, optimizar el coste y el rendimiento, y mucho más. Existen diferentes opciones para aliviar a tu equipo de este tiempo de ingeniería, desde orquestadores de código abierto y opciones sin servidor hasta herramientas de canalización totalmente gestionadas.
3. Democratizar la producción de datos
Es común pensar en la democratización de los datos sobre todo como el resultado de un proyecto CDW exitoso. Proporcionar cuadros de mando y conjuntos de datos a un mayor número de consumidores de datos es, sin duda, la clave para una organización con conocimientos de datos. También es importante habilitar a los productores de los datos, los más familiarizados con su significado e historia. En ausencia de esto, un equipo central es responsable de seleccionar los datos y ofrecerlos con significado y valor a los consumidores de datos. O bien pasan incontables horas investigando cada dominio y fuente de datos, o bien acaban generando un CDW que los usuarios no pueden entender y en el que no confían. Un enfoque mejor es dar a los expertos en el dominio herramientas sin código para construir directamente pipelines y preparar los datos para el análisis.
4. No ignore el tiempo de resolución de problemas
Al planificar una migración de datos a la nube, es fácil centrar toda la atención en el esfuerzo de ingeniería de datos necesario para poner en marcha el CDW. Sin embargo, sus ingenieros de datos pueden dedicar con frecuencia tanto tiempo a la resolución de problemas como a cualquier otra cosa. Existen herramientas de supervisión y se puede escribir código para alertar de errores. Aún más eficaces son las ofertas de canalización totalmente gestionadas que proporcionan estas funciones listas para usar y pueden resolver problemas antes de que lleguen a su equipo. Estos cinco consejos aumentarán el tiempo de actividad de su CDW, lo que supone un gran alivio para sus ingenieros de datos. Y también es clave para alcanzar el valor, que depende de la confianza y la adopción de sus consumidores de datos.
5. Esperar lo inesperado en la migración de datos a la nube
Llegados a este punto, puede que estés pensando que la automatización lo tiene todo resuelto y que el ecosistema de herramientas ha cubierto todos los casos imaginables. La realidad es que no hay un solo botón fácil, y debe desconfiar de las soluciones de caja negra que sugieren que las canalizaciones pueden automatizarse al 100% en la migración de datos a la nube. Las fuentes de datos y los destinos cambiarán. Es posible que decida integrar funciones como un catálogo empresarial o un flujo de trabajo de calidad de datos. Asegúrese de haber invertido en herramientas o servicios con la flexibilidad necesaria para gestionar su entorno único y cambiante. Puede que ahorre cientos de horas con una automatización rígida, pero recuperará ese ahorro de tiempo cuando necesite soluciones para sus casos extremos.
Algunas organizaciones tardarán años en obtener valor de su migración de on-prem a CDW. El objetivo de este artículo no es desesperar, sino asegurarse de que avanza con los ojos abiertos. Puede ser útil evaluar si su organización debe crear, comprar o asociarse. Muchos creen que deben crear sus propios sistemas para mantener la flexibilidad y el control, y están dispuestos a invertir mucho más tiempo en ello. Pero hay opciones disponibles que hacen que este sea un falso compromiso. He aquí un ejemplo en el que un análisis adecuado y las herramientas apropiadas redujeron en dos años la implantación de una gran empresa de servicios financieros.
Leer artículo completo en Inside Big Data
Artículo relacionado en Noticias CIO: Priorizando la seguridad de los datos en la nube