Optimización Edge: Como afrontarla
Como ocurre con todos los problemas de optimización, para llegar a la respuesta «correcta» hay que tener en cuenta varias compensaciones específicas de la situación.
El Dr. Nikunj Mehta, fundador y director general de Falkonry, explica que el límite no es un lugar sino un problema de optimización. Conozca algunos factores clave para decidir qué nivel de edge computing es el adecuado para usted y cómo llegar a él.
El borde no es un lugar – Es un problema de optimización. El edge computing consiste en hacer las cosas correctas en los lugares adecuados. Como ocurre con todos los problemas de optimización, para llegar a la respuesta «correcta» hay que tener en cuenta varias compensaciones específicas de su situación y, a continuación, aplicar la tecnología adecuada para maximizar los beneficios por el coste que está dispuesto a pagar.
The Edge: términos y tecnología
Parte de lo que hace que Edge sea confuso es que las definiciones de «the edge» tienden a centrarse en las tecnologías y no en los casos de uso. Dado que los casos de uso abarcan una amplia gama de requisitos y que los límites entre esos casos de uso no se corresponden directamente con las tecnologías, los fundamentos pueden perderse en la traducción. Dicho esto, he aquí un marco que puede ser útil.
La idea básica de la computación de borde es que cuanto más cerca esté el hardware de computación del equipo que genera los datos, más cerca estará del borde. Los dominios de computación pueden dividirse en borde y nube: local a su red o fuera de ella. Dentro de cada dominio, las opciones pueden subdividirse aún más:
1. Nube – Fuera de su red local
- Centros de datos en la nube – Las grandes instalaciones alojan recursos de computación, almacenamiento y redes en una ubicación central. En general, esto pone una distancia considerable entre los generadores de datos y los recursos informáticos.
- Nube de borde – Versiones más pequeñas de centros de datos ubicados en torres de transmisión inalámbrica. Esto pone una distancia mínima entre los receptores de WAN (red de área amplia) celular o LPWAN (WAN de baja potencia) y los recursos de computación. También se incluyen los centros de datos en la nube distribuidos que están ubicados estratégicamente para minimizar la distancia de los puntos de acceso de los clientes.
2. Edge – Dentro de su red de área local
- Servidores Edge – Servidores de menor tamaño pero de alto rendimiento general que se encuentran en las instalaciones y pueden o no estar cerca de los equipos reales. Existe una gama de opciones de colocación (desde el centro de datos local hasta la planta), lo que requiere una lista de opciones de robustez.
- Pasarelas inteligentes – Ordenadores de propósito general, de menor rendimiento y mínimo espacio, que suelen colocarse cerca de los equipos conectados. Suelen estar en la planta o en el campo y necesitan ser resistentes.
- Sensores inteligentes – Ordenadores de propósito especial, de bajo consumo, a menudo basados en microcontroladores, dedicados a la recogida o procesamiento de datos para un sensor o dispositivo específico.
Las plantas suelen tener una mezcla de capacidades informáticas que sirven para diferentes propósitos, así que espere ver algunas o todas estas opciones de despliegue en cualquier instalación con la que trabaje. Lo importante es que existe una gama de capacidades y que éstas pueden agruparse, a grandes rasgos, en categorías. No hay nada inherentemente superior en ninguna de las opciones. En cambio, la elección de una u otra depende de lo que se quiera conseguir.
Edge vs. Cloud: Optimización de las restricciones
La computación de borde permite realizar tareas que la computación en nube no puede. Del mismo modo, la computación en la nube es buena en cosas que la computación de borde no es. Por lo tanto, es esencial tener en cuenta el problema que está tratando de resolver para seleccionar el enfoque correcto. En la tabla siguiente se describen algunas áreas clave que hay que tener en cuenta.
Factor | Descripción | Edge | Cloud |
Latencia | El tiempo que tardan los datos en llegar al recurso informático y en devolver un resultado. | Menor latencia (pocos ms) debido a la proximidad de los equipos | Mayor latencia (100s de ms) debido a la distancia del equipo |
Intermittencia | La fracción de tiempo que el equipo generador de datos no puede transmitir datos a los recursos informáticos remotos. | Admite casos muy esporádicos. El ordenador puede ser colocado con el equipo | Admite problemas de baja intermitencia. Requiere una configuración de red siempre conectada. |
Costes en la transferencia de datos | El precio por bit del envío de los datos desde el equipo que los genera hasta la computación. | Menor coste, ya que los datos viajan menos distancia y normalmente a través de una LAN (red de área local). | Precio más elevado, ya que los datos viajan a través de redes celulares (caras) u otras WAN. |
Poder Computacional | El número, la velocidad y la profundidad de bits de los núcleos de la CPU, las GPU y la memoria que pueden aplicarse al cálculo. | Por lo general, el hardware es menos potente cuanto más cerca está del equipo debido a los factores de forma más pequeños y a las limitaciones de potencia eléctrica. | Generalmente se dispone de un hardware más potente debido a factores de forma más grandes y a los límites de consumo de energía eléctrica |
Coste de almacenamiento | El precio por MB de datos almacenados | Mayor precio por MB debido a los factores de forma más pequeños y a la robustez | Menor precio por MB gracias a los factores de forma más grandes, los entornos controlados y el almacenamiento por niveles |
Escalabilidad | Facilidad para aumentar los recursos informáticos. | Escala menos flexible debido al capex requerido para el hardware de borde y el posible rediseño y recalificación del equipo. | Escalado más flexible gracias a las vías basadas en el opex para aumentar los recursos en la nube |
Sharing / Colaboración | Facilidad para compartir los datos y los resultados de las aplicaciones entre grupos muy dispersos (por ejemplo, a nivel mundial). | Menor nivel de reparto debido a la infraestructura localizada | Alto nivel de compartición gracias a la infraestructura centralizada y basada en la nube |
Retención de datos/reporting | Capacidad de servir como sistema de registro desde el que se pueden realizar informes y auditorías de cumplimiento. | Mayor dificultad para encontrar datos y crear informes debido a la infraestructura distribuida | Mayor facilidad para encontrar datos y crear informes gracias a una infraestructura centralizada con gran capacidad de almacenamiento. |
En resumen, Edge es una buena opción para las aplicaciones que necesitan resultados MUY rápidamente (en décimas de milisegundo), que generan cantidades significativas de datos en lugares que tienen conexiones intermitentes, de bajo ancho de banda o de alto coste y que no requieren cálculos muy complejos. La infraestructura basada en la nube es mejor para casi todo lo demás, si no por el rendimiento, sí por el coste de adquisición y la complejidad operativa.
¿Dónde está su Edge?
Un ejemplo puede ayudar a resaltar cómo diferentes operaciones de equipos pueden ser mejor atendidas por diferentes combinaciones de tecnologías Edge y Cloud.
Un operador minero tiene una flota de equipos de perforación móviles desplegados en varios lugares de una mina. Les preocupan tres cosas:
El cumplimiento de las emisiones de los gases de escape de la plataforma
Señales de fallo de los equipos a muy corto plazo durante el funcionamiento
Planificación del mantenimiento basado en la condición (CBM). La naturaleza del despliegue significa que los equipos de perforación se encuentran con frecuencia fuera del alcance del WiFi de la instalación de almacenamiento de equipos.
La cobertura celular es inexistente en esta ubicación. La construcción y el despliegue de torres de telefonía móvil privadas tiene un coste prohibitivo, y las tecnologías LPWAN inalámbricas carecen del ancho de banda necesario para estas aplicaciones. La siguiente tabla muestra cómo se podría considerar qué tecnologías informáticas satisfacen mejor estas tres necesidades.
Factor | 1) Control de las emisiones | 2) La importancia de anticiparse a los fallos | 3) Planificación de MFC |
Latencia | Ningún requisito
Las respuestas a los problemas de emisiones son manuales, por lo que unos segundos de retraso no son importantes. |
Ningún requisito
No hay respuestas automáticas a los avisos, por lo que un pequeño retraso no tiene importancia. |
Ningún requisito La planificación del mantenimiento se realiza diariamente. Los retrasos menores no son imprescindibles. |
Retraso en los datos debido a la intermitencia | No es tolerable
Las infracciones deben tratarse sobre el terreno, lejos de las conexiones de red. |
No es tolerable
Los fallos a corto plazo deben evaluarse y evitarse sobre el terreno, lejos de las conexiones de red. |
Tolerable
Los precursores importantes del mantenimiento son visibles con semanas de antelación, dentro del horario normal para que los simulacros se pongan al alcance de las estaciones WiFi. |
Costes de transferencia de datos | Alta
El envío de datos de forma que se cumplan las limitaciones de intermitencia requeriría enlaces por satélite. |
Alto
El envío de datos que cumpla con las limitaciones de intermitencia requeriría un enlace por satélite |
Bajo
Las redes WiFi existentes pueden mover los datos de forma que cumplan con las limitaciones de intermitencia. |
Potencia de cálculo | Bajo
Existe una solución de sensores inteligentes para calcular las concentraciones de gases de escape e informar de las infracciones. |
Bajo
Los modelos de evaluación son sólo de inferencia y se ejecutan en hardware informático ligero. |
Alto
Los algoritmos de optimización de horarios son computacionalmente intensos para toda la flota. |
Necesidades de almacenamiento (costes de almacenamiento) | Bajo
Almacenar datos detallados sólo sobre la violación con una muestra limitada de las operaciones normales. |
Med
Almacena múltiples canales de datos de señales y anticipa eventos durante varias semanas. |
Alta
Almacenar todos los datos de las señales y los registros de mantenimiento de todos los taladros de la flota durante varios años. |
Escalabilidad | Bajo
No es crucial ampliar el enfoque de supervisión de las emisiones, salvo cuando se añaden nuevos taladros. |
Med
Las técnicas más complejas y los modelos de fallo adicionales pueden requerir recursos informáticos adicionales. |
Med
Las técnicas de optimización más complejas y los factores adicionales de CBM pueden requerir recursos informáticos adicionales. |
Sharing / Colaboración | Bajo
Las acciones de recuperación son tomadas por el operador de la perforadora de forma independiente. |
Bajo
Las acciones de recuperación son tomadas por el operador de la perforadora de forma independiente. |
Med
La programación del mantenimiento la realiza un equipo local. La visibilidad de los factores y escenarios en todo el equipo es esencial. La necesidad de que los equipos globales vean los detalles subyacentes a la programación del mantenimiento es limitada. |
Conservación de datos / informes | Alto
El cumplimiento de las emisiones requiere registros completos a largo plazo. |
Alta
La mejora del modelo requiere el almacenamiento a largo plazo de los datos de las señales en toda la flota para obtener los mejores resultados. |
Alto
La mejora del modelo requiere el almacenamiento a largo plazo de los datos de las señales, los informes de mantenimiento reales y las instancias de mantenimiento previstas en toda la flota. Los KPI de costes de mantenimiento se derivan de estos datos . |
Enfoque tecnológico | La necesidad de obtener informes coherentes en un entorno desconectado con elevados costes de transferencia de datos exige un enfoque basado en el vehículo (en el borde).
El uso de un sensor inteligente con las capacidades de recopilación y procesamiento de datos necesarias satisface estas necesidades. El requisito de retención de datos para la elaboración de informes de conformidad no se puede cumplir fácilmente sólo con el sensor inteligente, por lo que se necesita un sistema de almacenamiento en el vehículo para mantener los datos de las emisiones a corto plazo y transferirlos periódicamente al almacenamiento a largo plazo en una base de datos de conformidad. |
La necesidad de obtener informes coherentes en un entorno desconectado con elevados costes de transferencia de datos exige un enfoque en el vehículo (basado en el borde). Debido a la necesidad de una mayor flexibilidad computacional y una mayor capacidad de almacenamiento, se necesita una pasarela inteligente reforzada o un pequeño PC industrial (IPC). Esta configuración permitirá descargar periódicamente los datos de los sensores y las predicciones a un sistema central de almacenamiento y aprendizaje para realizar análisis a largo plazo y actualizar los modelos. | Los requisitos de alta potencia de cálculo y almacenamiento, el mayor plazo de tiempo permitido para procesar los datos, la necesidad de compartir fácilmente el trabajo en curso y de generar informes consolidados sobre el comportamiento de la flota sugieren que lo mejor es un enfoque de la infraestructura basado en el centro de datos. |
Cómo hacer que el borde trabaje para usted Dado que se trata de un problema de optimización cuya solución depende de los objetivos de la organización y de las características específicas de las preguntas que se hacen a los datos, las opciones de despliegue flexibles son esenciales a la hora de considerar soluciones analíticas para su empresa. La mayoría de los requisitos pueden cumplirse eligiendo una plataforma que pueda acomodar una gama de capacidades tanto para la nube como para el borde, junto con capacidades de plug and play.
El despliegue flexible admite tanto las elevadas cargas computacionales y de almacenamiento necesarias para el aprendizaje de modelos como las menores cargas de inferencia en un entorno bien conectado. En ciertas situaciones en las que las preocupaciones de seguridad son críticas, ayuda que su proveedor de análisis pueda proporcionar instancias ligeras y en contenedor del motor de inferencia, que pueden ejecutarse en hardware de computación de menor tamaño, como puertas de enlace o IPC, y que pueden funcionar totalmente desconectadas de la nube. Las versiones de paquetes analíticos en el aire, que aportan todas las capacidades del software en una «nube en una caja» autónoma, también pueden desplegarse completamente detrás de cortafuegos o en entornos en los que la conectividad a Internet no está disponible.
Puntos clave a tener en cuenta:
El Edge es un problema de optimización – No es un lugar ni una única tecnología.
Hay varios factores que hay que tener en cuenta a la hora de decidir si se va a utilizar, y qué tipo de tecnología informática distribuida, para resolver un problema empresarial.
La capacidad de soportar un espectro de opciones de despliegue en el borde y en la nube es valiosa a la hora de elegir el proveedor adecuado.
Fuente: Toolbox