Mathworks: La IA centrada en los datos ofrece ventajas a todos los sectores
Entrevista con Mathworks
Un renovado interés por la IA centrada en los datos está impulsando una mayor precisión en los resultados de los modelos e introduciendo el concepto en nuevas aplicaciones. Desde Mathworks, David Willingham nos aclara las tendencias actuales.
La IA centrada en los datos está ganando impulso a medida que los ingenieros que trabajan con IA cambian su enfoque de los modelos a los datos. Mientras que antes los ingenieros adoptaban un enfoque centrado en el modelo para mejorar los resultados de predicción y la precisión de un modelo, la dinámica actual está haciendo que muchos se fijen en la calidad de los datos de entrada para mejorar los resultados.
Con datos de mayor calidad tanto entrantes como salientes de los modelos, la IA centrada en los datos está generando nuevas posibilidades en entornos ajenos al ámbito tradicional de los ingenieros, como las comunicaciones 5G, el lidar, la obtención de imágenes de dispositivos médicos y las estimaciones del estado de carga de las baterías de vehículos eléctricos, entre otros.
El director de producto de aprendizaje profundo de MathWorks, David Willingham, habló sobre la evolución de la IA centrada en los datos y sobre cómo los ingenieros pueden navegar mejor -y beneficiarse- de la transición a modelos centrados en los datos dentro de los entornos de aprendizaje profundo.
Willingham se incorporó a MathWorks en 2006 y, durante este tiempo, ha acumulado más de 15 años de experiencia en ingeniería aplicada en diversas áreas de aplicación de la inteligencia artificial, como el aprendizaje profundo, el aprendizaje automático, el aprendizaje de refuerzo, el mantenimiento predictivo, la estadística, los macrodatos y la informática en la nube.
¿Cuál es el impacto de la calidad de los datos en el modelado de IA y cómo pueden los ingenieros evaluar y optimizar los datos que entran y salen de los modelos de IA? ¿Puede explicar con más detalle estas cuestiones?
Hay un par de áreas en las que mejorar la calidad de los datos puede ayudar a la IA y a cualquier mejora que se realice, ya sea eliminando datos erróneos o añadiendo funciones a las aplicaciones. Esto conduce a la obtención de resultados precisos a la hora de entrenar modelos. Con más datos correctos mientras se entrenan los flujos de trabajo, los ingenieros pueden realizar y ejecutar un registro más rápidamente, obtener mejores resultados y tener mejores datos alimentados en un modelo.
¿Qué está haciendo MathWorks para solucionar estos problemas?
En realidad, mucho. Lo interesante son los usuarios principales con los que estamos trabajando y cómo están aplicando la IA. MathWorks cuenta con ingenieros y científicos de MATLAB formados en un área de interés y que han adquirido experiencia en un área específica.
Puede que no sean expertos en IA, pero son los principales expertos que están bien posicionados para adoptar un enfoque centrado en los datos para crear modelos de IA. Pueden observar los datos brutos para la creación de aplicaciones y decir: «Este es el tipo de datos», «Estas son las características» y «Así es como eliminaría los datos no deseados para crear una alta calidad».
Las herramientas que construye MathWorks se centran en estos expertos principales. Si alguien está interesado en imágenes médicas, tenemos una aplicación de imágenes de etiquetas para que lo hagan lo más rápidamente posible, y eso lo hace un experto principal. También tenemos amplias capacidades para ayudar en otras áreas.
¿Cómo pueden los ingenieros adaptar las necesidades de un dominio o aplicación concretos a los datos necesarios para ejecutar con éxito un modelo de IA?
En cuanto a los modelos de entrenamiento, ofrecemos otra opción que no está relacionada con las imágenes, sino con las señales. Las aplicaciones basadas en señales no funcionan sólo con datos brutos; hay que hacer extracción/ingeniería de características, tomar los datos brutos y añadir características adicionales para mejorar la capacidad de predicción. Los expertos en el dominio de la señalización saben cuál es el mejor lugar para elegir el algoritmo de características o tomar una señal de audio y convertir su frecuencia. Pueden examinar la señal en bruto y hacer una dispersión de longitudes de onda. Estos expertos de dominio pueden probar esas características para construir un modelo exitoso.
¿Cuáles son las mejores técnicas de optimización de datos? ¿Y cómo pueden los ingenieros aplicar con éxito las técnicas de optimización de datos, incluida la optimización de imágenes, la eliminación de ruidos y el desarrollo de códigos?
La optimización es un proceso iterativo que requiere realizar varias pruebas una y otra vez hasta encontrar el resultado óptimo. Una vez que se han encontrado los mejores datos posibles para entrenar el modelo, este proceso iterativo y de pruebas es uno en el que, si se hace manualmente, lleva mucho tiempo construir un marco de pruebas propio.
A los ingenieros les gusta hacer las cosas de la forma más eficiente posible: tienen que hacer más con menos y terminar en poco tiempo. Con una aplicación de gestión de experimentos, pueden utilizar una aplicación de bajo código para configurar un experimento con las pruebas o ensayos que desean realizar y que pueden optimizar. Una vez configurada, la aplicación ejecutará esas pruebas o ensayos dentro del experimento y determinará rápidamente cuál es el mejor modelo. Al probar diferentes conjuntos de datos con diferentes características, disponer de herramientas dentro de MathWorks permitirá a los ingenieros hacerlo de forma eficiente.
¿Cómo pueden los ingenieros implementar las mejores prácticas que surgen de la IA centrada en datos, como el modelado de orden reducido y la sincronización de datos?
El modelado de orden reducido es un tema completo en sí mismo. Se trata de un modelo de alta fidelidad o un modelo de fluidos computacional, pero cuya simulación requiere mucho tiempo debido a su complejidad y tamaño. Se basa en principios matemáticos básicos, requiere tiempo de cálculo y produce muchos datos. También es caro.
Se puede tomar un modelo de alta fidelidad; tomar datos ricos y de alta calidad; e introducirlos en el modelo de IA. A continuación, se puede realizar un aprendizaje profundo y tratar de entrenar el modelo para representar los tipos de datos que ese modelo realizó. Ese es el núcleo del modelado de orden reducido. Es un área importante para nosotros en MATLAB.
La sincronización de datos puede emplearse para aumentar la calidad de los datos. Si entrenas un modelo y te aseguras de que está sincronizado, puedes obtener un modelo más preciso y satisfactorio. Por ejemplo, si tienes dos sensores con dos marcas de tiempo diferentes, puedes alinear y sincronizar esos datos. Es una práctica estándar si es necesario fusionar datos; MathWorks ofrece este análisis y sincronización de datos.
¿Qué ejemplos puede compartir MathWorks sobre los beneficios prácticos de la IA centrada en datos en aplicaciones beneficiosas del mundo real? De cara al futuro, ¿qué es lo que MathWorks ve venir en este ámbito?
Trabajamos en estrecha colaboración con usuarios de sistemas de ingeniería industrial, aviones, automóviles, equipos de fabricación y otras áreas industriales. Honeywell mejoró sus propios flujos de trabajo con IA centrada en datos. La empresa buscaba la mejor forma de etiquetar los datos de audio para que los modelos fueran lo más precisos posible.
Su proceso de etiquetado era manual y laborioso, por lo que Honeywell utilizó las herramientas de MathWorks para crear otro modelo que automatizara este proceso. Utilizaron MATLAB Signal Labeler para optimizar este enfoque.
En la actualidad, disponemos de una aplicación de etiquetado de imágenes médicas. Esto se inspiró en la reciente publicación de una caja de herramientas y una biblioteca de imágenes médicas para este ámbito específico. En el futuro, nos planteamos evolucionar más allá de amplias áreas de aplicación hacia ámbitos más especializados. Ya tenemos aplicaciones de imagen y señal para ámbitos concretos.
La imagen médica es un ejemplo; también tenemos una para audio y una caja de herramientas con técnicas de preprocesamiento para automatizar la extracción de características.
Artículo completo en Database Trends and Applications