banner
Hogar / Noticias / Neural residual profunda
Noticias

Neural residual profunda

May 26, 2023May 26, 2023

Scientific Reports volumen 12, número de artículo: 17158 (2022) Citar este artículo

1249 Accesos

1 Citas

1 altmétrica

Detalles de métricas

Se propone un método de diagnóstico de fallas de articulaciones de robots basado en datos que utiliza una red neuronal residual profunda (DRNN), donde se introduce el método de diagnóstico de fallas basado en Resnet. El método propuesto trata principalmente con tipos de fallas, como error de ganancia, error de compensación y mal funcionamiento tanto de sensores como de actuadores, respectivamente. En primer lugar, se deriva un modelo profundo de diagnóstico de fallas de red residual apilando pequeños núcleos de convolución y aumentando el tamaño del núcleo. Mientras tanto, el ruido blanco gaussiano se inyecta en el conjunto de datos de falla para verificar la inmunidad al ruido de la red residual profunda propuesta. Además, se lleva a cabo una simulación, donde se utilizan diferentes métodos de diagnóstico de fallas, incluida la máquina de vectores de soporte (SVM), la red neuronal artificial (ANN), la red neuronal convolucional (CNN), la red de memoria a largo plazo (LTMN) y la red neuronal residual profunda (DRNN). se comparan y los resultados de la simulación muestran que la precisión del diagnóstico de fallas para el sistema robótico que usa DRNN es mayor; mientras tanto, DRNN necesita menos tiempo de entrenamiento del modelo. El análisis de visualización demostró la viabilidad y eficacia del método propuesto para el diagnóstico de fallas del sensor y actuador de la articulación del robot utilizando el método DRNN.

Recientemente, los robots industriales se han utilizado ampliamente en muchas aplicaciones, como líneas de producción de automóviles, aeroespaciales, comunicaciones y electrónica de consumo1,2,3. Como destacado representante de la tecnología mecatrónica, el módulo de articulación del robot integra una gran cantidad de componentes, incluido un motor hueco, un servocontrolador, un reductor de armónicos, un freno y un codificador, en un espacio limitado4. Teniendo en cuenta el entorno de trabajo complejo y cambiante de las articulaciones de los robots, es inevitable que se produzcan tipos de fallos. Si no existe un mecanismo de diagnóstico de fallas antes de que ocurra, afectará la eficiencia de la producción, la calidad del producto e incluso pondrá en peligro la vida humana. Por tanto, lo más urgente es cómo detectar y localizar las averías de forma rápida y precisa5.

Los investigadores se han centrado en la detección de fallas y el control tolerante a fallas de las articulaciones de robots durante muchos años, y han propuesto muchos métodos prácticos de diagnóstico de fallas, incluida la redundancia de hardware y métodos de diagnóstico de fallas basados ​​en análisis teóricos.

Entre los métodos de diagnóstico de fallas de articulaciones de robots basados ​​en análisis teóricos, el observador se usa ampliamente6,7. Debido a la característica de rápida convergencia del método del modo deslizante, el error podría atenuarse según lo diseñado, por lo tanto, garantiza la rapidez del observador, por lo que se utiliza en todos los lugares en el diagnóstico de fallas de las articulaciones del robot8,9. Además, para el diagnóstico de fallas también se aplican el algoritmo de retroceso, el método Takagi-Sugeno y el observador de Luenberger10,11,12. Sin embargo, la mayoría de los robots industriales se ven afectados por perturbaciones o ruido, por lo que es necesario considerar el efecto de las perturbaciones en el diagnóstico de fallas del robot. Para un sistema robótico, lo primero que me viene a la mente es diseñar un observador de perturbaciones. Existen muchos métodos para el diseño del observador de perturbaciones, como el método de retroalimentación de salida13, el método de diseño del observador de perturbaciones no lineal14 y el método de diseño del observador de perturbaciones con linealización de retroalimentación8.

Sin embargo, el problema más complicado del método de diagnóstico de fallas de articulaciones de robots basado en observadores es que la ganancia del observador es muy difícil de diseñar. En la actualidad, en el diseño de la ganancia del observador, primero se debe determinar la función de costos y seleccionar la ganancia del observador para minimizar la función de costos. El proceso de diseño anterior amplía el rango del valor de la ganancia, lo que tiene un gran impacto en el desempeño del observador. La estabilidad del observador también es una consideración importante y está garantizada principalmente por la función de Lyapunov, que es muy difícil de encontrar15.

La dificultad en el diseño de ganancia en un sistema de diagnóstico de fallas de robots basado en observadores promueve la investigación del diagnóstico de fallas de robots basado en sensores redundantes. Gracias al desarrollo de sensores, los sensores integrados con elementos de detección, actuadores y fuentes de alimentación han logrado un gran avance, como el chip de detección magnética, la medición de la velocidad y los elementos de medición de la gravedad16, y se han convertido en componentes de retroalimentación muy importantes en el sistema de diagnóstico de fallas de las articulaciones del robot. .

Se utiliza un giroscopio tridimensional para medir el movimiento del objeto. Para un sistema de articulación de robot de seis grados de libertad, se utilizan sensores magnéticos, de velocidad angular y de gravedad MEMS de bajo costo para estimar el ángulo de articulación de un manipulador giratorio17. El sensor se instala en cualquier posición del enlace del manipulador en cualquier actitud, y la información de actitud y posición del sistema de articulación se obtiene mediante los sensores de medición de actitud anteriores.

Sin embargo, el sistema de diagnóstico de fallas del robot basado en sensores redundantes no solo aumenta la complejidad estructural, sino que también aumenta el costo de hardware del sistema. Además, los sensores adicionales también aumentan la posibilidad de que falle el sensor en el sistema. Con el desarrollo de la inteligencia artificial, se desarrolla el método de diagnóstico de fallas basado en datos. El sistema de robot basado en un método basado en datos solo necesita entrenarse utilizando datos de falla, que son fáciles de recopilar cuando hay una falla en el sistema del robot, por lo que no es necesario utilizar sensores redundantes.

El método de red neuronal (NN) tiene las ventajas de un procesamiento distribuido masivamente paralelo, autoorganización y capacidad de autoaprendizaje, por lo que es muy popular en el diagnóstico de fallas18,19,20. La corriente principal de NN incluye el perceptrón básico, Feed-Forward NN (FFNN), memoria a largo plazo (LSTM), CNN y RNN, etc.21,22,23. Perceptron es la versión más original de NN, que es simplemente una simple neurona. Como los problemas reales necesitan más neuronas para participar en el cálculo, se proponen redes constituidas por muchas neuronas, que son NN en el sentido ordinario. Hay muchas variantes del NN. Zhang utilizó FFNN multicapa para el diagnóstico de fallas mecánicas24. R. Sánchez investigó Spur Gearbox con NN artificial de propagación retroalimentada para realizar la identificación y clasificación de fallas25. Recientemente, Khouloud estudió LSTM sobre detección de fallas de fibra reflectante, lo que redujo los gastos de operación y mantenimiento26. Albert también probó la red neuronal LSTM para el diagnóstico de fallas de conjuntos fotovoltaicos y realizó la extracción automática de características. Además, para mejorar la capacidad de extracción de características de la red neuronal, se adopta la operación de convolución, donde se utiliza un núcleo de convolución para escanear la figura completa27. Chen investigó CNN para diagnosticar fallas en los rodamientos28. Bo utilizó una técnica de propagación de etiquetas adaptativa combinada con un codificador automático variacional de convolución profunda para lograr el diagnóstico de fallas emergentes29. Sin embargo, la NN normal no puede extraer la información adecuada que necesita la arquitectura de diagnóstico de fallas debido a la estructura simple de esta red. FFNN requiere abundantes conjuntos de datos para cubrir todas las situaciones, o puede fallar. El cálculo matricial de CNN es complejo, especialmente en estructuras NN multicapa. Además, CNN enfrenta un problema grave: la pérdida de gradiente en la actualización de parámetros por retropropagación.

Para superar la pérdida de gradiente en el proceso de actualización de parámetros, el RNN se utiliza en el diagnóstico de fallas del actuador del robot. La salida de la última capa pasa a la siguiente, por lo que se resuelve el problema de pérdida de gradiente que existe en el aprendizaje profundo NN. En 30 se propone una red de convolución de gráficos de clúster de múltiples escalas con RNN multicanal. El diagnóstico de fallas de motores en condiciones no estacionarias se estudia en 31. Además, en 32 se investiga la ubicación de fallas en los rodamientos utilizando RNN. Se presentaron estas investigaciones científicas sobre el diagnóstico de fallas de robots utilizando la aplicación de robot extremadamente enriquecida RNN. Chen detalló la aplicación de RNN en múltiples dominios33, y el diagnóstico de fallas mecánicas de rodamientos en situaciones desconocidas también es un punto crítico.

Sin embargo, el diagnóstico de fallas NN existente se centra principalmente en las fallas mecánicas de los actuadores del robot, sin considerar la clasificación de fallas de los sensores y actuadores al mismo tiempo. Tanto los sensores como los actuadores del robot pueden tener desviaciones constantes y fallas de ganancia constantes, y los sensores se ven seriamente perturbados por el ruido. Además, la diferencia de los datos de falla entre los sensores y el actuador es muy pequeña, y el uso de métodos NN convencionales conduce a una baja precisión de identificación y un largo tiempo de entrenamiento y diagnóstico.

Como extensión de nuestra investigación anterior en 34, en este artículo se propone un método de diagnóstico de fallas de redes neuronales residuales profundas basado en datos para sistemas de articulaciones de robots. Cubre muchos tipos de fallas, incluidas fallas de sensores y actuadores; además, las fallas tanto del sensor como del actuador se agrupan en detalle. En primer lugar, se construye una red neuronal residual profunda utilizando un pequeño núcleo de convolución para el diagnóstico de fallas. Luego, se inyecta ruido blanco gaussiano obtenido por MATLAB en el conjunto de datos de falla para verificar la inmunidad al ruido de la red residual profunda propuesta. Finalmente, se demuestra mediante simulación la viabilidad y eficacia del método de diagnóstico de fallas de red residual profunda propuesto para el diagnóstico de fallas de sensores y actuadores de articulaciones de robots. Las principales contribuciones de este trabajo son las siguientes.

(1) Los datos de retroalimentación de fallas del sensor del robot y del actuador son muy similares, lo que se pudo ver en nuestra investigación anterior [Este es el título del artículo de nuestra investigación anterior y debe colocarse como referencia], por lo que esto podría resultar en una característica de datos ambigua. límite y esto causa una baja precisión del diagnóstico. Se adopta el DRNN y la arquitectura de diagnóstico está bien diseñada para eliminar la pérdida de gradiente.

(2) Este artículo proporciona un método de fusión de datos para señales de retroalimentación de sensores y actuadores de robots. Donde se considera que el ruido blanco gaussiano simula las condiciones de trabajo reales. El diagnóstico de fallas del robot utilizando datos fusionados simplifica la dimensión de la entrada.

(3) Se llevan a cabo experimentos completos y de comparación, donde se adoptan los métodos NN populares actuales para mostrar su efectividad y compararlos con DRNN. Los resultados muestran que DRNN posee una velocidad convergente más rápida y una mayor precisión.

Este artículo está organizado de la siguiente manera: el modelo de articulación del robot se establece en la parte II y el conjunto de datos de fallas se obtiene de acuerdo con el modelo de fallas de la primera parte. Luego, el principio básico de DRNN se introduce en la parte III. En la parte IV, se llevan a cabo la simulación y visualización analítica de los resultados de la clasificación de fallas. El autor resume la investigación al final de este artículo.

El modelo dinámico de articulación del robot se establece mediante el método de equilibrio de Lagrange desde el punto de vista de la energía35.

donde \(\tau\) es el vector del par con dimensión de n, \(q,\dot{q},\ddot{q} \in R^{n}\) son variables de estado de posición angular, velocidad angular y la aceleración angular, \(D(q)\) y \(C(q,\dot{q})\) son matrices cuadradas con dimensión de n, denotan matriz de inercia y matriz de fuerza de Coriolis respectivamente, \(G(q) \in R^{n}\) es el vector del momento de gravedad.

Sea la posición y la velocidad de las articulaciones las variables de estado y utilice la sustitución de variables \(x = [x_{1} \quad x_{2} ]^{T} = [q\quad \dot{q}]^{T} \), entonces (Ec. 1) podría reescribirse como

donde \(x\) son las variables de estado para \(S_{1}\),\(y\) es la salida del sistema, \(f(q,\dot{q},\tau )\) es el sistema término de acoplamiento, y los valores específicos de la matriz \(A\),\(B\) y \(E\) son los siguientes.

Las fallas del actuador de articulación del robot se pueden dividir aproximadamente en dos categorías según el mecanismo de aparición de fallas de articulación: falla multiplicativa y falla aditiva.

Para \(S_{1}\), cuando el actuador tiene falla multiplicativa, el sistema (Ec. 2) podría escribirse de la siguiente manera

donde \(\rho \in [0,1][0,1]\) es el factor efectivo del actuador. Un cero de \(\rho\) significa que el actuador está completamente roto mientras que uno significa que funciona muy bien.

Además del factor efectivo \(\rho\), puede haber una falla de compensación de par adicional, y podría representarse en la siguiente ecuación.

donde \(f_{a}\) es la función de falla del actuador y su valor está correlacionado positivamente con el grado de daño.

Ahora tanto \(\rho\) como \(f_{a}\) decidirían qué tipo de fallas sufre actualmente el actuador. Los siguientes cuatro modelos de fallas se pueden establecer dividiendo aún más las fallas.

ErrA1: Fallo de desviación constante del actuador.

ErrA2: Fallo de ganancia constante del actuador.

ErrA3: El actuador está completamente atascado.

ErrA4: El actuador está completamente roto.

La Tabla 1 concluye los tipos de fallas del actuador mencionados anteriormente.

De manera similar a la falla del actuador de la articulación del robot, la falla del sensor se puede dividir en cuatro grupos: falla de desviación constante, falla de ganancia constante y falla atascada, así como el sensor completamente roto. Los sensores se utilizan para detectar el estado del sistema, por lo que la falla del sensor afecta directamente la retroalimentación del estado del sistema, lo que significa que la salida del sistema se ve directamente afectada.

Aquí se enumeran cuatro tipos de fallos de sensores y también se deducen las fórmulas matemáticas correspondientes.

ErrS1: Fallo de desviación constante del sensor.

donde \(f_{b}\) es la función de falla del sensor con la misma dimensión de \(x\). \(f_{b}\) se correlaciona positivamente con el grado de daño.

ErrS2: Fallo de ganancia constante del sensor.

donde \(\lambda\) es el factor efectivo del sensor.

ErrS3: El sensor está en un punto de salida constante.

Cuando esto sucede, significa que el sensor no reacciona cuando la articulación del robot se mueve.

ErrS4: El sensor está en el punto de salida cero.

El factor efectivo del sensor es cero y significa que el sensor ya no funciona. Las fallas del actuador y del sensor se combinan y considerando (Ec. 1) y (Ec. 2), la expresión después de la integración se da en (Ec. 5).

MATLAB/Simulink establece el modelo del sistema de control de la articulación del robot como se muestra en la Fig. 1. El tiempo total de simulación se establece en 40 sy la frecuencia de muestreo es de 100 Hz.

Modelo de sistema de control de articulaciones robóticas.

A partir del modelo de falla del sensor conjunto y del modelo de falla del actuador en (Ec. 5), afectan al sistema de una manera diferente. Sin embargo, a través de la derivación y transformación del modelo, la falla del sensor se puede transformar en falla del actuador a través del filtro de primer orden, lo que simplifica el procedimiento de análisis. Para reflejar toda la información utilizando el conjunto de datos de fallas recopilados, los datos de fallas del sensor y del actuador se procesan previamente de acuerdo con la siguiente fórmula.

donde \(Fault\) denota el conjunto de datos de falla necesario, \(\Delta Sensor\) representa la diferencia entre la salida y la configuración del sensor, \(Actuator\) es la salida del actuador, \(a\) y \(b\) son coeficientes de fallas del sensor y del actuador respectivamente. El elemento \(Ruido\) representa el ruido blanco gaussiano y se suma a las señales de retroalimentación del sensor y del actuador, y tres de ellas forman las señales de falla para verificar la capacidad de inmunidad al ruido del RNN.

En nuestro estudio, se consideran los tipos de fallas tanto para el sensor como para el actuador, incluyendo fallas de ganancia constante, fallas de desviación constante, fallas atascadas y fallas inactivas. Los ocho tipos de fallos anteriores se investigan por separado para el sensor y el actuador. además, también se considera la falla de desviación constante que ocurre simultáneamente en el sensor y el actuador. La Tabla 2 enumera los diez tipos de sistemas, incluidas las condiciones normales.

RESNET es una especie de CNN profunda y proporciona información directa a través de retroalimentación residual. RESNET no solo amplía la profundidad de la red, sino que también evita el fenómeno de desaparición del gradiente en el proceso de actualización de parámetros, lo que mejora la fuerte capacidad de adaptación de la red.

Generalmente, CNN consta de cinco partes: capa convolucional, estandarización por lotes, capa activa, capa de agrupación y capa de abandono. Toda la arquitectura CNN está construida por una capa completamente conectada (FCL), como se muestra en la Fig. 2.

Diagrama del sistema de diagnóstico de fallas CNN.

Además, la arquitectura de diagnóstico de fallas de CNN se puede dividir en dos partes: el módulo de filtrado y clasificación. El módulo de filtrado puede extraer características del conjunto de datos de entrada y el módulo de clasificación puede procesar y clasificar las características extraídas del módulo de filtrado. Ambos módulos utilizan un mecanismo de intercambio de parámetros y una conexión escasa para reducir la cantidad de procedimiento de entrenamiento del modelo y mejorar la eficiencia del entrenamiento de la red36.

Por lo general, se necesita una gran muestra de capacitación cuando se utiliza RESNET para el diagnóstico de fallas. Los métodos tradicionales de mejora de conjuntos de datos incluyen principalmente: transformación de inversión, escalado, transformación de rotación, transformación de espejo y transformación de traducción37. Sin embargo, estos métodos no son adecuados para datos de muestra unidimensionales. Para ampliar los datos adquiridos sobre fallas de las articulaciones del robot, se propone un método de mejora del conjunto de datos de muestreo deslizante, como se indica en la Fig. 3.

Diagrama esquemático del método de mejora del conjunto de datos.

Se obtienen los datos del sistema durante un período y se utilizan puntos de muestreo de datos de \(N_{1}\) cada vez que es necesario entrenar la red. Suponiendo que se obtiene un número total de \(m*N_{1}\) datos, entonces la red podría entrenarse \(m\) veces según el método anterior. Para ampliar el coeficiente de utilización de los datos, el punto de inicio del segundo conjunto de datos es \(h\) al revés que el primero, y el resto es más o menos el mismo.

Cuando el tamaño del paso deslizante es pequeño, eso significa que \(h\) es bastante grande, podemos obtener más muestras de datos, lo que puede satisfacer las necesidades de los conjuntos de datos para redes neuronales de convolución profunda en entrenamiento. Consideración integral, el paso deslizante seleccionado aquí es 29.

RESNET es un tipo de red neuronal convolucional profunda. Para reducir el uso de los parámetros del modelo y el cálculo de la red, este documento utiliza varios núcleos de convolución pequeños y los apila todos, por lo que se aumenta el tamaño del núcleo de convolución, lo que mejora la capacidad de extracción de características para la red. En la Fig. 4 se muestra toda la estructura que utiliza RESNET en el diagnóstico de fallas, desde la entrada de datos hasta la salida del diagnóstico de fallas.

Diagrama del modelo RESNET.

Conv3*1,4,6 en la Fig. 4 representa una dimensión de núcleos de convolución, y su profundidad es 4, el paso deslizante es 6. BN, ReLU, GAP y Dense son estandarización por lotes, capa activa, capa de agrupación y capa completamente conectada respectivamente en Fig. 2. La estructura de toda la red está regularizada para evitar un ajuste excesivo; cuando las dimensiones de entrada y salida de cada módulo de convolución son inconsistentes, el salto residual se realiza a través del canal virtual, que se indica con la línea de puntos en la Fig. 4.

La plataforma de simulación utilizada es PyCharm, combinada con el intérprete Python3.6. La arquitectura RESNET se basa en Keras con Tensorflow como fondo. Tensorflow es una plataforma de aprendizaje automático de código abierto de un extremo a otro y tiene un ecosistema integral y flexible que contiene una variedad de herramientas, bibliotecas y recursos comunitarios. Keras es una biblioteca de redes neuronales artificiales de código abierto escrita por Python. Puede utilizarse como una interfaz de aplicación de alto nivel de tensorflow para diseñar, depurar, evaluar, aplicar y visualizar el modelo de aprendizaje profundo38.

Se estudian una variedad de tipos de fallas enumerados en la Tabla 1. Los conjuntos de datos de falla se obtienen para cada tipo de falla del sensor y del actuador, y obtenemos 4000 datos para cada tipo de falla; alrededor de 216 puntos de datos están contenidos en los 4000 puntos de datos antes mencionados. Se utiliza el método de mejora de muestreo deslizante, como se muestra en la Fig. 3, y se toman 1000 muestras para cada tipo de falla, por lo que se estudia un total de 10,000 muestras, incluido un conjunto de datos en un entorno de operación normal. Los resultados del diagnóstico de fallas deben evaluarse, por lo que se dividen 1000 muestras en una proporción de 7:2:1, lo que significa que el 70% de los datos se usa para entrenar la red neuronal, el 20% se usa para la validación y el resto para pruebas.

Según investigaciones anteriores, los hiperparámetros en el algoritmo de aprendizaje profundo no solo afectan el rendimiento del algoritmo en sí, sino que también afectan la capacidad de expresión del modelo entrenado. Sin embargo, no existe una teoría madura sobre cómo establecer hiperparámetros. En la actualidad, la mayoría de las configuraciones de hiperparámetros se basan en prueba y error. Este artículo sigue el consejo de Y.bengio39. Los hiperparámetros correspondientes se establecen según si estos hiperparámetros pueden aumentar o disminuir la capacidad del modelo.

En el proceso de actualización de parámetros, se utiliza la tasa de aprendizaje de caída exponencial. Al principio, se utiliza una gran tasa de aprendizaje para obtener rápidamente la solución óptima y luego la tasa de aprendizaje se reduce gradualmente para mantener el modelo estable en la etapa posterior del entrenamiento. La tasa de aprendizaje inicial \(\eta_{0}\) se establece en 0,2 y la tasa de aprendizaje de decadencia \(\xi\) se establece en 0,99, por lo que la tasa de decadencia se actualiza por ronda. La expresión para la tasa de desintegración es la siguiente.

donde \(\eta\) denota la tasa de aprendizaje de caída exponencial, \(H\) representa la ronda actual, \(L\) es el período,\(Batch\_k\) es el número de iteraciones. Cuando un conjunto de datos completo pasa a través de la red neuronal una vez y luego regresa, este proceso se llama \(Epoch\) y aquí configuramos \(Epoch\) en 40.

Para aliviar el sobreajuste de la red neuronal, en este artículo se utiliza el método de regularización \(l_{2}\). La regularización consiste en introducir el índice de complejidad del modelo en la función de pérdida y suprimir el ruido en el conjunto de datos de entrenamiento ponderando los parámetros \(w\) en la red neuronal. La función de pérdida es la siguiente.

donde \(Loss\_all\) representa la función de pérdida de todos los parámetros en el modelo, \(REGULARIZER\) es el peso de regularización, \(w\) generalmente se refiere al peso en la propagación hacia adelante de la red neuronal y \(Loss\_all\) (w)\) es el resultado de \(l_{2}\) regularización del parámetro \(w\).

Se utiliza el algoritmo óptimo de Adma y el procedimiento de actualización del peso es el siguiente.

Paso 1: Dar el paso de iteración \(\varepsilon = 0.001\).

Paso 2: Establezca la tasa de caída para el cálculo matricial,\(\rho_{1} = 0,99,\rho_{2} = 0,999\).

Paso 3: Determine el umbral de convergencia \(\delta = 10^{ - 8}\).

Paso 4: Inicializa el peso de la red \(\theta\), e inicializa las variables de primer y segundo momento \(s,r\), y establece \(s = 0,r = 0\).

Paso 5: establezca el paso de tiempo de simulación en 0,0001.

Paso 6: Se recopila un pequeño conjunto de datos con \(m\) muestras del conjunto de entrenamiento, use \(\left\{ {x^{{(1)}} ,x^{{(2)}} ,.. .,x^{{\text{(m)}}} } \right\}\) lo denota y establece los objetivos correspondientes \(y^{(i)}\).

Paso 7: Calcular la variable de gradiente \(g \leftarrow \frac{1}{m}\nabla_{\theta } \sum\limits_{i} {L{(}f{(}x^{{{(}i{ )}}} {;}\theta {),}y^{(i)} {)}}\), y actualizar la estimación sesgada del primer momento \(s \leftarrow \rho_{1} s + (1 - \rho_ {1} )g\) así como estimación sesgada del segundo momento \(r \leftarrow \rho_{2} r + (1 - \rho_{2} )g\).

Paso 8: Corregir la desviación del primer momento \(\hat{s} \leftarrow \frac{s}{{1 - \rho_{1}^{t} }}\) y la desviación del segundo momento \(\ sombrero{r} \leftarrow \frac{r}{{1 - \rho_{2}^{t} }}\).

Paso 9: Calcule el error de peso incremental \(\Delta \theta = - \varepsilon \frac{{\hat{s}}}{{\sqrt {\hat{r}} + \delta }}\), y actualícelo al peso de la red \(\theta \leftarrow \theta + \Delta \theta\).

Paso 10: Si no se alcanza el umbral de convergencia en el Paso 3, regrese al Paso 6; de lo contrario, finalice el proceso iterativo.

El aprendizaje automático es un proceso altamente empírico, acompañado de una gran cantidad de iteraciones. Para encontrar el modelo más adecuado, se necesita mucho entrenamiento del modelo. El optimizador es una herramienta para guiar a la red neuronal para actualizar los parámetros. El uso del algoritmo de optimización puede ayudar a entrenar rápidamente el modelo y encontrar la solución óptima. En este artículo, elegimos el algoritmo de optimización Adma, que no ocupa memoria y es un algoritmo de optimización aleatoria eficiente.

Con el fin de verificar la viabilidad y eficacia del método de diagnóstico de fallas RESNET utilizado en este artículo para el diagnóstico de fallas del actuador y sensor de articulación del robot, se utilizaron los métodos de red neuronal artificial, máquina de vectores de soporte, red neuronal convolucional, red de memoria a largo plazo y red residual profunda. se utilizan para análisis y verificación comparativos. La precisión promedio y la desviación estándar de diferentes resultados de entrenamiento de red se comparan en la Tabla 3.

Se puede ver en la Tabla 3 que, en comparación con el método tradicional de diagnóstico de fallas basado en datos (ANN y SVM), la precisión del reconocimiento de fallas del método de diagnóstico de fallas de aprendizaje profundo mejora significativamente. La precisión promedio de los resultados del entrenamiento de la red es inferior al 70 % utilizando el método tradicional de diagnóstico de fallas, pero la precisión promedio de CNN, LTMN y RESNET es superior al 95 %. Mientras tanto, la precisión promedio de RESNET tanto en el conjunto de entrenamiento como en el de prueba es superior al 99%, lo que significa que RESNET es adecuado y efectivo para el diagnóstico de fallas de actuadores y sensores de articulaciones de robots.

Con el fin de analizar más a fondo el efecto de diagnóstico de tres tipos de redes neuronales profundas (CNN, LTMN y RESNET) en las fallas de los sensores y actuadores de las articulaciones del robot, se extraen la precisión y la función de pérdida de cada tipo de red en el conjunto de entrenamiento y el conjunto de pruebas. con la ayuda de tensorflow, y los resultados se muestran en la Fig. 5 y la Tabla 4.

Resultados del diagnóstico de fallas de tres tipos de redes neuronales.

La Figura 5 muestra la precisión y la pérdida del diagnóstico de fallas en los conjuntos de datos de entrenamiento y validación. Las razones por las que la pérdida de validación es mejor que la pérdida de entrenamiento se pueden deducir de la siguiente manera. Los conjuntos de datos bajo las mismas condiciones de trabajo se agrupan proporcionalmente como 7:2:1, por lo que los conjuntos de datos de validación solo ocupan el 20% del total. Esto puede causar la diferencia de precisión.

La capa de abandono en el proceso de formación. Para acelerar el tiempo de entrenamiento del modelo, se introduce la capa de abandono. Mientras que el abandono no opera en la etapa de validación. Combinando la Fig. 5 y la Tabla 4, se puede ver que la precisión más alta de CNN en el conjunto de datos de entrenamiento es del 99,2%, y ese número es del 97,3% en el conjunto de datos de prueba. La precisión más alta de LTMN y RESNET en el conjunto de datos de entrenamiento y el conjunto de datos de prueba es del 100%, y su curva de precisión es relativamente más suave. Obviamente, tanto LTMN como RESNET pueden reflejar mejor la información de fallas del conjunto de datos original y pueden emitir juicios más precisos sobre fallas de sensores y actuadores en las articulaciones del robot. Pero desde el punto de vista del tiempo de entrenamiento, RESNET necesita 2,5 T, mientras que LTMN necesita 12 T, que es más de cinco veces más que RESNET.

Por lo tanto, en comparación con otros métodos de diagnóstico de fallas basados ​​en datos, la red RESNET profunda utilizada en este artículo tiene una mayor precisión en el diagnóstico de fallas de sensores y actuadores de articulaciones de robots, y el costo del tiempo de capacitación es relativamente menor, por lo que es más práctico.

Teniendo en cuenta que el valor inicial de la red neuronal es aleatorio, para evitar la inexactitud de los resultados del diagnóstico de fallas y verificar la confiabilidad de cada resultado de entrenamiento, se utiliza el método cruzado para entrenar el conjunto de datos de fallas diez veces. Los resultados se muestran en la Fig. 6.

Resultado de validación cruzada.

Como se puede ver en la Figura 6, la precisión del entrenamiento de RESNET en cada experimento es superior al 99% y la precisión más baja es del 99,6%. Por lo tanto, se puede concluir que el mejor método de diagnóstico de fallas del sensor y actuador de articulación del robot es la red neuronal basada en RESNET en nuestro estudio.

El análisis de visualización de RESNET se lleva a cabo para estudiar el proceso intermedio de la red neuronal. La incrustación de vecinos estocásticos distribuidos en t (t-SNE) se utiliza para reducir la dimensión de datos de la salida de cada bloque residual en la arquitectura RESNET, y los resultados se muestran en la Fig. 7.

Salida de bloque residual.

La Figura 7a es el resultado de la visualización t-SNE del conjunto de datos de falla con una relación señal-ruido configurada en 10. La Figura 7b-i corresponde a los resultados de la visualización t-SNE de las salidas de los ocho bloques residuales en la arquitectura RESNET en la Fig. 4. La Figura 7j es el resultado final de la red neuronal RESNET. Diferentes curvas con diferentes colores en la Fig. 7 representan diferentes tipos de fallas enumeradas en la Tabla 1. Un total de 10 colores corresponden a 9 fallas y 1 estado de salud para el sistema de articulación del robot.

Se puede ver en la Fig. 7 que con el aumento de bloques residuales, la capacidad de expresión de datos de la red RESNET mejora gradualmente y finalmente se logra la clasificación precisa de nueve tipos de fallas. A partir de los resultados del análisis de visualización de datos en un espacio bidimensional, se verifica aún más la viabilidad y eficacia del algoritmo de diagnóstico de fallas RESNET propuesto en este artículo.

En este artículo se propone un novedoso método de diagnóstico de fallas de redes neuronales basado en RESNET para sistemas de articulaciones de robots. Para abordar el problema de que el algoritmo tradicional de diagnóstico de fallas de articulaciones de robots no puede localizar la falla con precisión, se propone un algoritmo de diagnóstico de fallas RESNET basado en datos. Los modelos de falla del sensor y actuador de articulación del robot están diseñados para simular varios estados de falla con el fin de adquirir datos de falla. Después de obtener el conjunto de datos de fallas necesario, se estudia la arquitectura RESNET construida mediante un pequeño núcleo de convolución y, al aumentar los bloques residuales, el núcleo de convolución se aumenta gradualmente para mejorar la capacidad de extracción de fallas del modelo. En comparación con otros algoritmos de diagnóstico de fallas basados ​​en datos, los resultados de la simulación muestran que la precisión del diagnóstico de fallas basado en RESNET es superior al 99%, que es la más alta entre todos los métodos estudiados y, mientras tanto, el tiempo de entrenamiento del modelo es menor.

Los datos presentados en este estudio están disponibles previa solicitud al autor correspondiente.

Los datos presentados en este estudio están disponibles previa solicitud al autor correspondiente.

Burgner-Kahrs, J., Rucker, DC y Choset, H. Robots continuos para aplicaciones médicas: una encuesta. Traducción IEEE. Robot. 31(6), 1261–1280 (2015).

Artículo de Google Scholar

Gruver, WA Robótica inteligente en fabricación, servicio y rehabilitación: una descripción general. Traducción IEEE. Indiana electrón. 41(1), 4-11 (1994).

Artículo de Google Scholar

Nanjangud, A. et al. Operaciones en órbita habilitadas por robótica e inteligencia artificial con la futura generación de satélites pequeños. Proc. IEEE 106(3), 429–439 (2018).

Artículo de Google Scholar

Kim, JH Sensores de fuerza-par multieje para medir el punto de momento cero en robots humanoides: una revisión. IEEE Sens. J. 20(3), 1126–1141 (2019).

ADS del artículo Google Scholar

Zhao, B. y col. Filtro de partículas para diagnóstico de fallas y navegación robusta de robots submarinos. Traducción IEEE. Sistema de control Tecnología. 22(6), 2399–2407 (2014).

Artículo de Google Scholar

KIM, MJ y cols. Observadores de fricción sin modelo para robots de articulaciones flexibles con mediciones de par. Traducción IEEE. Robot. 35(6), 1508-1515 (2019).

Artículo de Google Scholar

Xie, X., Yue, D. & Park, JH Estimación del estado basada en observadores de sistemas difusos en tiempo discreto basados ​​en un mecanismo de conmutación conjunta para instantes adyacentes. Traducción IEEE. Cibern. 50(8), 3545–3555 (2019).

Artículo de Google Scholar

Guo, J. Control de seguimiento robusto de juntas de rigidez variable basado en linealización de retroalimentación y observador de perturbaciones con compensación de errores de estimación. Acceso IEEE 8, 173732–173754 (2020).

Artículo de Google Scholar

Capisani, LM et al. Diagnóstico de fallas del manipulador mediante observadores de modo deslizante de orden superior [J]. Traducción IEEE. Indiana electrón. 59(10), 3979–3986 (2012).

Artículo de Google Scholar

Yang, Yueneng y Yan, Ye. Control de modo deslizante retrospectivo para sistemas no lineales de retroalimentación estricta inciertos que utilizan programación de ganancia adaptativa basada en redes neuronales. J. Sistema. Ing. Electrón. 29(3), 580–586 (2018).

Artículo de Google Scholar

Shaker, MS Enfoque híbrido para diseñar FTC basado en observadores Takagi-Sugeno para sistemas no lineales afectados por fallas simultáneas de actuadores y sensores que varían en el tiempo. Aplicación de la teoría del control IET. 13(5), 632–641 (2019).

Artículo MathSciNet Google Scholar

Bernard, P. & Andrieu, V. Luenberger observadores de sistemas no lineales no autónomos. Traducción IEEE. Automático. Control 64(1), 270–281 (2018).

Artículo MathSciNet Google Scholar

Ding, S. y col. Diseño de observadores de perturbaciones para sistemas no lineales representados por modelos de entrada-salida. Traducción IEEE. Indiana electrón. 67(2), 1222–1232 (2019).

Artículo de Google Scholar

Yang, X. y col. Observador de perturbaciones basado en un control de modo deslizante integral de inspiración biológica para el seguimiento de trayectorias de robots móviles. Acceso IEEE 7, 48382–48391 (2019).

Artículo de Google Scholar

Chen, WH et al. Un observador de perturbaciones no lineal para manipuladores robóticos. Traducción IEEE. Indiana electrón. 47(4), 932–938 (2000).

Artículo de Google Scholar

Ashokaraj, IAR y cols. Navegación robusta basada en sensores para robots móviles. Traducción IEEE. Instrumento Mío. 58(3), 551–556 (2008).

Artículo de Google Scholar

Xu, X. y col. Un novedoso método de estimación del ángulo de articulación para manipuladores en serie que utiliza sensores mems. Traducción IEEE. Indiana electrón. 67(12), 10610–10620 (2020).

Artículo de Google Scholar

Xia, L. y col. Diagnóstico de fallas de IMU basado en asociación de datos: diseño DBN optimizado y evaluación de robots con ruedas. Acceso IEEE 8, 59618–59636 (2020).

Artículo de Google Scholar

Talebi, HA y Khorasani, K. Detección de fallas de actuador multiplicativo basado en redes neuronales y aislamiento de sistemas no lineales. Traducción IEEE. Sistema de control Tecnología. 21(3), 842–851 (2012).

Artículo de Google Scholar

Vemuri, AT & Polycarpou, MM Diagnóstico robusto de fallas basado en redes neuronales en sistemas robóticos. Traducción IEEE. Red neuronal. 8(6), 1410-1420 (1997).

Artículo CAS Google Scholar

Li, H. y Zhang, L. Un modelo y algoritmo de aprendizaje binivel para redes neuronales de retroalimentación autoorganizadas para la clasificación de patrones. Traducción IEEE. Red neuronal. Aprender. Sistema. 32(11), 4901–4915 (2020).

Artículo de Google Scholar

Paiva, E., Paim, A. & Ebecken, N. Redes neuronales convolucionales y redes de memoria a corto plazo para la clasificación textual de solicitudes de acceso a información. IEEE Lat. Soy. Trans. 19(5), 826–833 (2021).

Artículo de Google Scholar

Gao, Z., Lu, Z., Wang, J., Ying, S. y Shi, J. Un marco basado en una red neuronal convolucional y una red convolucional gráfica para la clasificación de imágenes histopatológicas de mama. IEEE J. Biomed. Informe de salud. 26(7), 3163–3173 (2022).

Artículo de Google Scholar

Bin, Z., Jun, Y. & Wei, Z. Aplicación de una red neuronal de alimentación directa multicapa en el diagnóstico de fallas basada en el algoritmo fbp. 2008 Novena Conferencia Internacional ACIS sobre Ingeniería de Software, Inteligencia Artificial, Redes y Computación Paralela/Distribuida 117–120 (2008).

Sánchez, R., Arpi A. & Minchala, L. Identificación de fallas y clasificación de cajas de engranajes rectos con red neuronal artificial de retropropagación. 2012 VI Congreso Internacional Región Andina 215-215 (2012).

Abdelli, K., Griesser, H., Ehrle, P., Tropschug, C. y Pachnicke, S. Detección y caracterización de fallas de fibras reflectantes utilizando memoria a corto plazo. J. Optar. Comunitario. Neto. 13(10), E32-E41 (2021).

Artículo de Google Scholar

Appiah, AY, Zhang, X., Ayawli, BBK y Kyeremeh, F. Extracción automática de funciones basada en redes de memoria a corto plazo para el diagnóstico de fallas de matrices fotovoltaicas. Acceso IEEE 7, 30089–30101 (2019).

Artículo de Google Scholar

Chen, J. y col. Red neuronal convolucional multiescala con alineación de características para diagnóstico de fallas de rodamientos. Traducción IEEE. Instrumento. Medidas. 70, 1-10 (2021).

Google Académico

Ella, B., Tian, ​​F. y Liang, W. Diagnóstico de fallas basado en una red de codificador automático variacional de convolución profunda. Yi Qi Yi Biao Xue Bao/Chin. J. Ciencias. Instrumento. 39(10), 27–35 (2018).

Google Académico

Dang, L., Nie, Y., Long, C., Zhang, Q. & Li, G. MSR-GCN: Redes de convolución de gráficos residuales de múltiples escalas para la predicción del movimiento humano. 2021 Conferencia internacional IEEE/CVF sobre visión por computadora (ICCV) 11447-11456 (2021).

Liu, R., Wang, F., Yang, B. y Qin, SJ Red neuronal convolucional residual basada en kernel multiescala para el diagnóstico de fallas motoras en condiciones no estacionarias. Traducción IEEE. Indiana Informar. 16(6), 3797–3806 (2019).

Artículo de Google Scholar

Chen, L. y col. Red residual profunda para identificar la ubicación de fallas en los rodamientos y su gravedad al mismo tiempo. Acceso IEEE 8, 168026–168035 (2020).

Artículo de Google Scholar

Chen, Z. y col. Red de adaptación de subdominio profundo residual: un nuevo método para el diagnóstico inteligente de fallas de rodamientos en múltiples dominios. Mec. Mach. Teoría 169, 104635 (2022).

Artículo de Google Scholar

Peng, K. Diagnóstico de fallas de sensores y actuadores para articulaciones de robots basado en CNN profunda. Entropía 23, 751 (2021).

Artículo ADS MathSciNet Google Scholar

Vázquez, LA, Jurado, F. & Castañeda, CE Control neuronal descentralizado en tiempo real mediante retroceso para un brazo robótico impulsado por servomotores industriales. Traducción IEEE. Red neuronal. Aprender. Sistema. 29(2), 419–426 (2018).

Artículo MathSciNet Google Scholar

LeCun, Y., Bengio, Y. y Hinton, G. Aprendizaje profundo. Naturaleza 521 (7553), 436–444 (2015).

Artículo ADS CAS Google Scholar

Wang, J., Mall, S. y Perez, L. La eficacia del aumento de datos en la clasificación de imágenes mediante el aprendizaje profundo (MITPress, 2017).

Google Académico

Si, M., Tarnoczi, TJ, Wiens, BM & Du, K. Desarrollo de un sistema predictivo de monitoreo de emisiones utilizando una biblioteca de aprendizaje automático de código abierto: Keras: un estudio de caso sobre una unidad de cogeneración. Acceso IEEE 7(10), 113463–113475 (2019).

Artículo de Google Scholar

Bengio, Y. Recomendaciones prácticas para el entrenamiento de arquitecturas profundas basado en gradientes. En Neuralnetworks: Tricks of the Trade (eds Montavon, G. et al.) 437–478 (Springer, 2012).

Capítulo Google Scholar

Descargar referencias

Este trabajo fue apoyado por el Programa Nacional Clave de Investigación y Desarrollo de China bajo la subvención 2019YFB1309900.

Instituto de Escuela de Automatización, Universidad de Ciencia y Tecnología de Beijing, Beijing, 100083, China

Jinghui Pan y Kaixiang Peng

Instituto de la Escuela de Ingeniería Mecatrónica y Automatización, Universidad de Foshan, Foshan, 528231, China

Lili Qu

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

Conceptualización, JP; metodología, JP, LQ y KP; software, LQ; validación, JP; análisis formal, KP; investigación, JP y KP; recursos, LQ y KP; curación de datos, JP y LQ; redacción: preparación del borrador original, JP; redacción: revisión y edición, JP y KP; visualización, KP y LQ; supervisión, LQ; administración de proyectos, LQ; adquisición de financiación, LQ y KP Todos los autores han leído y aceptado la versión publicada del manuscrito.

Correspondencia a Jinghui Pan.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado al autor(es) original(es) y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Pan, J., Qu, L. y Peng, K. Método de diagnóstico de fallas de articulaciones de robots basado en redes neuronales residuales profundas. Representante científico 12, 17158 (2022). https://doi.org/10.1038/s41598-022-22171-7

Descargar cita

Recibido: 23 de febrero de 2022

Aceptado: 11 de octubre de 2022

Publicado: 13 de octubre de 2022

DOI: https://doi.org/10.1038/s41598-022-22171-7

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.