1. Introducción
En las últimas décadas se ha buscado descifrar la forma en que se genera el movimiento musculo esquelético haciendo énfasis en el control de movimientos precisos como los realizados por las manos, siendo parte indispensable en el actuar y en la vida diaria de una persona. Se ha intentado entender qué tipo de control aplica el sistema nervioso central para controlar el movimiento naturalmente. Actualmente es de interés conocer estos mecanismos ya que permitirían generar sistemas protésicos multifuncionales, generar o mejorar terapias de rehabilitación o generar sistemas de control más intuitivos para dispositivos electrónicos y aplicaciones. Como se menciona en [1] el principal objetivo en la robótica de rehabilitación es desarrollar un sistema que pueda decidir cuál es la intención de movimiento deseada por el usuario para efectuar sus actividades diarias. Con este objetivo se planteó la necesidad de analizar las señales musculo esqueléticas, como estas se generan, como se pueden adquirir de la forma más fiel posible para su posterior análisis, que tan importante es el lugar de adquisición [2,3], con qué tipo de sistema podría realizarse una buena adquisición de datos de electromiografía [4], que tipo de resolución es necesaria en los datos para extraer la información necesaria, que tipo de métodos son los adecuados para extraer la información que harían que los movimientos se vuelvan diferenciables entre sí [5, 6], en fin hasta ahora se conocen algunas pistas sobre la generación y la naturaleza de esta señal, sin embargo también se sabe que el camino para entender este complejo sistema de control es aún largo y trabajos como este permiten entender un poco más el panorama general de estos mecanismos. Existen trabajos que se han encargado de dividir y clasificar los diferentes movimientos de la mano, se sabe que los movimientos podrían ser casi indiferenciables o completamente diferenciables dependiendo del movimiento realizado, se ha descrito en [1] que la taxonomía de los movimientos de la mano es importante para una amplia gama de campos en la ciencia, rehabilitación, control de dispositivos, de aplicaciones de prótesis y robótica. Existen trabajos que intentan crear clasificaciones ordenadas y jerárquicas de los movimientos en función a la electromiografía como se describe en [7,8], otros trabajos tratan de crear estas clasificaciones de movimiento no solo con electromiografía sino utilizando los datos de la cinemática del movimiento de cada una de las articulaciones de la mano como en [1,9], para generar clasificaciones de los movimientos realizados. Es importante mencionar que este tipo de clasificaciones describirán las semejanzas entre grupos de movimientos, permitiéndonos seleccionar movimientos que sean lo más diferenciable posible, para de esta forma facilitarles el trabajo a los clasificadores. También encontramos trabajos donde se encargan de categorizar y numerar las actividades y los movimientos de mano que más son utilizados en el día por una persona [7]. Es necesario contar con estas consideraciones para planear los movimientos considerados dentro de una base de datos. Sabiendo que las prótesis multifuncionales pueden actualmente reproducir un número limitado de movimientos.
En este trabajo se plantea evaluar 2 bases de datos libres conocidas por los integrantes de la comunidad científica que estudian los movimientos de la mano. Esto con el fin de analizar la forma en que podríamos controlar el movimiento artificialmente. Es bien sabido que aún no se define una forma eficaz de controlar el movimiento a partir de señales musculares, sin embargo, poco a poco se ha avanzado en el descubrimiento de nuevas pistas para llegar al entendimiento del control muscular. Si bien es cierto que ha habido muchos trabajos para desarrollar clasificadores a través de aprendizaje automático, muchos de los resultados generados son aplicables solamente a un ambiente de laboratorio, sin poder llegar a un uso fuera de un ambiente controlado.
2. Estado del arte
La electromiografía son registros de la actividad eléctrica de los músculos como un efecto de las contracciones realizadas, con estas señales se han realizado estudios enfocados a descubrir la forma en que se realiza el control muscular con el fin de generar controles artificiales de los movimientos de la mano. Por lo cual se ha buscado analizar los movimientos desarrollando modelos matemáticos para clasificarlos, para crear estos modelos es necesario contar con datos, sin embargo, algunos grupos de investigación se enfocan a desarrollar dispositivos de adquisición [6,8], otros cuentan con dispositivos comerciales especializados [11-13], pero la gran mayoría hace uso de bases de datos publicadas por estos dos grupos de investigaciones donde se prueba y analiza la información proporcionada [14-17]. Por lo tanto, actualmente hay un número limitado de bases de datos, de las cuales podemos categorizarlas en función a sus características, ventajas y desventajas. Una base de datos de electromiografía de miembro superior se define con: la ubicación y tipo de mediciones adquiridas ya se en brazo, antebrazo o mano, con contracciones isométricas o isotónicas, con datos que involucran a un sujeto (intra sujetos) o a un conjunto de ellos (inter sujetos), con el tipo de movimiento ya sean movimientos generales de la posición de brazo o antebrazo, de la muñeca o movimientos básicos de la mano (como flexiones de cada uno de los dedos), o diferentes tipos de agarre que son movimientos más especializados, si estas consideran sujetos sanos o con alguna disfuncionalidad ejemplos de estas pueden ser encontradas en [18-21]. De igual forma podemos encontrar diferencias en las bases de datos como la cantidad de repeticiones para cada movimiento en un mismo día (sesión) o sesiones en diferentes días considerando las pequeñas variaciones en la colocación de los electrodos, la duración de los movimientos, las frecuencias de las señales EMG de interés, la frecuencia de muestreo utilizada, entre otras características. El desarrollo y uso de base de datos libres es fundamental para el avance de la investigación en electromiografía. El uso de base de datos tiene justificaciones validas, desde la falta de equipo para desarrollar mediciones para investigación en el campo hasta las comparaciones de resultados entre diseños experimentales, replicación de experimentos, prueba de nuevos métodos de extracción de información o nuevos algoritmos de clasificación. Como se ha descrito en trabajos anteriores las señales EMG son sensibles a muchos factores que van desde la posición de los electrodos, el estado fisiológico muscular que es único en cada caso/individuo, la fuerza de contracción generada en cada movimiento, entre otros.
En [1] se hace uso de una base de datos publicada donde establecen una categorización de los diferentes agarres de mano, y se establece que se pueden clasificar 5 tipos de agarres en función a: la forma del agarre, el posicionamiento de los dedos, y la activación muscular, establecen una coincidencia con resultados anteriores apoyándose con sinergias musculares. Este estudio es importante para nuestro trabajo porque nos permite definir la semejanza en diferentes tipos de movimientos, si dos movimientos pertenecen a una misma categoría difícilmente podrán ser diferenciados. La inspección desde el punto de vista fisiológico de los movimientos de la mano, de su taxonomía es necesaria para descubrir sinergias musculares, es decir la forma en la que suceden las contracciones musculares para realizar la infinita cantidad de movimientos posibles y que son necesarios en la vida real. En [7] se genera un estudio de las sinergias musculares en función a datos cinemáticos de las articulaciones de la mano, ellos utilizan análisis de componentes principales para analizar los movimientos de la mano y proponen como resultados obtenidos que la variabilidad de los ángulos medidos corresponde a unas pocas sinergias musculares dentro de los movimientos analizados. También mencionan que las sinergias musculares no coincidieron con la taxonomía del agarre. Múltiples estudios respaldan un hecho fisiológico normal, las proporciones anatómicas musculares son diferentes para cada individuo, por lo tanto, las señales de un mismo movimiento serán distintas en proporción entre sujetos, en [17] se observa como el porcentaje cae bruscamente al momento de crear modelos de clasificación intra sujeto e intersujetos. Ellos utilizan la base de datos Ninapro y describen también como se construyó dicha base. En [17] se establece que la teoría de sinergias musculares es más probable que suceda en lugar de que el sistema nervioso central active cada uno de los músculos por separado, para el control del movimiento. También se menciona que a pesar de la disponibilidad de métodos de extracción de las sinergias musculares aún no se define cual es el mejor método para hacerlo. Con los diferentes trabajos desarrollado a partir de bases de datos disponibles como CapgMyo, Ninapro dataset, podría pensarse que hay material para dilucidar más la información que se tiene hasta ahora. En este sentido encontramos trabajos como [17] donde evalúan algunos métodos de extracción de sinergias musculares, y comparan sus resultados con los obtenidos con otras investigaciones. En [22,23] se realizan estudios sobre las sinergias musculares en función a datos cinemáticos del movimiento de las manos. Existen 2 bases de datos que se utilizaran en este estudio CapgMyo Database y The Ninapro Project.
2.1 Base de datos CapgMyo
En [24] se creó una base de datos “CapgMyo Database” para el reconocimiento de gestos de la mano, esta incluye 3 sub bases de datos con diferentes propósitos (Db-a, Db-b, Db-c), esta base de datos nació a partir del deseo que contar con una base de datos estandarizada y de libre acceso, tenía como objetivo hacer un mapeo espacial y temporal de las señales eléctricas musculares ante diferentes movimientos. Es importante señalar que en esta base de datos se realizaron mediciones inter e intra sujetos. Además, se consideró la diferencia que puede tener las señales EMG cuando son tomadas en diferentes días, por lo que se estableció generar sesiones en diferentes días, con no más de una semana de diferencia, en esta situación se tiene contemplado que los electrodos se colocaron con una posición ligeramente diferente para cada sesión.
La configuración de la adquisición fue realizada a través de un arreglo de 8 x 2 electrodos, con 8 módulos de adquisición dejando como total 128 electrodos, dichos módulos fueron colocados alrededor de antebrazo. Más información sobre la localización de los módulos puede ser encontrada en [24]. La base de datos b (Db-b) consta de mediciones de 10 sujetos, cada sujeto realizó dos sesiones en diferentes días, los movimientos evaluados fueron 8. Se ofrecen 2 paquetes de datos los crudos y los preprocesados, en esta investigación se trabajó con los datos crudos.
2.2 Ninapro Project
En [25] se localiza la información referente a este proyecto donde se puede observar y descargar las sub-bases de datos disponibles, Ninapro Project es una base de datos de las más completas y robustas desarrolladas, este proyecto a la fecha costa de alrededor 10 sub-bases de datos, cada una desarrollada y creada con un objetivo. Esta base de datos cuenta con datos de electromiografía superficial (EMGs) y de movimiento cinemáticos de los dedos adquiridos con un guante Cyberglobe II.
En [26] se desarrolla la Sub-base de datos 1 la primer sub-base de datos generada de este proyecto, cuenta con 10 repeticiones de 52 movimientos de 27 sujetos sanos, además cuenta con 3 tipos de ejercicios: “Movimientos básicos de los dedos”, “Movimientos isométricos, isotónicos y movimientos de la muñeca” y “Agarre y movimientos funcionales”. En esta base de datos 8 electrodos son uniformemente espaciados con una banda elástica debajo de la articulación del codo, también se hace uso de un inclinometro y de un guante cyberglobe para monitorear la cinemática de la mano. Dos electrodos adicionales son colocados sobre músculos flexores y extensores de la mano. Cada repetición de movimiento dura 5 segundos y va seguida de 3 segundos de descanso para evitar fatiga. Un detalle importante en esta adquisición fue que la secuencia de movimientos no está aleatorizada, para inducir activaciones inconscientes de los músculos involucrados. Uno de los puntos interesantes en esta base de datos es que utilizan un sistema de reetiquetado y solo limitan la clasificación de las señales que superan cierto umbral de actividad eléctrica muscular para luego decir que las que no están en un estado de reposo, de esta forma se evitan que el estado de reposo sea etiquetado como una postura definida [26]. El objetivo de [26] es evaluar la variabilidad entre sujetos, entre repeticiones y entre movimientos.
En [1] se utilizó la base de datos ninapro 2 que recolecta los datos de 40 sujetos, la base de datos cuenta con 50 movimientos de la mano y la muñeca incluyendo movimientos básicos, y 20 tipos de agarre. A diferencia de otras bases de datos esta cuenta con información cuantificables del movimiento de las articulaciones de los dedos, al mismo tiempo que se realizaron las adquisiciones de la electromiografía en la reproducción del movimiento. Los electrodos utilizados son doble diferenciales. La actividad muscular fue medida usando el Sistema inalámbrico 2 kHz con un ruido base menor a 750 nV RMS. Se consideraron 8 electrodos alrededor de antebrazo en la sección proximal, aparte de 4 electrodos extras ubicados en el bíceps, tríceps, en el extensor digitorum superficialis, y flexor digitorum superficialis. Esta es una estrategia comúnmente utilizada en área prostética. Uno de los puntos interesantes de esta base de datos es la posibilidad de realizar un análisis sobre uno de los puntos que afirman, que la posición de los electrodos no es importante en tareas de reconocimiento. Cada sujeto realizo 6 repeticiones de 49 movimientos más el descanso, cada repetición duro 5 segundos más 3 segundos del descanso. La cinemática de la mano fue medida usando un sensor con 22 sensores CyberGlobe II (CyberGlove Systems LLC 2), proporcionando datos de los ángulos de las articulaciones muestreado a una frecuencia de muestreo ligeramente menor a 25Hz. Se eliminó la frecuencia de la línea de potencia de 50 Hz con un filtro hampel. Se utilizó interpolación lineal posprocesamiento para nivelar los datos de los ángulos cinemáticos con las señales EMG registradas.
3. Metodología
3.1 Base de datos seleccionada
Las dos bases de datos evaluadas cuentan con datos intra sujeto e intersujeto, se seleccionó la sub-base de datos Db-b de CapgMyo y la base de datos 2 de Ninapro, ambas comparten posiciones comunes de electrodos y movimientos semejantes. En esta sección se evaluará el uso de estas bases de datos para comparar los resultados sin ningún tipo de procesamiento de las señales EMG crudas, junto a una conversión de espacio con PCA, ICA y sus rendimientos evaluados con modelos de aprendizaje automático con respecto a los datos crudos.
Considerando que frecuentemente las investigaciones pasan directamente a la prueba de estrategias o preprocesamientos con modelos novedosos, en este trabajo se plantea utilizar estrategias simples y menos costosas computacionalmente. Se tiene claro que una estrategia clásica para la generación de modelos de clasificación es la mostrada en la figura 1, a partir de esta se decidió realizar dos tipos de análisis, uno con el objetivo de demostrar el rendimiento que pueden generar los datos crudos en tareas de clasificación y otro con el objetivo de evaluar el mismo porcentaje de reconocimiento obtenido después de transformar los datos crudos a un nuevo espacio PCA e ICA con algoritmos de aprendizaje automático clásicos. La tabla 1 muestra los movimientos considerados en cada una de las bases de datos.
Capgmyo | Ninapro | |
---|---|---|
Sujetos | 1-5 | 1-5 |
Edades de sujetos involucrados | 23 a 26 años | 29.9±3.9 años |
Numero de electrodos | 128 | 12 |
Relación datos mov vs reposo | 32.96% movimientos 67.02% reposo | 48.53% movimientos 51.46 reposo |
Movimientos considerados | 11 Movimientos | 18 Movimientos |
0 | Reposo | Reposo |
1 | Levantar el pulgar | Levantar el pulgar |
2 | Extensión del índice y medio, flexión de los otros | Extensión del índice y medio, flexión de los otros |
3 | Flexión del anular y meñique, extensión de los otros | Flexión del anular y meñique, extensión de los otros |
4 | Pulgar oponiéndose a la base del meñique | Pulgar oponiéndose a la base del meñique |
5 | Abducción de todos los dedos | Abducción de todos los dedos |
6 | Dedos flexionados juntos en puño | Dedos flexionados juntos en puño |
7 | Índice de señalamiento | Índice de señalamiento |
8 | Aducción de los dedos extendidos | Aducción de los dedos extendidos |
9 | Abducción de todos los dedos con máxima fuerza | Supinación de la muñeca (eje dedo medio) |
10 | Dedos flexionados juntos en puño (con máxima fuerza de contracción) | Pronación de la muñeca (eje: dedo medio) |
11 | Supinacion de la muñeca (eje: dedo meñique) | |
12 | Pronacion de la muñeca (eje: dedo meñique) | |
13 | Flexion de la muñeca | |
14 | Extension de la muñeca | |
15 | Desviacion radial de la muñeca | |
16 | Desviacion ulnar de la muñeca | |
17 | Extensión de la muñeca con la mano cerrada |
3.2 Análisis de datos con aprendizaje automático
Como se ha descrito en [5] un procesamiento típico utilizado para generar modelos de clasificación basado en datos, podría representarse como una secuencia de etapas donde los datos van sufriendo modificaciones sin alterar la información relevante de estos. Iniciando con el conjunto de datos que se desea analizar, su acondicionamiento (preprocesamiento) para poder extraer la información más relevante posible, luego cuando la información obtenida permita la mejor discriminación entre clases se hace uso de algoritmos de aprendizaje automático como Naive Bayes, Análisis discriminante lineal y cuadrático o métodos más robustos como redes neuronales y máquinas de soporte vectorial (SVM), generando de esta forma modelos de clasificación basados en datos, este tipo de procesos puede visualizarse en la Figura 1. En [26] se utiliza la base de datos 1 de Ninapro para generar modelos de clasificación útiles en el área de prótesis, utilizan varios clasificadores donde hacen uso de solo dos características que han sido reportadas en [29] como buenas descriptoras de las señales EMG la longitud de onda (WL), la varianza (VAR) y valor absoluto medio (MAV), para extraer la información y generar modelos de clasificación.
3.3 Visualización de la distribución de los datos
En el mundo del análisis de los datos siempre es recomendable visualizarlos, pare encontrar patrones, distribuciones que en algunas ocasiones saltan a la vista sin que los métodos de procesamiento y extracción de la información pueda no detectar. Esto puede no ser practico cuando tenemos datos multivariados, sin embargo, se han desarrollado métodos para agrupar o reagrupar la información en un número menor de variables, como lo es el análisis de componentes principales (PCA) y el análisis de componentes independientes (ICA), métodos que han sido utilizados en el análisis de señales de electromiografía [27]. Mismos métodos que utilizan estrategias estadísticas para hacer trasformaciones lineales de los datos y que han sido utilizados con varios propósitos, visualización, reducción de la dimensionalidad y separación ciega de fuentes.
3.4 Separación ciega de fuentes (BSS)
La separación ciega de fuentes es un problema típico en ingeniería que puede presentarse en problemas generales clásicos como separación de las diferentes fuentes de sonido que están involucradas en una pista de audio, hasta más específicamente la separación de los componentes musculares que encontramos en un registro de electromiografía.
Existen varias técnicas para resolver este problema desde aplicar un análisis de componentes principales (PCA), análisis de componentes independientes (ICA) o variaciones de estos. Tanto PCA como ICA han sido utilizado en señales biomédicas, señales de audio y en imágenes, por decirlo de alguna forma ICA es considerado una extensión de PCA. PCA optimiza la matriz de covarianza a diferencia de ICA que maximiza la estadística de alto nivel como la kurtosis. PCA encuentra componentes no correlacionados, ICA componentes independientes. Una descripción más detallada puede ser encontrada en [28].
3.5 Análisis de componentes principales (PCA)
PCA es una técnica de análisis de datos, que trata de reducir la información redundante de la señal para poder observar la distribución de los datos, generalmente se utiliza para extraer la información importante de la señal, es una técnica de reducción de la dimensionalidad que trata de mantener toda la información posible. El método adquirió importancia gracias a las técnicas de visualización, que nos permite entender cómo se distribuyen los datos. El método trasforma los datos originales a un nuevo espacio donde existen los componentes principales, estos componentes son simples combinaciones lineales de las variables originales.
Aunque actualmente podemos encontrar variaciones en el método de PCA, sabemos que la estrategia original nos permite descubrir información relevante, y dada su simplicidad es posible llevar estas operaciones al mundo de la instrumentación biomédica. Es decir, las operaciones son tan simples que pueden ser implementadas en microcontroladores. PCA es utilizado para visualización, para selección de características y para describir tendencias en los datos. Este método ha sido utilizado junto a técnicas de aprendizaje automático para tratar de clasificar movimientos como se establece en [30].
Pasos para modelar el PCA
Obtener los datos
Calcular la media de los datos
Calcular la matriz de covarianza
Calcular los eigenvectores y eigenvalores de la matriz de covarianza
Determinar los componentes totales y cuáles son los de mayor peso
Ordenarlos
Se crea el nuevo conjunto de datos:
3.6 Análisis de componentes independientes (ICA)
El análisis de componentes independientes es una técnica de trasformación lineal de datos al igual que la anterior, es ampliamente utilizada en problemas de separación ciega de fuentes, en [31] la utilizan para extraer los componentes independientes de los datos de electromiografía, sigue el mismo principio que el anterior, se busca separar los datos en componentes independientes. En [28] se da una introducción al método con más detalle.
3.7 Aprendizaje automático
El aprendizaje automático como una rama de la inteligencia artificial es una de las herramientas actualmente más utilizadas para generar modelos de clasificación a partir de datos, en este trabajo se utilizan los datos de 2 bases de datos, los cuales se cargan en una plataforma de computo numérico y programación para preprocesarlos, se crean modelos de clasificación sin ningún tipo de procesamiento, posteriormente se toman los datos crudos y se convierten a nuevos espacios con PCA e ICA donde los datos ya transformados se utilizan para crear nuevos modelos de clasificación, el diagrama puede observarse en la Figura 2.
3.7.1 Algoritmos de clasificación
Los algoritmos utilizados en este trabajo fueron dos clásicos: el análisis discriminante lineal (LDA) y al análisis discriminante cuadrático (QDA), los dos son métodos de clasificación supervisados nos permiten generar modelos de clasificación con una función lineal o cuadrática respectivamente con bases en lógica bayesiana. Aunque actualmente existen trabajos con métodos más sofisticados [32, 33] se optó por visualizar el desempeño de los clasificadores clásicos frente a los datos crudos y procesados con PCA ICA. En este trabajo se utilizó un método para validar los resultados de los clasificadores, utilizando la validación cruzada que permite asegurar que los resultados son independientes de la partición de los datos, la validación cruzada, establece que todos los datos se utilizaran como datos de entrenamiento, y datos de prueba.
3.7.2 Validación cruzada
Validación cruzada es un método de validación de resultados utilizado para comprobar que los resultados son independientes de la partición de los datos, es decir que todos los datos se utilizan para entrenamiento y prueba de los modelos de clasificación creados, siendo estas particiones mutuamente excluyentes, se hace una división de los datos en 10 partes donde 9 de ellas se utilizan para entrenamiento y 1 para prueba, el procedimiento se realiza 10 veces donde todos los datos son utilizados, como resultado final tenemos 10 porcentajes de reconocimiento de los 10 modelos creados, la figura 3 describe este procedimiento [34].
4. Resultados
Datos crudos intrasujetos con aprendizaje automático
Como resultados se obtuvieron los porcentajes de reconocimiento de los modelos de clasificación creados a partir de las bases de datos. En esta sección se describen estos porcentajes (sin procesamiento) de las dos bases de datos para los primeros 5 sujetos considerando: la cantidad total de repeticiones, para todos los movimientos pertenecientes a cada sub-base de datos. Es importante resaltar que todos los resultados aquí mostrados fueron un promedio después de aplicar validación cruzada 10x10.
La tabla 2 nos permite observar los resultados que nos proporcionan los modelos de clasificación obtenidos a partir de la base de datos de CapgMyo sub-base de datos Db-b, con 11 clases de movimientos incluido mano en reposo, se observa que en promedio se tiene para LDA un porcentaje de reconocimiento de 66.95% y para QDA un 82.04%.
CapgMyo | LDA | QDA |
---|---|---|
Sujeto 1 | 67.3061 | 84.1489 |
Sujeto 2 | 64.8934 | 82.8044 |
Sujeto 3 | 68.5835 | 82.7925 |
Sujeto 4 | 65.7989 | 72.5363 |
Sujeto 5 | 68.1883 | 87.9335 |
Promedio | 66.9540 | 82.0431 |
La tabla 3 muestra los porcentajes de reconocimiento para la base de datos de Ninapro DB-2 con 23 clases de movimientos con un promedio entre sujetos evaluados de 55.96% para QDA y un 51.50% para LDA. Se observa que los datos que mejor se encuentran diferenciados son los del sujeto 5 para el modelo de LDA y el sujeto 1 para el modelo generado por QDA.
Ninapro | LDA | QDA |
---|---|---|
Sujeto 1 | 58.7204 | 64.0862 |
Sujeto 2 | 50.1610 | 55.7999 |
Sujeto 3 | 52.1940 | 58.139 |
Sujeto 4 | 36.5924 | 40.3644 |
Sujeto 5 | 59.8450 | 61.4295 |
Promedio | 51.5026 | 55.9639 |
Dentro de la metodología se plantea una segunda mitad de la experimentación donde los datos crudos son trasladados a nuevos espacios con PCA e ICA en la tabla 4 se puede observar los efectos de estas transformaciones de los datos. Se observa el desempeño de la base de datos de CapgMyo donde PCA e ICA tuvieron resultados muy semejantes tanto para LDA como para QDA, sin embargo, vemos que los datos generados con los modelos cuadráticos son superiores a los generados con los modelos lineales.
Capgmyo | LDA | QDA | ||
---|---|---|---|---|
PCA | ICA | PCA | ICA | |
Sujeto 1 | 66.9 | 66.94 | 84.21 | 84.2 |
Sujeto 2 | 65.27 | 65.07 | 82.8 | 82.66 |
Sujeto 3 | 64.45 | 68.88 | 90.02 | 89.77 |
Sujeto 4 | 65.75 | 65.97 | 86.29 | 86.31 |
Sujeto 5 | 64.65 | 64.23 | 88.35 | 88.24 |
Promedio | 65.404 | 66.218 | 86.334 | 86.236 |
En la tabla 5 se observa el desempeño de los clasificadores seleccionados con la base de datos de ninapro, vemos que los valores de PCA en QDA son ligeramente superiores a los obtenidos con PCA y LDA.
Ninapro | LDA | QDA | ||
---|---|---|---|---|
PCA | ICA | PCA | ICA | |
Sujeto 1 | 59.0025 | 59.02 | 64.2293 | 64.2298 |
Sujeto 2 | 50.1228 | 50.21 | 55.5666 | 55.54 |
Sujeto 3 | 52.3421 | 52.01 | 58.2684 | 58.232 |
Sujeto 4 | 36.3294 | 36.30 | 40.3645 | 40.3342 |
Sujeto 5 | 59.4990 | 58.90 | 66.1234 | 65.1211 |
Promedio | 51.4591 | 51.288 | 56.9104 | 56.6914 |
Figura 4. Matriz de confusión del mejor porcentaje de reconocimiento obtenido.
5. Discusión
En este trabajo se buscó examinar la variabilidad muscular y como esta afecta a los porcentajes de reconocimiento de los modelos de clasificación de movimientos de mano, creados utilizando datos crudos de la actividad eléctrica muscular de antebrazo. Si tomamos como una variable de respuesta el porcentaje de reconocimiento obtenido de los modelos de clasificación creados, podemos decir que la variabilidad de las señales EMG afectan directamente a los resultados obtenidos, razón por la cual se busca tratar esta variabilidad para que no afecte a los modelos de clasificación, lo que generalmente se realiza es definir operadores y aplicar estas estos a ventanas de tiempo de datos, lo que genera un retraso en el tiempo y un costo computacional extra, en este trabajo se compararon los resultados obtenidos sin ningún tipo de retraso, y considerando una operación de trasformación a un nuevo espacio lo que conllevaría un costo computacional extra, y un tiempo de procesamiento. Nuestro trabajo utiliza dos tipos de procesamiento uno con los datos crudos y otro con los datos transformados al espacio de PCA e ICA. Los resultados obtenidos muestran un bajo porcentaje de reconocimiento comparado con otras investigaciones, sin embargo, contamos con porcentajes rondando el 82% de reconocimiento sin ningún tipo de procesamiento extra, solo con las operaciones que requiere el clasificador para dar una respuesta y con 86% agregando una operación matricial de trasformación a un nuevo espacio (PCA). El objetivo de evaluar PCA e ICA era determinar si estas operaciones aplicadas a los datos crudos de EMG mejorarían los porcentajes de reconocimiento de forma significativa, se observó que hubo un aumento de 4% en promedio para PCA.
Hay varios factores que pueden perjudicar a los modelos de clasificación creados como, la calidad y cantidad de los datos de entrada, el número de movimientos considerados, el número de electrodos utilizados y la posición de estos, parámetros que pueden ser analizados en este estudio.
Como se describió se analizaron 5 sujetos de cada una de las bases de datos, la base de datos 2 de CapgMyo considera 11 movimientos incluida la clase del movimiento de mano en estado de reposo, dicha base de datos se obtuvo a través de 128 electrodos, con porcentajes de reconocimiento superiores en los dos rutas analizadas (sin procesamiento y con procesamiento) con respecto a la base de datos de Ninapro, donde se consideran un total de 18 movimientos incluidos el movimiento de mano en estado de reposo, con una adquisición con 8 electrodos colocados en antebrazo. Un punto importante en este tipo de trabajos que generalmente no se discute es la información que le proporcionamos al modelo en este caso la base de datos, en este estudio se observa una diferencia significativa entre los datos generados para la clase de movimiento 0 (la mano en reposo) y las distintas clases de movimiento analizadas, se observa que para la base de datos de CapgMyo se obtuvo en promedio del total de los datos un 67.02% datos de reposo y un 32.96% datos para las 10 clases restantes, a diferencia de los datos de Ninapro que fueron en promedio el 51.46% datos de reposo y 48.53% para datos de las 17 clases restantes, como se observa la mayoría de los datos proporcionados son datos de señales EMG en reposo, esto impacta directamente en los porcentajes de reconocimiento de los datos. En la tabla 1 se puede notar que los primeros 8 movimientos son idénticos para las dos bases de datos superando el número de movimientos desde la clase 9 a la 17, movimientos que involucran a la muñeca. Los porcentajes superiores se pueden atribuir a los parámetros considerados, la cantidad de movimientos, el número de electrodos y a la distribución de los datos reposo contra movimientos.
El utilizar bases de datos libres bajo estos propósitos permite difundir y dar a conocer las bases disponibles en la red, de igual forma al ejecutar nuevas estrategias de procesamiento se va formando un compendio de herramientas que la comunidad científica puede aprovechar. En función a los resultados podemos analizar varios puntos. Los modelos de clasificación cuadráticos separan mejor los datos de EMG crudos que los lineales. Al menos para los datos crudos se observa que los algoritmos para trasformar los datos a nuevos espacios no ayudan ni perjudican a mejorar o reducir los porcentajes de reconocimiento para clasificadores lineales y cuadráticos, sin embargo, pueden ser útiles reducir la dimensionalidad de los datos para poder observarlos en tres dimensiones. Debido a la semejanza de las mediciones de la electromiografía, a la forma en la que se distribuyen los datos y a su apariencia cuasi estocástica, los modelos lineales son ineficientes y los cuadráticos apenas podrían llegar al 80% de clasificación que es bajo si estamos hablando de aplicar esos clasificadores a dispositivos de grado médico. Es necesario extraer información relevante escondida en estas señales, podríamos utilizar algunas medidas de señales para preprocesar los datos, hasta ahora se sabe que existen algunas características que hacen a los movimientos más diferenciables entre sí, lo que conlleva a procesamiento extra y podría tener consecuencias en la complejidad de las operaciones lo que conlleva un aumento en el costo computacional requerido.
Como trabajo futuro se planea continuar evaluando estas bases de datos, ya que nos permiten realizar una sincronización entre las señales EMG y los movimientos cinemáticos de las articulaciones. De igual forma una base de datos como CapgMyo donde tenemos alrededor de 128 electrodos, una electromiografía de alta resolución junto a los datos cinemáticos y a los registros de EMG sería posible ejecutar un algoritmo de selección secuencial hacia adelante para ver que electrodos son los que más ayudan a la diferenciación de las clases de movimientos, y de esta forma determinar las posiciones que ocupan esos electrodos. De esta forma tenemos posición de los electrodos, registro EMG y movimiento cinemático generado.
6. Conclusiones
La variabilidad muscular entre individuos es uno de los principales impedimentos para que los modelos de clasificación logren resultados reproducibles tanto dentro como fuera del laboratorio.
La diferencia entre los parámetros de las bases de datos evaluadas como lo es la cantidad de electrodos utilizados, el número de movimientos evaluados, la cantidad de datos utilizados para los movimientos evaluados, y los tipos de movimientos son los factores que intervienen en las diferencias de los porcentajes de reconocimientos.
La utilización de bases de datos en línea facilita la adquisición de conocimiento, ya que ofrece un vasto abanico de posibilidades en cuanto a cómo se pueden procesar los datos. En consecuencia, cuanto más se profundice en el estudio de una base de datos, mayores serán los resultados obtenidos.
Los modelos de clasificación lineales no son adecuados para trabajar con los datos crudos de las señales EMG. Aunque los algoritmos de PCA e ICA no ayudaron a mejorar el porcentaje de reconocimiento, estos permiten realizar una reducción de la dimensionalidad de los datos sin perder información relevante.
Los modelos de clasificación cuadrático son capaces de discriminar entre movimientos, sin embargo, el porcentaje de reconocimiento que alcanzan no es suficiente para dispositivos médicos.