Título: Sistemas de clasificación automáticos con confianza y credibilidad en fusión termonuclear
Autores: Makili, Lázaro Emilio
Fecha: 2014
Publicador: Dialnet (Tesis)
Fuente:
Tipo: text (thesis)
Tema: Tesis doctorales
inteligencia artificial
fusión termonuclear
fiabilidad de sistemas
Descripción: En esta Tesis se aborda la problemática de asociar medidas de fiabilidad a las predicciones efectuadas al clasificar datos generados en los dispositivos de fusión termonuclear. Con tal fin, se analiza la aplicación de una serie de clasificadores, implementados en base a la teoría de la predicción conformal, a los datos generados en el estellarator TJ � II, tomándose como caso de estudio un conjunto de imágenes captadas por su diagnóstico de esparcimiento Thomson. Por otro lado, se estudia el problema de la selección de las muestras de datos más adecuadas para implementar un clasificador. Este estudio se realiza desde una perspectiva de aprendizaje activo. Se implementó un algoritmo que permite, con una cantidad reducida de datos, alcanzar en el proceso de clasificación tanto tasas de acierto como medidas de fiabilidad cualitativamente superiores (o al mismo nivel) de las alcanzadas al entrenar los clasificadores con una cantidad de datos mucho mayor, cuando se seleccionan de forma aleatoria. En los dispositivos de fusión, cada vez es más necesario implementar sistemas de aprendizaje automático que puedan funcionar en tiempo real. Por otro lado, la metodología de clasificación utilizada en la Tesis es transductiva, lo que lleva implícita una alta exigencia desde el punto de vista computacional al clasificar los datos. Considerando estos hechos, en la Tesis se ha puesto un énfasis particular en la reducción de la carga computacional en el proceso de clasificación analizado. Para lograrlo se han investigado dos alternativas: (i) la implementación de variantes del método de clasificación y (ii) la reducción del tamaño de los conjuntos de entrenamiento empleados, pero manteniendo siempre la efectividad, en el proceso de clasificación textual en comparación con la visual, seguida de la aplicación de algún algoritmo de fusión tardía o a nivel de decisiones (late fusion) de todos los resultados monomodales (la elección del algoritmo depende de las características de la colección y la tarea). A esta propuesta se le ha denominado Fusión Multimedia Semántica Tardía, o LSMF por sus siglas en inglés (Late Semantic Multimedia Fusion) (Benavent et al., 2013). Tras la experimentación realizada (Benavent et al., 2010) (Granados et al., 2011) se comprueba que con la aproximación LSMF, se cumplen los objetivos planteados al inicio del trabajo, porque se produce una mejora del rendimiento de las soluciones monomodales, a la vez que se simplifica el proceso de búsqueda visual en colecciones de imágenes anotadas, haciendo escalable la tarea sobre grandes colecciones, como se detallará a lo largo de esta memoria.
In this Thesis, the problem of associating reliability measures to automatic classification tasks in thermonuclear fusion devices has been tackled. To this end, a set of classifiers, whose implementation has been based on the conformal prediction theory, have been analyzed and applied to data generated in a specific fusion device, the TJ � II stellarator. In particular, the focus has been put on the set of images corresponding to the TJ � II�s Thomson scattering diagnostic. Also, it is important to note that the big amount of data stored in the databases of fusion devices makes essential the problem of selecting the most suitable samples to train a classifier. The aforementioned problem has been tackled in this Thesis from an active learning perspective. An active learning algorithm has been implemented to allow, with a reduced amount of training data, reaching both success rates and reliability measures that are better than, or as good as, the ones reached training the classifiers using a much bigger amount of randomly selected data. In fusion devices, more and more needs of real time signal classification are present. Bearing this kind of requirement in mind, methodologies for the reduction of the computational overload in the classification processes have been emphasized in this Thesis. This goal has been reached by two different ways. On the one hand, the implementation of variants of the classification method has been taken into account. On the other hand, the use of reduced but effective training sets has been analyzed.
Idioma: spa