Diseño de métodos de cuantificación aplicados a la estimación de la distribución de los grupos taxonómicos presentes en muestras de plancton
Autor(es) y otros:
Director(es):
Centro/Departamento/Otros:
Palabra(s) clave:
Inteligencia artificial
Visión artificial
Redes neuronales
Fecha de publicación:
Descripción física:
Resumen:
En las últimas décadas se han desarrollado nuevos dispositivos automáticos para la captura de muestras de plancton como por ejemplo la Imaging FlowCytobot o la FlowCam. Estos dispositivos son capaces de capturas miles de imágenes de plancton de manera automática y desatendida. El procesamiento manual de estas muestras se convierte en una tarea imposible y por tanto se necesitan desarrollar nuevos métodos automáticos y eficientes para el procesamiento de dichas muestras. En la actualidad existen multitud de estudios que han abordado este problema desde el punto de vista de la clasificación automática y la visión artificial. El enfoque usado generalmente es analizar las imágenes con técnicas de visión artificial para luego aprender un modelo utilizando un conjunto de entrenamiento etiquetado manualmente. Este modelo será utilizado para clasificar los ejemplos de nuevas muestras capturadas por los dispositivos citados anteriormente. En este tipo de enfoques, los algoritmos utilizados para construir el modelo son algoritmos de clasificación cuyo objetivo principal es clasificar entre diferentes clases cada una de las imágenes de plancton presentes en la muestra. Utilizando este enfoque surgen tres cuestiones principales: 1. Los biólogos marinos muchas veces están interesados en la distribución de las clases de los organismos presentes en una muestra de plancton, no siendo interesante la clasificación individual de los organismos, sino el resultado agregado. 2. La distribución del plancton cambia enormemente de manera temporal y espacial. Los algoritmos de clasificación no están pensados para manejar esta variabilidad y es necesario el uso de algoritmos pensados específicamente para este tipo de problemas. 3. Debido al punto anterior, suele ocurrir que los métodos de validación tradicionales como la validación cruzada sobrestiman la eficacia de los modelos obtenidos, y cuando estos sistemas se aplican en producción, se obtengan unos resultados mucho peores que los estimados a priori. Los puntos anteriores nos llevan a explicar las principales contribuciones de esta tesis: 1. Revisión de todos los métodos de cuantificación existentes y sus principales usos y aplicaciones. 2. Establecimiento de métodos de validación adecuados para evaluar correctamente los métodos de cuantificación y obtener medidas reales y que además nos permitan evaluar de manera precisa el sistema. 3. Aplicación de métodos de cuantificación y las técnicas de validación desarrolladas al problema real del plancton, usando para ello las últimas técnicas disponibles en visión artificial (redes neuronales convolucionales) y con un conjunto de datos real perteneciente al Woods Hole Oceanographic Institution de Massachusets.
En las últimas décadas se han desarrollado nuevos dispositivos automáticos para la captura de muestras de plancton como por ejemplo la Imaging FlowCytobot o la FlowCam. Estos dispositivos son capaces de capturas miles de imágenes de plancton de manera automática y desatendida. El procesamiento manual de estas muestras se convierte en una tarea imposible y por tanto se necesitan desarrollar nuevos métodos automáticos y eficientes para el procesamiento de dichas muestras. En la actualidad existen multitud de estudios que han abordado este problema desde el punto de vista de la clasificación automática y la visión artificial. El enfoque usado generalmente es analizar las imágenes con técnicas de visión artificial para luego aprender un modelo utilizando un conjunto de entrenamiento etiquetado manualmente. Este modelo será utilizado para clasificar los ejemplos de nuevas muestras capturadas por los dispositivos citados anteriormente. En este tipo de enfoques, los algoritmos utilizados para construir el modelo son algoritmos de clasificación cuyo objetivo principal es clasificar entre diferentes clases cada una de las imágenes de plancton presentes en la muestra. Utilizando este enfoque surgen tres cuestiones principales: 1. Los biólogos marinos muchas veces están interesados en la distribución de las clases de los organismos presentes en una muestra de plancton, no siendo interesante la clasificación individual de los organismos, sino el resultado agregado. 2. La distribución del plancton cambia enormemente de manera temporal y espacial. Los algoritmos de clasificación no están pensados para manejar esta variabilidad y es necesario el uso de algoritmos pensados específicamente para este tipo de problemas. 3. Debido al punto anterior, suele ocurrir que los métodos de validación tradicionales como la validación cruzada sobrestiman la eficacia de los modelos obtenidos, y cuando estos sistemas se aplican en producción, se obtengan unos resultados mucho peores que los estimados a priori. Los puntos anteriores nos llevan a explicar las principales contribuciones de esta tesis: 1. Revisión de todos los métodos de cuantificación existentes y sus principales usos y aplicaciones. 2. Establecimiento de métodos de validación adecuados para evaluar correctamente los métodos de cuantificación y obtener medidas reales y que además nos permitan evaluar de manera precisa el sistema. 3. Aplicación de métodos de cuantificación y las técnicas de validación desarrolladas al problema real del plancton, usando para ello las últimas técnicas disponibles en visión artificial (redes neuronales convolucionales) y con un conjunto de datos real perteneciente al Woods Hole Oceanographic Institution de Massachusets.
Descripción:
Tesis doctoral por el sistema de compendio de publicaciones
Notas Locales:
DT(SE) 2019-140
Enlace a recurso relacionado:
Colecciones
- Tesis [7596]
- Tesis doctorales a texto completo [2084]