Mostrar el registro sencillo del ítem

Selección y evaluación de algoritmos para clasificación de documentos

dc.contributor.advisorCal Marín, Enrique Antonio de la 
dc.contributor.authorVergara García, Paula María
dc.date.accessioned2014-06-16T12:09:22Z
dc.date.available2014-06-16T12:09:22Z
dc.date.issued2014-06-11
dc.identifier.urihttp://hdl.handle.net/10651/27539
dc.description.abstractEste trabajo ha consistido en un estudio sobre la clasificación de documentos en castellano, basándose en el estándar IPTC. Para ello se ha utilizado un conjunto de ejemplos formado por documentos previamente etiquetados. Partiendo de los distintos tipos de aprendizaje, los algoritmos de clasificación, las herramientas de las que se disponía para la clasificación y las características de conjunto de ejemplos, se decidió utilizar las librerías proporcionadas por las herramientas Mahout, Hadoop, Lucene y Tika (pertenecientes a Apache Software Foundation). El algoritmo que mejor se ajustaba al problema propuesto fue el algoritmo de regresión lineal, método del gradiente descendente estocástico. Sobre este algoritmo se realizaron distintas pruebas de clasificación con distintos conjuntos de ejemplos, se analizaron los resultados de la clasificación. Con el conjunto de ejemplos que proporciono mejores resultados en la clasificación y posterior evaluación, se creo un modelo, utilizado posteriormente para la implementación de una aplicación de clasificación de artículos de prensa. Esta aplicación obtiene los artículos contenidos en los Feed de noticias de distintos medios generalistas disponibles, seguidamente, y con ayuda del modelo seleccionado, clasifica los artículos y los muestra al usuario ordenados por las distintas categorías encontradas basándose en el estándar IPTC.spa
dc.format.extent77spa
dc.language.isospa
dc.relation.ispartofseriesMáster Universitario en Ingeniería Informática
dc.rightsCC Reconocimiento - No comercial - Sin obras derivadas 3.0 España
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subjectClasificaciónspa
dc.titleSelección y evaluación de algoritmos para clasificación de documentosspa
dc.typemaster thesisspa
dc.rights.accessRightsopen access


Ficheros en el ítem

untranslated

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

CC Reconocimiento - No comercial - Sin obras derivadas 3.0 España
Este ítem está sujeto a una licencia Creative Commons