Big Code infrastructure for building tools to improve software development
Otros títulos:
Infraestructura Big Code para mejorar la calidad den el desarrollo de software
Autor(es) y otros:
Director(es):
Centro/Departamento/Otros:
Palabra(s) clave:
Inteligencia atificial
Big Code
ProgQuery
Fecha de publicación:
Descripción física:
Resumen:
En la última década, el uso de repositorios de código como GitHub, SourceForge o BitBucket se ha visto incrementado significativamente. Según los datos de GitHub, en noviembre de 2018 se había registrado 100 millones de repositorios; posteriormente, en 2019 se crearon 44 millones de nuevos repositorios. La información de estos repositorios de código masivos puede ser utilizada como datos para la construcción de herramientas, servicios y modelos orientados a mejorar el desarrollo software. La nueva área de investigación sobre este tema ha sido bautizada como “big code”, debido a su paralelismo con el big data y al uso de código fuente (source code) como datos. Aunque la gran mayoría de los programas se codifican como información textual, éstos contienen información sintáctica y semántica típicamente representada por medio de árboles y grafos. Las herramientas para mejorar el desarrollo software extraen dicha información y la utilizan para distintas tareas como el análisis estático de programas, la desofuscación de código, el cálculo de métricas software, la transformación de programas, la búsqueda avanzada de código y la comprobación de guías de estilo.
En la última década, el uso de repositorios de código como GitHub, SourceForge o BitBucket se ha visto incrementado significativamente. Según los datos de GitHub, en noviembre de 2018 se había registrado 100 millones de repositorios; posteriormente, en 2019 se crearon 44 millones de nuevos repositorios. La información de estos repositorios de código masivos puede ser utilizada como datos para la construcción de herramientas, servicios y modelos orientados a mejorar el desarrollo software. La nueva área de investigación sobre este tema ha sido bautizada como “big code”, debido a su paralelismo con el big data y al uso de código fuente (source code) como datos. Aunque la gran mayoría de los programas se codifican como información textual, éstos contienen información sintáctica y semántica típicamente representada por medio de árboles y grafos. Las herramientas para mejorar el desarrollo software extraen dicha información y la utilizan para distintas tareas como el análisis estático de programas, la desofuscación de código, el cálculo de métricas software, la transformación de programas, la búsqueda avanzada de código y la comprobación de guías de estilo.
Descripción:
Tesis doctoral con mención internacional
Notas Locales:
DT(SE) 2020-058
Enlace a recurso relacionado:
Colecciones
- Tesis [7486]
- Tesis doctorales a texto completo [2006]