Generación automática de modelos de dominio multilenguaje a través de un subconjunto de shape expressions
Author:
Director:
Publication date:
Serie:
Grado en Ingeniería Informática del Software
Descripción física:
Abstract:
Cada día se producen más y más datos, la cantidad y la diversidad de los datos claramente superan nuestra capacidad para consumirlos. Para definir cantidades tan grandes de datos que las aplicaciones tradicionales no pueden manejar se acuñó el término “Big-Data” que se define como las tres Vs: Volumen, Velocidad y Variedad. Pese a que volumen y velocidad sean las cualidades más vistas, quizás, la más importante sea la variedad ya que evita que los datos puedan ser integrados y provoca graves problemas de interoperabilidad. Para solventar este inconveniente se propuso RDF, un modelo de datos en grafo definido a partir de IRIs únicas que ataca el problema de la variedad de datos de raíz. Sin embargo, con la solución aparecieron nuevos retos como la validación de los datos producidos en RDF para asegurar que el grafo seguía un esquema concreto. Para solucionar esto nacieron lenguajes como Shape Expressions o SHACL cuya finalidad es definir esquemas para grafos RDF. Sin embargo ambos lenguajes son nuevos y albergan cierta complejidad. Además, a medida que más organizaciones adoptan estas tecnologías para definir el esquema de sus grafos RDF, surgen más peticiones por parte de la comunidad. Y es de esas peticiones de la comunidad de donde emerge este TFG cuya finalidad es proporcionar un compilador para un subconjunto de la sintaxis compacta de Shape Expressions que incluya: - Validaciones sintácticas y semánticas para ayudar a los usuarios que se adentran por primera vez en los lenguajes de validación. - Generación automática de modelos de dominio para lenguajes orientados a objetos como Java o Python. - API pública con acceso a cada fase de la compilación para permitir una integración con IDEs o posible extensiones.
Cada día se producen más y más datos, la cantidad y la diversidad de los datos claramente superan nuestra capacidad para consumirlos. Para definir cantidades tan grandes de datos que las aplicaciones tradicionales no pueden manejar se acuñó el término “Big-Data” que se define como las tres Vs: Volumen, Velocidad y Variedad. Pese a que volumen y velocidad sean las cualidades más vistas, quizás, la más importante sea la variedad ya que evita que los datos puedan ser integrados y provoca graves problemas de interoperabilidad. Para solventar este inconveniente se propuso RDF, un modelo de datos en grafo definido a partir de IRIs únicas que ataca el problema de la variedad de datos de raíz. Sin embargo, con la solución aparecieron nuevos retos como la validación de los datos producidos en RDF para asegurar que el grafo seguía un esquema concreto. Para solucionar esto nacieron lenguajes como Shape Expressions o SHACL cuya finalidad es definir esquemas para grafos RDF. Sin embargo ambos lenguajes son nuevos y albergan cierta complejidad. Además, a medida que más organizaciones adoptan estas tecnologías para definir el esquema de sus grafos RDF, surgen más peticiones por parte de la comunidad. Y es de esas peticiones de la comunidad de donde emerge este TFG cuya finalidad es proporcionar un compilador para un subconjunto de la sintaxis compacta de Shape Expressions que incluya: - Validaciones sintácticas y semánticas para ayudar a los usuarios que se adentran por primera vez en los lenguajes de validación. - Generación automática de modelos de dominio para lenguajes orientados a objetos como Java o Python. - API pública con acceso a cada fase de la compilación para permitir una integración con IDEs o posible extensiones.
Collections
- Trabajos Fin de Grado [1987]