Modelação de Dados
Objetivos
Saber:
- NoSQL models
Modelação de dados em grafos e linguagens de interrogação - Princípios dos Dados Abertos Ligados (Linked Open Data) e conceitos da Web Semântica
- Linguagens para representação, raciocínio e interrogação na Web Semântica
- Conceitos, arquiteturas e modelos de um Data Warehouse
- Modelação multidimensional dos dados para interrogação OLAP
Saber Fazer:
- Identificar aplicações que necessitem de modelos em grafos
- Modelar uma base de dados em grafos e interrogá-la (e.g. Neo4j com consultas em Cypher)
- Utilizar um triplestore e motor de inferência (e.g. Apache Jena) para interrogar em SPARQL informação existente na Web Semântica
- Analisar, construir e interrogar modelos multidimensionais
- Utilizar uma base de dados temporal
Soft-Skills
- Explorar autonomamente a literatura atualizada de um tópico
- Desenvolver o espírito crítico relativamente a tecnologia recente
- Trabalhar em equipa
- Efetuar uma apresentação oral expondo um tema recente
- Avaliar um trabalho científico
Caracterização geral
Código
11559
Créditos
6.0
Professor responsável
Carlos Augusto Isaac Piló Viegas Damásio, João Carlos Gomes Moura Pires
Horas
Semanais - 4
Totais - 50
Idioma de ensino
Português
Pré-requisitos
Para realizar esta UC é necessário ter aprovação a Sistemas de Bases de Dados.
Bibliografia
• Ian Robinson, Jim Webber, and Emil Eifrem. Graph Databases. O''''''''''''''''''''''''''''''''Reilly Media, Inc, 2013.
• Grigoris Antoniou, Paul Groth, Frank van Harmelen and Rinke Hoekstra . A Semantic Web Primer, 3rd Edition. MIT Press, August 2012.
• The Description Logic Handbook. Theory, Implementation and Applications. Edited by Franz Baader, Diego Calvanese, Deborah McGuinness, Daniele Nardi and Peter Patel-Schneider. Cambridge University Press, June 2010.
• The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Third Edition) - Ralph Kimball, Margy Ross. Wiley, 2013.
• Guy Harrison. Next Generation Databases: NoSQL, NewSQL and Big Data. Apress, 2015.
ISBN: 978-1484213308.
• Dan Sullivan. NoSQL for Mere Mortals. Addison-Wesley, 2015.
ISBN: 978-0134023212
• Ted Hills. NoSQL and SQL data modeling. Technics Publications, 2016.
ISBN: 978-1634621090
Método de ensino
Nas aulas teóricas são expostos os tópicos centrais que introduzem o aluno aos conceitos principais da unidade curricular que lhe permitirão depois aprofundarem algum tema em particular, acompanhados de acetatos teóricos especialmente desenvolvidos para a UC.
Os alunos deverão entregar um trabalho prático sobre um tema, à sua escolha. Os alunos deverão autonomamente explorar a informação existente na literatura, sendo a bibliografia inicial discutida com o docente.
As aulas práticas destinam-se à exploração de diversas ferramentas que permitam a sua experimentação e utilização das linguagens lecionadas, resolvendo tarefas predefinidas.
A avaliação da unidade curricular é constituída por 2 testes individuais (cada 25%), um projeto/trabalho final de grupo (35% da nota), apresentação oral e discussão de um trabalho de um colega (15% da nota).
A nota mínima em cada teste é de 8 de valores e média dos testes deverá ser superior ou igual a 10 valores, após arredondamento.
Método de avaliação
A avaliação da unidade curricular é constituída por 2 testes individuais (cada 25%), um projeto/trabalho final de grupo (50% da nota), com nota individual após a discussão e defesa oral devendo ser superior ou igual a 10 valores. A média dos testes deverá ser superior ou igual a 10 valores, após arredondamento, e cada um dos testes deverá ter nota mínima de 8 valores. Qualquer aluno pode ser chamado a prova oral para substituição da nota da componente de testes/exame.
Os teste e o exame serão presenciais, com possibilidade de consulta de apenas uma folha de ajuda fornecida pelos docentes.
Conteúdo
1. Modelos de dados NoSQL
Modelos alternativos para grandes volumes de dados. Movimento NoSQL. Dados relacionais, semiestruturados e em grafos. Modelação de informação em colunas, documentos e grafos. Linguagens de consulta para modelos em grafos. Bases de dados em grafos. Relação e comparação com outros modelos do movimento NoSQL e armazenamento de dados chave-valor.
2. Web Semântica
Motivação. Dados abertos ligados. Linguagem e semântica do Resource Description Framework (RDF) e linguagem de consulta SPARQL. Representação de ontologias na Web Semântica: RDF Schema e Web Ontology Language (OWL).
3. Processamento Analítico em Linha (OLAP)
Armazéns de dados. Modelos (conceptuais) multidimensionais. Operações base e linguagens de interrogação OLAP. Metadados. Dimensões espaciais e temporais. Interatividade na análise de dados.
4. Exercícios de Desenvolvimento e Projecto Final
Utilização de ferramentas (graph database, bases de dados temporais, RDF e OWL API OLAP e multidimensionais)