Modelação de Dados
Objetivos
Saber:
- NoSQL models
Modelação de dados em grafos e linguagens de interrogação - Princípios dos Dados Abertos Ligados (Linked Open Data) e conceitos da Web Semântica
- Linguagens para representação, raciocínio e interrogação na Web Semântica
- Conceitos, arquiteturas e modelos de um Data Warehouse
- Modelação multidimensional dos dados para interrogação OLAP
Saber Fazer:
- Identificar aplicações que necessitem de modelos em grafos
- Modelar uma base de dados em grafos e interrogá-la (e.g. Neo4j com consultas em Cypher)
- Utilizar um triplestore e motor de inferência (e.g. Apache Jena) para interrogar em SPARQL informação existente na Web Semântica
- Analisar, construir e interrogar modelos multidimensionais
- Utilizar uma base de dados temporal
Soft-Skills
- Explorar autonomamente a literatura atualizada de um tópico
- Desenvolver o espírito crítico relativamente a tecnologia recente
- Trabalhar em equipa
- Efetuar uma apresentação oral expondo um tema recente
- Avaliar um trabalho científico
Caracterização geral
Código
11559
Créditos
6.0
Professor responsável
Carlos Augusto Isaac Piló Viegas Damásio, João Carlos Gomes Moura Pires
Horas
Semanais - 4
Totais - 56
Idioma de ensino
Inglês
Pré-requisitos
Para realizar esta UC é necessário ter aprovação a Sistemas de Bases de Dados.
Bibliografia
• Ian Robinson, Jim Webber, and Emil Eifrem. Graph Databases. O''Reilly Media, Inc, 2013.
• Grigoris Antoniou, Paul Groth, Frank van Harmelen and Rinke Hoekstra . A Semantic Web Primer, 3rd Edition. MIT Press, August 2012.
• The Description Logic Handbook. Theory, Implementation and Applications. Edited by Franz Baader, Diego Calvanese, Deborah McGuinness, Daniele Nardi and Peter Patel-Schneider. Cambridge University Press, June 2010.
• The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling (Third Edition) - Ralph Kimball, Margy Ross. Wiley, 2013.
• Guy Harrison. Next Generation Databases: NoSQL, NewSQL and Big Data. Apress, 2015.
ISBN: 978-1484213308.
• Dan Sullivan. NoSQL for Mere Mortals. Addison-Wesley, 2015.
ISBN: 978-0134023212
• Ted Hills. NoSQL and SQL data modeling. Technics Publications, 2016.
ISBN: 978-1634621090
Método de ensino
Nas aulas teóricas são expostos os tópicos centrais que introduzem o aluno aos conceitos principais da unidade curricular que lhe permitirão depois aprofundarem algum tema em particular, acompanhados de acetatos teóricos especialmente desenvolvidos para a UC.
Os alunos deverão entregar um trabalho prático sobre um tema, à sua escolha. Os alunos deverão autonomamente explorar a informação existente na literatura, sendo a bibliografia inicial discutida com o docente.
As aulas práticas destinam-se à exploração de diversas ferramentas que permitam a sua experimentação e utilização das linguagens lecionadas, resolvendo tarefas predefinidas.
A avaliação da unidade curricular é constituída por 2 testes individuais (cada 25%), um projeto/trabalho final de grupo (35% da nota), apresentação oral e discussão de um trabalho de um colega (15% da nota).
A nota mínima em cada teste é de 8 de valores e média dos testes deverá ser superior ou igual a 10 valores, após arredondamento.
Método de avaliação
A avaliação da unidade curricular é constituída por 2 testes individuais (cada 25%), um projeto/trabalho final de grupo (35% da nota), apresentação oral e discussão de um trabalho de um colega (15% da nota). A nota mínima em cada teste é de 8 de valores e média dos testes deverá ser superior ou igual a 10 valores, após arredondamento. Os alunos poderão repescar qualquer ou todos os testes na época de exame de recurso, sendo combinada na mesma com a nota do trabalho e apresentação e discussão oral.
Conteúdo
1. Modelos de dados NoSQL
Modelos alternativos para grandes volumes de dados. Movimento NoSQL. Dados relacionais, semiestruturados e em grafos. Modelação de informação em colunas, documentos e grafos. Linguagens de consulta para modelos em grafos. Bases de dados em grafos. Relação e comparação com outros modelos do movimento NoSQL e armazenamento de dados chave-valor.
2. Web Semântica
Motivação. Dados abertos ligados. Linguagem e semântica do Resource Description Framework (RDF) e linguagem de consulta SPARQL. Representação de ontologias na Web Semântica: RDF Schema e Web Ontology Language (OWL).
3. Processamento Analítico em Linha (OLAP)
Armazéns de dados. Modelos (conceptuais) multidimensionais. Operações base e linguagens de interrogação OLAP. Metadados. Dimensões espaciais e temporais. Interatividade na análise de dados.
4. Exercícios de Desenvolvimento e Projecto Final
Utilização de ferramentas (graph database, bases de dados temporais, RDF e OWL API OLAP e multidimensionais)