Sistemas contínuos, adaptivos e orientados por dados

Objectivos

Cada vez mais, ambas as nossas vidas de quem nos rodeia são passadas online. Isto é mais verdadeiro do que nunca, dada a atual crise de saúde. Acompanhamos amigos e familiares através das redes sociais, verificamos as notícias nos nossos telefones, encontramos informações na Wikipédia e consultamos o "Dr. Google" quando nos sentimos doentes. Tudo isto deixa vestígios que podemos usar para nos entendermos melhor e aos outros, melhorando a tomada de decisões e diferentes sistemas de forma orientada para os dados.
Neste curso vamos explorar novos conjuntos de dados e discutir como passar de dados a modelos para decisões neste contexto. Em particular, tiraremos partido da atual pandemia COVID-19 e utilizaremos um estudo de caso para trabalhar com dados reais sobre um problema real. Quem partilha notícias falsas? Podemos prever epidemias de pesquisas online? Que produto vai vender?
Este curso visa criar uma compreensão mais alargada do poder de analisar (principalmente) dados online e todo o pipeline desde a extração de dados até decisões, e de volta, num sistema contínuo e dependente de feed-back. Cobrirá os fundamentos na recolha de páginas web, curade dados, processamento de linguagem natural, análise de sentimentos e implementação.

Caracterização geral

Código

2495

Créditos

3.5

Professor responsável

Joana Gonçalves de Sá

Horas

Semanais - A disponibilizar brevemente

Totais - A disponibilizar brevemente

Idioma de ensino

Inglês

Pré-requisitos

A disponibilizar brevemente

Bibliografia

Este é um curso experimental, na intersecção da teoria e da prática, e não haverá nenhum livro obrigatório. Serão oferecidos trabalhos de última geração e materiais educativos (artigos, recursos online) para preparar cada aula. Podem ser sugeridas referências gerais nos sistemas de data mining, Data Analytics e Data.

Método de ensino

Este curso será muito acelerado, prático, utilizando um quadro de aprendizagem por fazer. Esta é uma configuração experimental, dadas as circunstâncias atuais, e é necessária uma forte motivação.
Usaremos uma abordagem combinada de palestras online e práticas de flip-the-classroom.
Os estudantes vão auto-organizar-se em grupos e escolher entre uma lista de problemas (ex: identificação em tempo real de novos casos COVID-19, Media e cobertura das redes sociais do pandemia, impacto económico(s)). Cada grupo será dotado de materiais educativos, conjuntos de dados e instruções online. Todas as semanas, haverá uma palestra comum de 1h a 2h, seguida de suporte técnico prático, em formato de instrutor de grupo. Durante a palestra, apresentaremos a teoria e o conhecimento atuais; durante a prática, os alunos vão tentar diferentes ferramentas práticas para resolver o "seu" problema. No final de cada aula, os alunos serão confrontados com um novo desafio, a ser preparado durante a semana e discutido na seguinte palestra. Isto oferece ao curso um ambiente muito estimulante e acelerado, ligando permanentemente a teoria às aplicações e de volta, sobre um tema muito oportuno.

Método de avaliação

Não é necessária qualquer frequência obrigatória às palestras, reunião semanal de grupo de instrutores (30min cada)

Espera-se que os estudantes enfrentem desafios reais (4 no total) e apresentem um relatório final. A criatividade é encorajada, mas a anotação de código adequada e abordagens atenciosas são fundamentais. Espera-se que os alunos trabalhem em conjunto e discutam os problemas uns com os outros, mas as write-ups devem ser individuais. A avaliação final terá dois passos: 1) a inscrição; 2) uma defesa oral desse relatório.
A nota final do curso CADD considera:
Trabalho individual e de grupo (40%)
Relatório Final (40%)
Discussão Oral (20%)

Conteúdo

Este curso é incremental com a ética a ser discutida ao longo de todo. Será muito prático e cobrirá os fundamentos da análise dos sistemas de dados.
Durante o período, utilizaremos dados reais da atual pandemia, focaremos-nos em diferentes aspetos e discutiremos ferramentas para os enfrentar.