Recuperação de Informação

Objetivos

Conhecimentos:
 - Compreender o conceito de relevância de informação
 - Analisar dados de texto
 - Compreender modelos de ordenação de informação
 - Compreender protocolos de avaliação em recuperação de informação

Aptidões:
 - Implementar modelos de recuperação de informação
 - Implementar módulos de um sistema de recuperação de informação
 - Colocar em produção um sistema de recuperação de informação em larga-escala
 - Desenhar um protocolo de avaliação e avaliar um motor de pesquisa

Competências:
- Desenhar um sistema de recuperação de informação
- Selecionar as técnicas de RI adequadas a cada problema
- Capacidade de análise critica dos resultados de avaliação

Caracterização geral

Código

12077

Créditos

6.0

Professor responsável

João Miguel da Costa Magalhães

Horas

Semanais - 4

Totais - A disponibilizar brevemente

Idioma de ensino

Português

Pré-requisitos

Nas aulas teóricas é apresentada a matéria, com exemplos e discussão cuidada dos conceitos mais importantes. As aulas laboratoriais destinam-se à realização de 1 projeto com 3 entregas ao longo do semestre.

Será disponibilizada uma página Web da disciplina onde se mantém informação atualizada sobre o funcionamento da mesma. Os slides da matéria teórica e o guia do projeto estarão disponíveis na página Web da disciplina. 

A avaliação da disciplina é composta por 1 teste escrito individual realizado no fim do semestre e um projeto.


Bibliografia

IR reference: C. D. Manning, P. Raghavan and H. Schütze, “Introduction to Information Retrieval”, Cambridge University Press, 2008. https://nlp.stanford.edu/IR-book/information-retrieval-book.html

NLP reference: Dan Jurafsky and James H. Martin, Speech and Language Processing (3rd ed. draft) https://web.stanford.edu/~jurafsky/slp3/

 

 

Método de ensino

Nas aulas teóricas é apresentada a matéria, com exemplos e discussão cuidada dos conceitos mais importantes. As aulas laboratoriais destinam-se à realização de 1 projeto com 3 entregas ao longo do semestre.

Será disponibilizada uma página Web da disciplina onde se mantém informação atualizada sobre o funcionamento da mesma. Os slides da matéria teórica e o guia do projeto estarão disponíveis na página Web da disciplina. 

A avaliação da disciplina é composta por 1 teste escrito individual realizado no fim do semestre e um projeto.


Método de avaliação

A avaliação é composta por um teste / exame e um projeto.

O teste / exame vale 40% da nota final.

O projeto vale 60% da nota final e será entregue em 3 fases. O relatório final deverá descrever o trabalho feito em cada fase e discutir os resultados obtidos em cada fase.

Conteúdo

1. Introduction
2. Text processing, NGRAMS, cosine distance
3. Language models
4. Evaluation
5. Classification tasks: sentiment, category, spam
6. Pseudo relevance models
7. Learning to rank
8. Word embeddings
9. Information extraction
10. Question answering
11. Conversational search
12. Recommendation and personalization

Cursos

Cursos onde a unidade curricular é leccionada: