Text Mining
Objetivos
O principal objectivo da unidade curricular de Text Mining é providenciar aos alunos a compreensão dos desafios enfrentados no processamento automático de texto escrito em linguagem natural, bem como facultar-lhes as ferramentas para encarar esses desafios. Os tópicos abordados incluem a metodologia a seguir, bem como os vários passos que dela fazem parte, tais como o pré-processamento, representações de texto, e modelos de aprendizagem.
Caracterização geral
Código
200181
Créditos
4.0
Professor responsável
João Bruno Morais de Sousa Jardim
Horas
Semanais - A disponibilizar brevemente
Totais - A disponibilizar brevemente
Idioma de ensino
Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês
Pré-requisitos
n/a
Bibliografia
Jurafsky, Daniel and H. Martin, James "Speech and Language Processing", Prentice Hall.
Método de ensino
As aulas irão consistir num misto de aulas teóricas e práticas. A disciplina terá uma forte componente de aprendizagem proactiva, pelo que se espera que os alunos participem activamente nas aulas e recomenda-se a leitura dos materiais de apoio previamente a cada aula. Todas as actividades de programação serão feitas em Python, no Jupyter Notebook.
Método de avaliação
1ª e 2ª chamadas
Versão com aval. contínua:
- Exame: 50% (nota mín.: 9.5)
- Avaliação contínua: 10%
- Projecto: 40% (nota mín.: 9.5)
Versão exame:
- Exame: 60% (nota mín.: 9.5)
- Projecto: 40% (nota mín.: 9.5)
Conteúdo
- LU1: Introdução ao Text Mining: visão geral, desafios, e metodologia
- LU2: Pré-processamento de texto
- LU3: Representações de texto: bag-of-words, n-grams, features, e word embeddings
- LU4: Métodos baseados em distâncias: distância lexical e TD-IDF
- LU5: Métodos de aprendizagem: modelos de língua, predição estruturada, e classificação
- LU6: Projecto de classificação a ser realizado em Python
Cursos
Cursos onde a unidade curricular é leccionada: