Text Mining

Objetivos

O principal objectivo da unidade curricular de Text Mining é providenciar aos alunos a compreensão dos desafios enfrentados no processamento automático de texto escrito em linguagem natural, bem como facultar-lhes as ferramentas para encarar esses desafios. Os tópicos abordados incluem a metodologia a seguir, bem como os vários passos que dela fazem parte, tais como o pré-processamento, representações de texto, e modelos de aprendizagem.

Caracterização geral

Código

200181

Créditos

4.0

Professor responsável

João Bruno Morais de Sousa Jardim

Horas

Semanais - A disponibilizar brevemente

Totais - A disponibilizar brevemente

Idioma de ensino

Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês

Pré-requisitos

n/a

Bibliografia

Jurafsky, Daniel and H. Martin, James "Speech and Language Processing", Prentice Hall.

Método de ensino

As aulas irão consistir num misto de aulas teóricas e práticas. A disciplina terá uma forte componente de aprendizagem proactiva, pelo que se espera que os alunos participem activamente nas aulas e recomenda-se a leitura dos materiais de apoio previamente a cada aula. Todas as actividades de programação serão feitas em Python, no Jupyter Notebook.

Método de avaliação

1ª e 2ª chamadas


Versão com aval. contínua:

  • Exame: 50% (nota mín.: 9.5)
  • Avaliação contínua: 10%
  • Projecto: 40% (nota mín.: 9.5)

Versão exame:

  • Exame: 60% (nota mín.: 9.5)
  • Projecto: 40% (nota mín.: 9.5)

Conteúdo

  • LU1: Introdução ao Text Mining: visão geral, desafios, e metodologia
  • LU2: Pré-processamento de texto
  • LU3: Representações de texto: bag-of-words, n-grams, features, e word embeddings
  • LU4: Métodos baseados em distâncias: distância lexical e TD-IDF
  • LU5: Métodos de aprendizagem: modelos de língua, predição estruturada, e classificação
  • LU6: Projecto de classificação a ser realizado em Python