Ciência de Dados para Análise de Negócios
Objetivos
A. Conhecer e compreender:
•Dominar os conceitos de Big Data, Data Science e e processo de decisões baseado em Dados.
•Experiência prática em análise de dados como instrumento de gestão para de suporte de decisão .
B. Competências Específicas:
•Construir modelos de previsão para classificação e regressão
•Avaliar a adequação do modelo e a sua generalização
•Aprender o conceito de experimentação empresarial e causalidade
C. Competências Gerais:
•Ser capaz de pensar sistematicamente sobre como e quando os dados podem melhorar a tomada de decisões em
contextos de gestão
•Ser capaz de entender e discutir tópicos de análise de dados para “ business intelligence”. Em particular, conhecer
princípios básicos e algoritmos de prospecção de dados para interagir com profissionais na dos mesmos.
Caracterização geral
Código
67935
Créditos
2
Professor responsável
Miguel Godinho de Matos
Horas
Semanais - A disponibilizar brevemente
Totais - A disponibilizar brevemente
Idioma de ensino
Inglês
Pré-requisitos
N/A
Bibliografia
O livro obrigatório é:
Data Science for Business: Fundamental principles of data mining and data analytic thinking Provost and Fawcett (2013).
O livro será complementado com discussões de aplicações, estudos de casos e demonstrações.
Sempre que relevante serão distribuidas as notas de aula.
Método de ensino
O curso será composto por palestras teóricas onde abordaremos exemplos de princípios e usos fundamentais da análise de
dados e da protecção de dados. Este não é um curso de algoritmos de protecção de dados, mas vamos discutir a mecânica
de como esses métodos funcionam. As aulas serão uma combinação de palestras sobre materias fundamentais,debate de
casos e exercícios para os alunos. Haverá três trabalhos de casa que contarão para a nota final. Os trabalhos de casa
incluem perguntas a ser respondidas e / ou tarefas práticas. As tarefas práticas serão baseadas em dados que iremos
fornecer. Em particular, os alunos vão analisar os dados para obter experiência prática sobre a melhor forma de formular
problemas de análise de negócios usando as várias técnicas debatidas na sala de aula. Nos trabalhos práticos iremos usar
a linguagem estatística R http://cran.r-project.org/.
Método de avaliação
Avaliação: Participação - 10%; Trabalho de casa - 40%; Exame Final - 50%.
Conteúdo
Introdução à prospecção de dados e análise de negócios: Pensar na Análise de Dados; De Big Data 1.0 para Big Data 2.0, de
Problemas de Negócios para Prospecção de Dados; Análise não supervisionada de dados Vs supervisionada.; Processo de
Protecção de Dados; Introdução ao modelo de previsão: Encontrar atributos informativos; Árvore de Indução; Estimativa de
probabilidades; Modelo de ajuste e modelo acima do ajuste: Encontrar parâmetros de modelo "óptimos" com base em
dados; Definir a meta para a protecção de dados; Funções objectivas; Funções de perda; Generalização; Montagem e
sobre-montagem; Controle de complexidade; Modelo de avaliação da qualidade e do desempenho: Avaliação de
classificadores; Valor esperado como quadro da avaliação chave; Visualizar o desempenho do modelo (ROC, curva de
elevação, resposta cumulativa, curva de lucro); Introdução ao paradigma da inferência causal: Limites da protecção de
dados; Correlação versus causalidade
Cursos
Cursos onde a unidade curricular é leccionada: