Análise de Big Data

Objetivos

Este curso equipará os alunos com as ferramentas para tomar decisões informadas em áreas de negócios baseadas em dados. Isso proporcionará uma boa compreensão sobre o funcionamento de big data e análise de dados e abordaremos alguns dos métodos em detalhes, suas vantagens e desvantagens. No final do curso os alunos deverão ser capazes de realizar análises e tomar decisões com base em ambientes baseados em dados. 


Caracterização geral

Código

2440

Créditos

3.5

Professor responsável

Arash Laghaie

Horas

Semanais - A disponibilizar brevemente

Totais - A disponibilizar brevemente

Idioma de ensino

Inglês

Pré-requisitos

Estatística

Bibliografia

Provost and Fawcett (2013) - Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking

Géron (2017) ? Hands-On Machine Learning with Scikit-Learn and TensorFlow

Taddy (2019) ? Business Data Science 


Método de ensino

O curso começa com uma introdução do software Rapidminer para análise de dados. Os alunos serão ajudados a fazer seu próprio sistema (laptop) pronto para analisar conjuntos de dados. O curso apresentará uma série de procedimentos e métodos de análise de dados aplicados a problemas específicos.

Além disso, o curso contempla uma simulação em que as equipes gerem uma equipe de corrida. Ao analisar os dados produzidos pelo seu motorista, as equipes decidem os parâmetros usados ??para ajustar seu carro e elaboram a estratégia de corrida que os levará à vitória. 


Método de avaliação

Participação (15%)

Simulação (35%)

Exame Final (50%) 

Conteúdo

1. Introdução ao Rapidminer no contexto de análise de dados

2. Identificação, Predição e Causalidade

3. Supervisião vs Análise de dados não supervisionada

4. Encontrar atributos informativos

5. Previsão e estimativa de probabilidade

6. Ajuste do modelo

7. Procura ?ótima? parâmetros do modelo com base em dados

8. Escolha do objetivo para tratamento de dados

9. Funções objetivo / funções de perda

10. Redução de dados

11. Qualidade do modelo e avaliação de desempenho