Disciplina: Ciência de Dados

Área Científica:

Informática

HORAS CONTACTO:

80 Horas

NÚMERO DE ECTS:

7,5 ECTS

IDIOMA:

Inglês

Objetivos Gerais:

1 - Capacitar os alunos a aprender a pensar de forma independente e criativa em como recolher, processar e analisar dados para a solução de problemas colocados a priori.
2 - Introdução aos processos de ciência dos dados, suas ferramentas e tecnologias associadas.
3 - Capacitar os alunos no desenvolvimento completo de abordagens de aprendizagem automática, com e sem supervisão, incluindo técnicas de combinação de modelos.
4 - Capacitar os alunos na criação de produtos de dados, de base visual e com apresentações orais informativas, suportados numa comunicação rigorosa, mas também apelativa e persuasiva.

Conteúdos / Programa:

1 - O que é a ciência de dados e o processo de descoberta de informação - formulação de questões
2 - Aquisição e armazenamento de dados
3 - Análise exploratória de dados e visualização
4 - Pré-processamento de dados, redução da dimensão e balanceamento
5 - Extração e seleção de características
6 - Classificação e regressão com aprendizagem supervisionada: algoritmos de treino, sobre-ajustamento e validação cruzada
7 - Combinação de modelos com boosting e bagging
8 - Avaliação de desempenho com métricas, gráficos e análise de significância
9 - Algoritmos de aprendizagem não supervisionada
10 - Estudos de casos com séries temporais, processamento de imagem e mineração de texto.

Bibliografia / Fontes de Informação:

EMC Education Services , 2015 , Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data , Wiley
William McKinney , 2022 , Python for Data Analysis 3e: Data Wrangling with pandas, NumPy, and Jupyter , O'Reilly
Joe Reis, Matt Housley , 2022 , Fundamentals of Data Engineering: Plan and Build Robust Data Systems , O'Reilly

Métodos e Critérios de Avaliação:

Tipo de Classificação: Quantitativa (0-20)

Metodologia de Avaliação:
Metodologia de ensino: aulas teóricas e teórico-práticas e orientação tutorial. Avaliação: 1. Componente teórica - 40% (individual): 2 Frequências - 20% + 20% (nota mínima de 8 valores em cada frequências); 2. Componente prática - 60% (em grupos de 3 alunos) com dois trabalhos - 25% + 35% (nota mínima de 8 valores em cada trabalho); 2.1 Primeiro trabalho relativo à análise de dados; 2.2 Segundo trabalho relativo ao planeamento e desenvolvimento de modelos de aprendizagem automática.