Universidade da Beira Interior

Aprendizagem Automática e Mineração de Dados 

Ano lectivo: 2017/18

 

Objectivos da disciplina:

Aprender métodos e técnicas utilizáveis para conseguir fazer os computadores aprender de forma automatizada.

Aprender sobre como usar técnicas automáticas para extrar conhecimento de dados.

 

Programa:

Introdução – O que é e para que serve a Aprendizagem Automática

Aprendizagem de conceitos e ordenação geral-para-específico

Avaliação de hipóteses

Indução de regras

Aprendizagem baseada em exemplos

Aprendizagem Bayesiana

Árvores de decisão e de regressão

Mineração de Dados - Aplicação de Aprendizagem Automática a problemas e dados concretos

Selecção e preparação dos dados

Problemas a resolver na fase de mineração (overfitting, etc.)

Avaliação do conhecimento extraido dos dados

 

Critérios de avaliação:

Fase de Aprendizagem:

·       É avaliada com nota de 0 a 20.

·       Notas iguais ou superiores a 10 são suficientes para obter nota final positiva (que será igual à nota obtida nesta Fase de Aprendizagem).

·       8 dos 20 valores desta fase serão obtidos através de um teste escrito, e os restantes 12 valores através de dois trabalhos práticos. O primeiro destes trabalhos praticos vale 4 valores e deverá ser concluido até 2 de Abril. O segundo vale 8 valores e deverá ser concludo até 5 de Junho.

·       As presenças/ausências nas aulas afectam a classificação. A partir da segunda falta não justificada, cada falta não justificada adicional reduz 0.1 valores à nota da Fase de Aprendizagem.

Obtenção de frequência (possibilidade de ir aos exames):

·       É preciso ter 6 (em 20) na Fase de Aprendizagem.

Exames:

·       As provas de exame (todas as épocas) são avaliadas de 0 a 8 valores.

·       A nota final da disciplina, obtida por exame, é a soma da classificação das aulas práticas e das provas escritas de Exame.

Data da prova de Frequência:

·       A prova de frequência será no dia 5 de Junho de 2018, às 09:30h.

 


Bibliografia:

 Principal:

   Mitchell, Tom:  Machine Learning McGraw-Hill Higher Education; New Edition (1 Oct 1997)

   Weiss, S. e Indurkhya, N.: Predictive Data Mining: A Practical Guide. Morgan Kaufmann (1998)

 Secundária:

Almeida, P: Previsão do Comportamento de Séries Temporais Financeiras com Apoio de Conhecimento Sobre o Domínio. Ph.D. Thesis (in Portuguese), Universidade da Beira Interior, Portugal, 2003.

Witten, I., Frank, E.: Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann (2005)

    · Recursos genéricos na internet:

            Uma boa base de artigos de informática:  http://citeseer.ist.psu.edu/index

            E, claro:  http://en.wikipedia.org/wiki/Main_Page  e  http://www.google.com/

 

 

Trabalhos práticos:

1.     Programação de um algoritmo de indução de regras, o PA5.

O pseudocódigo e alguns detalhes adicionais do programa serão disponibilizados nas aulas práticas.

2.     Programação de um sistema de previsão da variação da taxa de câmbio entre o Euro e o Dólar dos USA.

As previsões devem ser de classes binárias ("subida" ou "descida"), para o prazo de uma hora, e podem não apresentar cobertura total (é admitido que em alguns casos o sistema diga que não consegue efectuar previsão).

Como dados de treino, podem ser usados dados com qualquer periodo de amostragem do passado da propria série temporal, ou quaisquer dados com outras origens que não o passado da série temporal a prever. No desenvolvimento e parametrização do sistema de previsão, só devem ser usados dados até ao final de Março de 2018.

Deverá ser entregue um relatório de 3 páginas descrevendo o trabalho realizado e os seus resultados. Cada trabalho deverá ser exposto através de uma apresentação de 15 minutos.