Descoberta de Conhecimento em Base de Dados

Código: CC5015     Sigla: KDD     Nível: 500

Áreas Científicas
Classificação Área Científica
OFICIAL Informática

Ocorrência: 2022/2023 - 1S

Ativa? Sim
Unidade Responsável: Departamento de Ciência de Computadores
Curso/CE Responsável: Programa Doutoral em Informática

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
PDMAPI 8 Plano Oficial a partir de 2020/2021 1 - 6 30 162

Língua de trabalho

Inglês

Objetivos

At the end of the semester the students should be able to:

  1. Formulate a decision problem as a data mining problem;
  2. Identify the basic tasks in knowledge discovery from data bases;
  3. Identify and use the main methods in solving data mining problems;
  4. Apply the main methods and algorithms for each mining task;
  5. Apply the  main  methods  and  algorithms  in  real-world  problems  and adapt to new contexts

Resultados de aprendizagem e competências

Knowledge of how to formulate a problem as a problem of knowledge extraction. Ability to apply methods / algorithms to a new problem of data analysis, and evaluate the results and understand the functioning of the methods studied.

Modo de trabalho

Presencial

Programa


  • Introductory Concepts


– Introduction to Knowledge Discovery in Data Bases


∗ From OLAP to On-Line Analytical Mining;


∗ Data Mining tasks;


– Cluster Analysis


∗ Cluster Analysis:  concepts and methods;


∗ Partitioning and Hierarchical Methods;


– Association Analysis


∗ Frequent pattern mining;


∗ Frequent Sequence mining;


– Predictive Data Mining:  Classification and Regression.


∗ Optimization Methods:  Artificial Neural Networks;  Support Vector Machines.


∗ Probabilistic Methods:  Bayesian Classifiers;


∗ Search based Methods:  Decision Trees and Rules.


– Evaluation in Predictive Data Mining.


∗ Evaluation:  goals and perspectives;


∗ Loss Functions and Cost-benefit analysis;


∗ Bias-Variance analysis;


– Ensembles and Multiple Models


∗ Concepts and methods;


∗ Combining Homogeneous Models;


∗ Combining Heterogeneous models;



  • Advanced Topics


– Social Network Analysis


∗ Concepts and methods;


∗ Evolution of Networks;


– Text Mining


∗ Concepts and methods;


∗ Information retrieval;


∗ Document classification;


– Web Mining and Link Analysis


∗ Concepts and methods;


∗ Web and Structure mining;


∗ Link analysis;


– Big Data and Data stream Mining


∗ Big Data:  Applications and tools


∗ Concepts and methods;


∗ Summarizing data streams;


∗ Knowledge discovery from data streams;


– Data Mining Standards and Processes

Bibliografia Obrigatória

J. Gama, A. Carvalho, K. Faceli, A. Lorena, M. Oliveira; Extração de Conhecimento de Dados - Data Mining, Sílabo, 2012
Jiawei Han e Micheline Kamber; Data Mining, Concepts and Techniques, Morgan Kaufmann, 2006
J. Gama; Knowledge Discovery from Data Streams, CRC Press, 2010

Métodos de ensino e atividades de aprendizagem

The teaching method consists of theoretical-practical classes.

Tipo de avaliação

Avaliação distribuída sem exame final

Componentes de Avaliação

Designação Peso (%)
Participação presencial 10,00
Trabalho prático ou de projeto 90,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Elaboração de projeto 28,00
Estudo autónomo 28,00
Frequência das aulas 28,00
Total: 84,00

Obtenção de frequência

Entregar o trabalho

Fórmula de cálculo da classificação final

The evaluation consists of home-works.