Descoberta de Conhecimento em Base de Dados
Código: | CC5015 | Sigla: | KDD | Nível: | 500 |
Áreas Científicas | |
---|---|
Classificação | Área Científica |
OFICIAL | Informática |
Ocorrência: 2022/2023 - 1S
Ativa? | Sim |
Unidade Responsável: | Departamento de Ciência de Computadores |
Curso/CE Responsável: | Programa Doutoral em Informática |
Ciclos de Estudo/Cursos
Sigla | Nº de Estudantes | Plano de Estudos | Anos Curriculares | Créditos UCN | Créditos ECTS | Horas de Contacto | Horas Totais |
---|---|---|---|---|---|---|---|
PDMAPI | 8 | Plano Oficial a partir de 2020/2021 | 1 | - | 6 | 30 | 162 |
Língua de trabalho
InglêsObjetivos
At the end of the semester the students should be able to:
- Formulate a decision problem as a data mining problem;
- Identify the basic tasks in knowledge discovery from data bases;
- Identify and use the main methods in solving data mining problems;
- Apply the main methods and algorithms for each mining task;
- Apply the main methods and algorithms in real-world problems and adapt to new contexts
Resultados de aprendizagem e competências
Knowledge of how to formulate a problem as a problem of knowledge extraction. Ability to apply methods / algorithms to a new problem of data analysis, and evaluate the results and understand the functioning of the methods studied.Modo de trabalho
PresencialPrograma
- Introductory Concepts
– Introduction to Knowledge Discovery in Data Bases
∗ From OLAP to On-Line Analytical Mining;
∗ Data Mining tasks;
– Cluster Analysis
∗ Cluster Analysis: concepts and methods;
∗ Partitioning and Hierarchical Methods;
– Association Analysis
∗ Frequent pattern mining;
∗ Frequent Sequence mining;
– Predictive Data Mining: Classification and Regression.
∗ Optimization Methods: Artificial Neural Networks; Support Vector Machines.
∗ Probabilistic Methods: Bayesian Classifiers;
∗ Search based Methods: Decision Trees and Rules.
– Evaluation in Predictive Data Mining.
∗ Evaluation: goals and perspectives;
∗ Loss Functions and Cost-benefit analysis;
∗ Bias-Variance analysis;
– Ensembles and Multiple Models
∗ Concepts and methods;
∗ Combining Homogeneous Models;
∗ Combining Heterogeneous models;
- Advanced Topics
– Social Network Analysis
∗ Concepts and methods;
∗ Evolution of Networks;
– Text Mining
∗ Concepts and methods;
∗ Information retrieval;
∗ Document classification;
– Web Mining and Link Analysis
∗ Concepts and methods;
∗ Web and Structure mining;
∗ Link analysis;
– Big Data and Data stream Mining
∗ Big Data: Applications and tools
∗ Concepts and methods;
∗ Summarizing data streams;
∗ Knowledge discovery from data streams;
– Data Mining Standards and Processes
Bibliografia Obrigatória
J. Gama, A. Carvalho, K. Faceli, A. Lorena, M. Oliveira; Extração de Conhecimento de Dados - Data Mining, Sílabo, 2012Jiawei Han e Micheline Kamber; Data Mining, Concepts and Techniques, Morgan Kaufmann, 2006
J. Gama; Knowledge Discovery from Data Streams, CRC Press, 2010
Métodos de ensino e atividades de aprendizagem
The teaching method consists of theoretical-practical classes.Tipo de avaliação
Avaliação distribuída sem exame finalComponentes de Avaliação
Designação | Peso (%) |
---|---|
Participação presencial | 10,00 |
Trabalho prático ou de projeto | 90,00 |
Total: | 100,00 |
Componentes de Ocupação
Designação | Tempo (Horas) |
---|---|
Elaboração de projeto | 28,00 |
Estudo autónomo | 28,00 |
Frequência das aulas | 28,00 |
Total: | 84,00 |
Obtenção de frequência
Entregar o trabalhoFórmula de cálculo da classificação final
The evaluation consists of home-works.