Docente responsável
Milos Stankovic
Objetivos de aprendizagem (conhecimentos, aptidões e competências a desenvolver pelos estudantes)
OA1. A capacidade de organização e planeamento, a capacidade de análise e síntese, capacidade para resolver problemas e tomar decisões, capacidade de trabalhar em equipa, capacidade para aplicar na prática o conhecimento adquirido e capacidade para gerar novas ideias.
OA2. Relativamente à componente técnica, na conclusão do curso, o aluno deverá ser capaz de discutir as principais noções e conceitos, tais como: – Desenvoler técnicas de Machine Learning em R (e Python) – Ter uma visão geral de muitos modelos de Machine Learning – Fazer previsões precisas e análises poderosas – Desenvolver modelos robustos de Machine Learning – Utilizar Machine Learning para criar valor ao negócio – Lidar com técnicas avançadas para Redução de Dimensionalidade – Criar vários modelos de Machine Learning e entender como combiná-los para resolver um problema.
Intended learning outcomes (knowledge, skills and competences to be developed by the students)
LG1. The ability of organization and planning, the ability of analysis and synthesis, the ability to solve problems and make decisions, the ability to work in a team, the ability to put in practice the theoretical knowledge acquired and the ability to develop new ideas.
LG2. Regarding the technical component, at the end of the course, the student should be able to discuss the main topics and concepts, such as: – Master Machine Learning on R (and Python) – Have an overview of many Machine Learning models – Make accurate predictions and powerful analysis – Make robust Machine Learning models – Create strong added value to your business using Machine Learning – Introduce specific topics like Reinforcement Learning and Deep Learning – Handle advanced techniques like Dimensionality Reduction – Build several Machine Learning models and understand how to combine them to solve a problem.
Conteúdos programáticos
O programa da disciplina é:
CP1. Pré-processamento de dados
CP2. Regressão: Regressão Linear Simples, Regressão Linear Múltipla, Regressão Polinomial, SVR, Árvore de Decisão, Regressão Random Forest CP3. Classificação: Regressão Logística, K-NN, SVM, Kernel SVM, Naive Bayes, Árvore de Decisão, Classificação Random Forest
CP4. Clustering: K-Means, Clustering Hierárquico
CP5. Aprendizagem da Regras de Associação: Apriori, Eclat CP6. Redução de Dimensionalidade: PCA, LDA, Kernel PCA
CP7. Seleção e Boosting do Modelo: Validação Cruzada k-fold, Ajuste de Parâmetros, Grid Search, XGBoost
Syllabus
The Syllabus is:
PC1. Data Preprocessing
PC2. Regression: Simple Linear Regression, Multiple Linear Regression, Polynomial Regression, SVR, Decision Tree Regression, Random Forest Regression
PC3. Classification: Logistic Regression, K-NN, SVM, Kernel SVM, Naive Bayes, Decision Tree Classification, Random Forest Classification PC4. Clustering: K-Means, Hierarchical Clustering
PC5. Association Rule Learning: Apriori, Eclat
CP6. Dimensionality Reduction: PCA, LDA, Kernel PCA
CP7. Model Selection & Boosting: k-fold Cross Validation, Parameter Tuning, Grid Search, XGBoost
Demonstração da coerência dos conteúdos programáticos com os objetivos de aprendizagem da unidade curricular
OA1 – todos os CP
OA2 – todos os CP
Evidence of the syllabus coherence with the curricular unit’s intended learning outcomes
LG1 – all PC
LG2 – all PC
Metodologias de ensino (avaliação incluída)
A metodologia de ensino (ME) e avaliação:
ME1: Expositiva: apresentação teórica de acordo com o plano curricular. ME2: Experimental /Ativa: realização de um trabalho de projeto em grupo em laboratório e sua apresentação oral (50%).
ME3: Auto-estudo: trabalho individual do aluno demonstrado num exame teórico final (50%).
Notas importantes da avaliação:
– Classificação mínima obrigatória de 9.5 em cada componente. – As componentes de avaliação são obrigatórias, independentemente da época em que se realiza o exame.
– Os grupos do projeto podem ser entre 2 a 3 elementos.
Teaching methodologies (including students’ assessment):
Teaching methodologies (TM) including assessment:
TM1: Expositional: Theoretical exposition according to the syllabus. TM2: Experimental /active: teamwork in a working laboratorial project and its oral presentation (50%).
TM3: Self-study: individual work on a theoretical final test (50%).
Important assessment notes:
– Mandatory Minimum score of 9.5 in each component.
– The components of evaluation are mandatory, regardless of the period when the examination is made.
– The Lab Project groups can be from 2 to 3 members.
Demonstração da coerência das metodologias de ensino com os objetivos de aprendizagem da unidade curricular
ME1 – OA2
ME2 – OA1 e OA2
ME3 – OA2
Evidence of the teaching methodologies and the intended learning outcomes
TM1 – LG2
TM2 – LG1 and LG2
TM3 – LG2
Bibliografia de consulta/existência obrigatória/ Main bibliography
Goodfellow, I., Bengio, Y., & Courville (2017) Deep Learning (Adaptive Computation and Machine Learning Series), MIT Press, 2017.
Mohri, M., Rostamizadeh, A., Talwalkar, A. (2018). Foundations of Machine Learning. 2nd edition, The MIT Press.
Russel S., Norvig P. (2016) Artificial Intelligence: A Modern Approach (3rd ed.), Pearson, 2016 Hastie, T., Tibshirani, R., & Friedman, J. (2002). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Biometrics.
James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning (Vol. 112). New York: springer.
Knaflic, C. N. (2015). Storytelling with data: A data visualization guide for business professionals. John Wiley & Sons.
Provost, F., Fawcett T. (2013) Data Science for Business: What you need to know about data mining and data-analytic thinking, O’Reilly Media Inc., 2013.
Departamento de Engenharia Informática e Sistemas de Informação
Edifício F, sala F.1.3
Direção — 217 515 500 (ext: 683)
Serviço de Apoio Tecnico-Admistrativo (SATA) — 17 515 500 (ext: 764)
Gestão de conteúdos por Lucio Studer Ferreira © 2022 COFAC.