Fundamentos de Estatística para Ciência de Dados / Fundamentals of Statistics for Data Science

Docente responsável:
Francesco Costigliola

Objetivos de aprendizagem (conhecimentos, aptidões e competências a desenvolver pelos estudantes):

OA1. A UC tem como objetivo dar ao estudante competências estatísticas para, numa fase seguinte, abordar UC’s técnicas mais avançadas pertencentes à área de Data Science e Machine Learning.
OA2. A capacidade de análise e síntese;
OA3. A capacidade de organização e planeamento;
OA4. A capacidade para resolver problemas e tomar decisões;
OA5. A capacidade de trabalhar em equipa;
OA6. A capacidade para aplicar na prática o conhecimento adquirido;
OA7. A capacidade para gerar novas ideias.
OA8. Entender os fundamentos da estatística; Aprender a tratar e visualizar diversos tipos de dados; Calcular as medidas de tendência central, assimetria e variabilidade; Calcular correlação e covariância; Distinguir e trabalhar com diversos tipos de distribuições; Estimar intervalos de confiança e realizar testes de hipóteses; Tomar decisões baseadas em dados; Entender o funcionamento da análise de regressão; Usar e compreender as variáveis dummy.

Intended learning outcomes (knowledge, skills and competences to be developed by the students):

LG1. The curricular unit gives the student fundamental statistical skills to approach more advanced technical CU´s belonging to the area of Data Science and Machine Learning.
LG2. The ability of analysis and synthesis;
LG3. The ability of organization and planning;
LG4.The ability to solve problems and make decisions;
LG5. The ability to work in a team;
LG6. The ability to put in practice the theoretical knowledge acquired;
LG7. The ability to develop new ideas.
LG8. discuss the main topics and concepts associated with statistics, such as: Understand the fundamentals of statistics; Learn how to work and visualize different types of data; Calculate measures of central tendency, asymmetry, and variability; Calculate correlation and covariance; Distinguish and work with different types of distributions; Estimate confidence intervals and perform hypothesis testing; Make data driven decisions; Understand the mechanics of regression analysis; Use and understand dummy variables.

Conteúdos programáticos:
O programa da unidade curricular é:
CP1. Introdução à Estatística
CP2. População vs. Amostra
CP3. Fundamentos de Estatística Descritiva
CP4. Medidas de Tendência central, assimetria e variabilidade
CP5. Distribuições Estatísticas
CP6. Estimadores e Estimas
CP7. Intervalos de Confiança
CP8. Testes de Hipóteses e Modelos Nulos
CP9. Análise de Regressão

Syllabus:
The Syllabus is:
PC1. Introduction to Statistics
PC2. Population vs. Sample
PC3. Basics of Descriptive Statistics
PC4. Measures of Central tendency, asymmetry and variability
PC5. Statistical Distributions
PC6. Estimators and Estimates
PC7. Confidence Intervals
PC8. Hypothesis Testing and Null Models
PC9. Regression Analysis

Demonstração da coerência dos conteúdos programáticos com os objetivos de aprendizagem da unidade curricular:
OA1 – todos os CP
OA2 a OA7 – todos os CP
OA8 – todos os CP

Evidence of the syllabus coherence with the curricular unit’s intended learning outcomes:

LG1 -–all PC
LG2 to LG7 – all PC
LG8 – all PC

Metodologias de ensino (avaliação incluída):
A metodologia de ensino (ME) e avaliação:
ME1: Expositiva: apresentação teórica de acordo com o plano curricular.
ME2: Experimental /Ativa: realização de um trabalho de projeto em grupo em laboratório e sua apresentação oral (50%).
ME3: Auto-estudo: trabalho individual do aluno demonstrado num exame teórico final (50%).
Notas importantes da avaliação:
– Classificação mínima obrigatória de 8 em cada componente.
– As componentes de avaliação são obrigatórias, independentemente da época em que se realiza o exame. – Os grupos do projeto podem ser entre 2 a 3 elementos.

Teaching methodologies (including students’ assessment):
Teaching methodologies (TM) including assessment:
TM1: Expositional: Theoretical exposition according to the syllabus.
TM2: Experimental /active: teamwork in a working laboratorial project and its oral presentation (50%). TM3: Self-study: individual work on a theoretical final test (50%).
Important assessment notes:
– Mandatory Minimum score of 8 in each component.
– The components of evaluation are mandatory, regardless of the period when the examination is made. – The Lab Project groups can be from 2 to 3 members.

Demonstração da coerência das metodologias de ensino com os objetivos de aprendizagem da unidade curricular:

ME1 – OA1 e OA8
ME2 – OA2, OA3, OA4, OA5, OA6, OA7 e OA8
ME3 – OA1, OA4, OA6, OA7 e OA8

Evidence of the coherence between the teaching methodologies and the intended learning outcomes:
TM1 – LG1 and LG8
TM2 – LG2, LG3, LG4, LG5, LG6, LG7 and LG8
TM3 – LG1, LG4, LG6, LG7 and LG8

Bibliografia de consulta/existência obrigatória:
Crawley, M. J. (2012). The R book. John Wiley & Sons. Chicago
Hastie, T., Tibshirani, R., & Friedman, J. (2002). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Biometrics.
James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning (Vol. 112). New York: springer.
Knaflic, C. N. (2015). Storytelling with data: A data visualization guide for business professionals. John Wiley & Sons.
Provost, F., Fawcett T. (2013) Data Science for Business: What you need to know about data mining and data-analytic thinking, O’Reilly Media Inc., 2013.

Universidade Lusófona


ECATI Escola de Comunicação, Arquitetura, Artes e Tecnologias da Informação

Departamento de Engenharia Informática e Sistemas de Informação
Edifício F, sala F.1.3
Direção — 217 515 500 (ext: 683)
Serviço de Apoio Tecnico-Admistrativo (SATA) — 17 515 500 (ext: 764)


Lisboa
Avenida do Campo Grande,
376 1749-024 Lisboa, Portugal
Tel.: 217 515 500 | email: info.cul@ulusofona.pt
Porto
Rua Augusto Rosa,
Nº 24, 4000-098 Porto - Portugal
Tel.: 222 073 230 | email: info.cup@ulusofona.pt

Gestão de conteúdos por Lucio Studer Ferreira © 2022 COFAC.