Mestrado em Ciência de Dados / Data Science

A Ciência dos Dados, ou Data Science, é uma disciplina científica multidisciplinar recente que vem dar resposta à necessidade de interpretação do grande volume de dados (big-data) que o avanço tecnológico veio trazer à sociedade.

O Mestrado em Ciência de Dados da Universidade Lusófona de Lisboa constitui o complemento natural para os candidatos que, tendo concluído uma das licenciaturas em Engenharia Informática, Estatística, Física, Matemática, Gestão, Ciências Económicas e Financeiras ou afins desejem prolongar os seus estudos com a realização de um 2º ciclo, com o objetivo de obter um maior nível de especialização e o acesso a níveis de contratação profissionais mais elevados.

Este ciclo proporciona uma introdução às ciências de dados com uma sólida formação em técnicas de vanguarda para análise de dados, engenharia de dados e os conhecimentos necessários em privacidade, segurança e ética fundamentais para tratar dados de acordo com as leis que regem os dados.

Critérios de seriação:

Apreciação curricular – 100%

Plano de Estudos

Explore os conteúdos e projetos das unidades curriculares

  • 1.º Ano

    1.º Semestre
    • Fundamentos de Estatística para Ciência de Dados

      Apresentação

      Esta unidade curricular dedica-se aos conceitos fundamentais da teoria da probabilidade, estatística e inferência estatística.

      DocentesSofia Naique

      Programa

      1. Estatística Descritiva

      Tipos de dados: inteiros, contínuos, categóricos, array, matriz

      Tabelas de frequências

      Medidas de centralidade e de variabilidade

      Visualização (Gráficos de barras, Histogramas, Caixas de Bigodes … )

       

      2. Regressão Linear

      Variável independente vs. dependente.

      Gráficos de dispersão

      Covariância e coeficiente de Pearson

      Reta de regressão, resíduo, método dos mínimos quadrados

      Cálculo da estimativa para a resposta, dado certo valor para a variável independente

       

      3. Probabilidade

      Experiência aleatória. Espaço de resultados. Evento. Operações entre eventos.

      Propriedades da função probabilidade. Probabilidade da união de eventos

      Lei da probabilidade total

      Teorema de Bayes

      Probabilidade condicionada. Eventos independentes

       

      4. Inferência Estatística

      Amostra e amostra aleatória

      Estimador e estimativa para uma proporção

      Teste de hipótese para uma proporção

    • Introdução à Ciência de Dados

      Apresentação

      A disciplina de Introdução à Ciência de Dados tem como objectivo dar ao estudante competências essenciais na análise de dados, numa perspetiva multidisciplinar, como se trata a  Ciência de Dados. Através da apresentação de metodologias e técnicas fundamentais para tratar, transformar, construir e analisar os dados, é objectivo desta disciplina dar ao estudante capacidade para traduzir essa análise em conhecimento e valor, de modo sustentado para a tomada de decisão.

      A componente prática é um dos aspetos fundamentais da disciplina, pelo que a capacidade de traduzir conhecimento em ações práticas e decisões de análise é particularmente valorizada. A ligação estreita ao mundo empresarial para resposta a perguntas de negócios será retratada nesta disciplina.

      DocentesJoão Caldeira

      Programa

      1. Introdução à Ciência de Dados:

      • Importância e aplicações da Ciência de Dados
      • Worflow de Projectos: Exemplos Práticos
      • Tipos de dados: Estruturados, Semi-estruturados e não estruturados
      • Principais desafios na Ciência de Dados

       

      2. Python para Ciência de Dados

      • Setup: Jupyter notebook
      • NumPy 
      • Pandas
      • ydata-profiling

       

      3. Pré-processamento de dados

      • Limpeza e preparação de dados estruturados (data wrangling: slicing, grouby, pivoting, missing values, imputation, duplicates, outliers, etc)
      • Tratamento de dados não estruturado – Texto (lemmatisation, stemming, etc.)

       

      4. Introdução ao Machine Learning, modelos superviosionados e não superviosionados

      • Conceitos base
      • Regressão Linear
      • Regressão Logística
      • Redução de Dimensionalidade (PCA)

       

      5. Micro-Serviços e fundamentos de APIs

      • Definição de API
      • Desenho de APIs
      • Implementação de APIs em Python
      • Operação de APIs num contexto de processo de previsão
    • Privacidade, Segurança e Ética em Ciência de Dados

      Apresentação

      Esta Unidade Curricular pretende dotar o discente de conhecimentos e competências em ética, segurança e privacidade no âmbito da ciência de dados, bem como de sentido e avaliação de impacto na introdução e utilização de tecnologias avançadas no tratamento de grandes volumes de dados.

      DocentesCarlos FernandesSofia Fernandes

      Programa

      CP1. Introdução à Ética.  Utilitarismo e deontologia.

      CP2. Ética e ciência de dados. Considerações éticas envolvidas no processamento algorítmico de dados sensíveis e no desenvolvimento responsável de Inteligência Artificial.

      CP3. Gestão de dados e linhagem de dados. Informação sensível e informação pessoal: como identificar.

      CP4. Tecnologias de privacidade. Técnicas básicas de privacidade em ciência de dados. Anonimização e pseudo-anonimização. Privacidade diferencial.

      CP5. Estruturas legais e regulatórias relacionadas com a privacidade e segurança de dados.

      CP6. Introdução de conceitos gerais de segurança e a sua importância em sistemas de aprendizagem automática

      CP7. Tipos de ataques em sistemas de  aprendizagem automática

      CP8. Abordagens de mitigação, regulamentos e orientações de segurança em sistemas de aprendizagem automática

    • Programação Aplicada para Ciência de Dados

      Apresentação

      Nesta Unidade Curricular (UC), mergulhamos nas bases essenciais da programação aplicada à Ciência de Dados. Aprimoramos habilidades na criação de algoritmos e na construção de estruturas de dados em Python, capacitando para a manipulação (extração, transformação, armazenamento) e análise de dados, o cerne da Ciência de Dados. Estrategicamente situada no primeiro semestre do mestrado, esta UC fomenta habilidades cruciais. Desenvolve a capacidade de abstração, o pensamento lógico e estruturado, além de aprimorar a mestria algorítmica. Mais do que isso, estimula o pensamento criativo e a habilidade de resolver problemas – competências fundamentais na formação de um cientista de dados. Estas bases sólidas constituem alicerces essenciais, preparando os estudantes para módulos mais avançados do mestrado

      DocentesLucio Studer

      Programa

      Os Conteúdos Programáticos (CP) desta unidade curricular são os seguintes:

      CP1. Introdução à programação

      CP2. Introdução à linguagem Python e sua sintaxe

      CP3. Intordução aos ambientes de trabalho Jupyter Notebook, Google Collab e Moodle CodeRunner.

      CP4. Sintaxe do Python. Variáveis e operadores. Tipos de dados simples: numéricos; strings e seus métodos.

      CP5: Controlo de fluxo, com decisores e ciclos.

      CP6. Funções. Módulos e packages.

      CP7: Tipos de dados compostos: listas, tuplos, sets e dicionários

      CP8: Manipulação e gestão de ficheiros (texto, JSON, CSV).

      CP9: Visualização de dados com matplotlib.

      CP10: Programação funcional. Compreensões, lambda, map, filter, reduce.

      CP11: Programação orientada a objetos. Classes.

    • Seminário de Orientação

      Apresentação

      Esta unidade curricular pretende ser uma introdução à investigação e cultura científicas na área de informática e ciências da computação.

      Os alunos observam a aplicação de conceitos elementares do processo de investigação científica, sendo também encorajados a utilizá-los em situações práticas. Pretende-se que estes conhecimentos, teóricos e práticos, sejam aplicados nas restantes unidades curriculares do mestrado, em particular na elaboração da proposta de dissertação.

      Programa

      1. Processo de investigação científica
      2. Escrita científica e estratégias de publicação
      3. Análise crítica e discussão de artigos científicos 
      4. Pesquisa bibliográfica
      5. Realização de comunicações orais
    2.º Semestre
  • 2.º Ano

    1.º Semestre
    • Seminário de Projeto

      Apresentação

      Esta unidade curricular pretende desenvolver a investigação e cultura científicas na área de informática e ciências da computação. Os alunos tomam parte ativa na aplicação de conceitos elementares do processo de investigação científica, aplicando-os à elaboração da sua proposta de dissertação.

      Programa

      1. Processo de investigação científica
      2. Escrita científica e estratégias de publicação
      3. Análise crítica e discussão de artigos científicos
      4. Pesquisa bibliográfica
      5. Realização de comunicações orais
    • Tópicos em Aprendizagem Automatizada e suas Aplicações

      Apresentação

      Na sequência de Fundamentos de Estatística para Ciências de Dados e Programação Aplicada para Ciência de Dados, estas disciplina visa introduzir os conceitos de aprendizagem automatizada supervisionada. A introdução dos conceitos de regressão e de classificação permite ao aluno a identificação do tipo de problema a ser abordado. Isto permite aos estudantes adquirir competências para analisar problemas e definir estratégias de resolução. Dentre as diferentes possibilidades de modelagem do problema, o aluno será capaz de identificar as possíveis abordagens e decidir sobre a melhor solução para um determinado conjunto de dados.

      Programa

      CP1. Pré-processamento de dados

      CP2. Regressão: Regressão Linear Simples, Regressão Linear Múltipla, Regressão Polinomial, Árvore de Decisão, Regressão Random Forest, Support Vector Regression.

      CP3. Classificação: Regressão Logística, K-NN, Support Vector Machines, Kernel SVM, Naive Bayes, Árvore de Decisão, Classificação Random Forest.

      CP4. Redução de Dimensionalidade

      CP5. Seleção e Boosting do Modelo: Validação Cruzada k-fold, Ajuste de Parâmetros, Grid Search, XGBoost

    2.º Semestre

Áreas Científicas

  • Outra forma de olhar para o curso e suas disciplinas

    • Matemáticas e Físicas

      • Fundamentos de Estatística para Ciência de Dados

        Apresentação

        Esta unidade curricular dedica-se aos conceitos fundamentais da teoria da probabilidade, estatística e inferência estatística.

        DocentesSofia Naique

        Programa

        1. Estatística Descritiva

        Tipos de dados: inteiros, contínuos, categóricos, array, matriz

        Tabelas de frequências

        Medidas de centralidade e de variabilidade

        Visualização (Gráficos de barras, Histogramas, Caixas de Bigodes … )

         

        2. Regressão Linear

        Variável independente vs. dependente.

        Gráficos de dispersão

        Covariância e coeficiente de Pearson

        Reta de regressão, resíduo, método dos mínimos quadrados

        Cálculo da estimativa para a resposta, dado certo valor para a variável independente

         

        3. Probabilidade

        Experiência aleatória. Espaço de resultados. Evento. Operações entre eventos.

        Propriedades da função probabilidade. Probabilidade da união de eventos

        Lei da probabilidade total

        Teorema de Bayes

        Probabilidade condicionada. Eventos independentes

         

        4. Inferência Estatística

        Amostra e amostra aleatória

        Estimador e estimativa para uma proporção

        Teste de hipótese para uma proporção

        Objetivos

        Esta disciplina permite que o(a) aluno(a) seja

        OA1: seja exposto à probabilidade como uma função de medida essencial à ciência.

        OA2: entenda a estatística como uma área da ciência que permite à engenharia recolher dados, analisar dados, formular hipóteses relativas a esses dados e testar essas hipóteses. Nessa medida, a estatística e a probabilidade são essenciais ao conhecimento e à engenharia.

    • Arquiteturas e Sistemas Operativos

    • Redes e Telecomunicações

    • Programação e Engenharia de SW

      • Programação Aplicada para Ciência de Dados

        Apresentação

        Nesta Unidade Curricular (UC), mergulhamos nas bases essenciais da programação aplicada à Ciência de Dados. Aprimoramos habilidades na criação de algoritmos e na construção de estruturas de dados em Python, capacitando para a manipulação (extração, transformação, armazenamento) e análise de dados, o cerne da Ciência de Dados. Estrategicamente situada no primeiro semestre do mestrado, esta UC fomenta habilidades cruciais. Desenvolve a capacidade de abstração, o pensamento lógico e estruturado, além de aprimorar a mestria algorítmica. Mais do que isso, estimula o pensamento criativo e a habilidade de resolver problemas – competências fundamentais na formação de um cientista de dados. Estas bases sólidas constituem alicerces essenciais, preparando os estudantes para módulos mais avançados do mestrado

        DocentesLucio Studer

        Programa

        Os Conteúdos Programáticos (CP) desta unidade curricular são os seguintes:

        CP1. Introdução à programação

        CP2. Introdução à linguagem Python e sua sintaxe

        CP3. Intordução aos ambientes de trabalho Jupyter Notebook, Google Collab e Moodle CodeRunner.

        CP4. Sintaxe do Python. Variáveis e operadores. Tipos de dados simples: numéricos; strings e seus métodos.

        CP5: Controlo de fluxo, com decisores e ciclos.

        CP6. Funções. Módulos e packages.

        CP7: Tipos de dados compostos: listas, tuplos, sets e dicionários

        CP8: Manipulação e gestão de ficheiros (texto, JSON, CSV).

        CP9: Visualização de dados com matplotlib.

        CP10: Programação funcional. Compreensões, lambda, map, filter, reduce.

        CP11: Programação orientada a objetos. Classes.

        Objetivos

        Esta Unidade Curricular tem os seguintes Objetivos de Aprendizagem (OA):

        OA1. Conhecimentos Fundamentais em Programação:

        • Compreensão sólida dos princípios da programação.
        • Familiaridade proficiente com a linguagem Python.

        OA2. Aptidões para Resolução de Problemas:

        • Habilidade de analisar e decompor problemas complexos em partes menores, permitindo uma compreensão mais clara e uma abordagem mais controlada.
        • Abstração eficaz para isolar elementos cruciais e identificar estruturas de dados adequadas.
        • Raciocínio lógico, identificando padrões e tomando decisões fundamentadas.

        OA3. Competências em Manipulação de Dados:

        • Coleta, limpeza e transformação (ETL) de dados para análise.
        • Criação de algoritmos eficientes para resolver desafios reais.

        OA4. Preparação para Módulos Avançados:

        • Base sólida para explorar tópicos mais complexos em análise de dados.
        • Desenvolvimento do pensamento crítico e criativo
    • Sistemas de Informação

    • Interação Humano-Máquina

    • Dados e Inteligência Artificial

      • Introdução à Ciência de Dados

        Apresentação

        A disciplina de Introdução à Ciência de Dados tem como objectivo dar ao estudante competências essenciais na análise de dados, numa perspetiva multidisciplinar, como se trata a  Ciência de Dados. Através da apresentação de metodologias e técnicas fundamentais para tratar, transformar, construir e analisar os dados, é objectivo desta disciplina dar ao estudante capacidade para traduzir essa análise em conhecimento e valor, de modo sustentado para a tomada de decisão.

        A componente prática é um dos aspetos fundamentais da disciplina, pelo que a capacidade de traduzir conhecimento em ações práticas e decisões de análise é particularmente valorizada. A ligação estreita ao mundo empresarial para resposta a perguntas de negócios será retratada nesta disciplina.

        DocentesJoão Caldeira

        Programa

        1. Introdução à Ciência de Dados:

        • Importância e aplicações da Ciência de Dados
        • Worflow de Projectos: Exemplos Práticos
        • Tipos de dados: Estruturados, Semi-estruturados e não estruturados
        • Principais desafios na Ciência de Dados

         

        2. Python para Ciência de Dados

        • Setup: Jupyter notebook
        • NumPy 
        • Pandas
        • ydata-profiling

         

        3. Pré-processamento de dados

        • Limpeza e preparação de dados estruturados (data wrangling: slicing, grouby, pivoting, missing values, imputation, duplicates, outliers, etc)
        • Tratamento de dados não estruturado – Texto (lemmatisation, stemming, etc.)

         

        4. Introdução ao Machine Learning, modelos superviosionados e não superviosionados

        • Conceitos base
        • Regressão Linear
        • Regressão Logística
        • Redução de Dimensionalidade (PCA)

         

        5. Micro-Serviços e fundamentos de APIs

        • Definição de API
        • Desenho de APIs
        • Implementação de APIs em Python
        • Operação de APIs num contexto de processo de previsão

        Objetivos

         A disciplina tem como objetivos dar ao aluno as competências para:

        • OA1. Compreender a importância da Ciência de Dados no mundo real
        • OA2. Compreender a natureza dos dados
        • OA3. Entender as principais técnicas e métodos, em programação Python, usados por cientistas de dados, através da sua prática
        • OA4. Ser capaz de proceder a tarefas básicas de preparação e pré-processamento de dados
        • OA5. Fazer análise exploratórias de dados com implementação em Python
        • OA6. Entender o fluxo de trabalho de um cientista de dados e ser capaz de pensar sobre a solução de problemas com dados
        • OA7. Entender e implementar métodos de aprendizagem automática, supervisionados e não supervisionados
        • OA8. Conhecer as métricas de avaliação do desempenho de um modelo
        • OA9. Entender o conceito de API e desenhar micro serviços num contexto de análise de dados
        • OA10. Ser capaz de implementar APIs que suportem métodos de aprendizagem automática em Python
      • Privacidade, Segurança e Ética em Ciência de Dados

        Apresentação

        Esta Unidade Curricular pretende dotar o discente de conhecimentos e competências em ética, segurança e privacidade no âmbito da ciência de dados, bem como de sentido e avaliação de impacto na introdução e utilização de tecnologias avançadas no tratamento de grandes volumes de dados.

        DocentesCarlos FernandesSofia Fernandes

        Programa

        CP1. Introdução à Ética.  Utilitarismo e deontologia.

        CP2. Ética e ciência de dados. Considerações éticas envolvidas no processamento algorítmico de dados sensíveis e no desenvolvimento responsável de Inteligência Artificial.

        CP3. Gestão de dados e linhagem de dados. Informação sensível e informação pessoal: como identificar.

        CP4. Tecnologias de privacidade. Técnicas básicas de privacidade em ciência de dados. Anonimização e pseudo-anonimização. Privacidade diferencial.

        CP5. Estruturas legais e regulatórias relacionadas com a privacidade e segurança de dados.

        CP6. Introdução de conceitos gerais de segurança e a sua importância em sistemas de aprendizagem automática

        CP7. Tipos de ataques em sistemas de  aprendizagem automática

        CP8. Abordagens de mitigação, regulamentos e orientações de segurança em sistemas de aprendizagem automática

        Objetivos

        OA1. Compreender os fundamentos da Ética como filosofia moral e pensar numa deontologia para a ciência de dados.

        OA2. Conhecer os protocolos fundamentais na gestão de dados e compreender o conceito de linhagem de dados. 

        OA3. Identificar informação sensível e informação de identificação pessoal.

        OA4. Conhecer técnicas concretas que podem ajudar a proteger a privacidade individual ao trabalhar com conjuntos de dados grandes.

        OA5. Conhecer os requisitos legais e regulatórios relacionados à privacidade e segurança de dados.

        OA6. Compreender a importância de estabelecer estruturas robustas de gestão de dados dentro das organizações para garantir a conformidade com as regulamentações de privacidade.

        OA7. Compreender a necessidade de medidas de segurança específicas para sistemas de aprendizagem automática.

        OA8. Compreender os principais tipos de ataques a sistemas de aprendizagem automática e as medidas de prevenção e mitigação dos mesmos.

    • Gestão e Softskills

    • Genérica

Detalhes

  • Objetivos do curso

    Desenvolver competências de trabalho em equipe e a preparação para a competitividade que o aluno vai encontrar no trabalho:

    1 – Garantindo que numa metodologia de interação de grupo o aluno adquira a aptidão de trabalho em equipe.

    2 – Garantindo uma formação técnica introdutória diversa e consistente em técnicas de vanguarda e que adicionalmente garanta ao aluno uma maior fluidez na aquisição e desenvolvimento de novas técnicas que vai encontrar no futuro.

    3 – Desenvolvendo a capacidade e habilidade de uma metodologia de trabalho que façam face à exigência de apresentar resultados rápidos e rigorosos na sua qualidade.

  • Competências adquiridas

    Adquirir conhecimentos em: fundamentos teóricos, metodológicos e práticos nas áreas de análise de dados em particular de estatística, análise exploratória de dados, aprendizagem automatizada, análise relacional, Estrutura de dados e algoritmos, sistemas de recomendação e privacidade, segurança e ética.

    Aptidões em:
    1 – Criar ambientes de trabalho computacionais, e.g. Python em plataformas de AWS,
    2 – Aceder e tratar os dados em conformidade com as leis de proteção de dados,
    3 – Criar estruturas de dados para análise,
    4 – Fazer análises exploratórias de dados
    5 – Usar técnicas de deteção de padrões,
    6 – Formular hipóteses e desenhar experimentos com base nos conhecimentos adquiridos, e repetir ciclos de análise até à conclusão.

    As Competências:
    1 – Completar os ciclos de análise experimental;
    2 – Obter resultados de qualidade científica com fluidez;
    3 – Saber integrar-se e trabalhar em equipas multidisciplinares,
    4 – Boa capacidade de síntese a apresentar resultados.

  • Destinatários

    Este ciclo de estudos destina-se a candidatos com bases em áreas de Informática, Estatística, Física, Matemática, Gestão, Ciências Economias e Financeiras ou afins, que queiram adquirir competências na área de Ciência de Dados.

  • Ligação com o meio empresarial

  • Oportunidades de carreira

    Através de um ciclo de estudos contando com a colaboração de empresas e instituições de I&D, o Mestrado em Ciência de Dados implementa um programa destinado a garantir aos seus candidatos um alto grau de empregabilidade, com destaque para os seguintes perfis:

    – Data Scientist / Cientista de Dados
    – Applied Data Scientist / Cientista de dados Aplicado
    – Applied Data Researcher / Investigador de Dados Aplicado
    – Applied Machine Learning Researcher / Investigador de Aprendizagem Automatizada Aplicada
    – Business Intelligence Analyst / Analista de Inteligência de Negócio

Universidade Lusófona


ECATI Escola de Comunicação, Arquitetura, Artes e Tecnologias da Informação

Departamento de Engenharia Informática e Sistemas de Informação
Edifício F, sala F.1.3
Direção — 217 515 500 (ext: 683)
Serviço de Apoio Tecnico-Admistrativo (SATA) — 17 515 500 (ext: 764)


Lisboa
Avenida do Campo Grande,
376 1749-024 Lisboa, Portugal
Tel.: 217 515 500 | email: info.cul@ulusofona.pt
Porto
Rua Augusto Rosa,
Nº 24, 4000-098 Porto - Portugal
Tel.: 222 073 230 | email: info.cup@ulusofona.pt

Gestão de conteúdos por Lucio Studer Ferreira © 2022 COFAC.