Mário M. Freire
         Full Professor (Professor Catedrático)

           Department of Computer Science, University of Beira Interior
           Rua Marquês de Ávila e Bolama, 6201-001 Covilhã, Portugal

           E-mail addresses: mfreire(at)computer.org  or  mfreire(at)acm.org  or  mario(at)di.ubi.pt



Computação na Cloud / Cloud Computing 2017/2018
Mestrado em Engenharia Informática / MS in Computer Science and Engineering

"Be. If you can not be a pine on the top of a hill, be a bush in the valley but be the best bush to the stream bank. Be a branch if you can not be a tree. If you can not be a branch, be a little grass and give joy to some way. If you can not be a highway, Be just a path, if you can not be the sun, be a star. It is not by size that you will have success or failure ... But be the best in whatever you are."

Pablo Neruda (1904-1973), Chilean poet-diplomat and politician.

Objetivos Gerais, Avaliação e Bibliografia / Course Description, Evaluation and Grading and Bibliography


Objetivos Gerais e Resultados de Aprendizagem / Course Objectives
O objetivo da unidade curricular consiste em dotar os estudantes de uma perspetiva ampla e integradora da computação na cloud. No final da unidade curricular o estudante deve ser capaz de sistematizar uma abordagem vertical às diversas tecnologias de computação na cloud, que ofereça às aplicações e serviços maior flexibilidade, melhor utilização de recursos, maior escalabilidade e adaptabilidade e redução de custos. O estudante deve ser capaz de avaliar escolhas, soluções e compromissos envolvidos na configuração e gestão de sistemas cloud e deve ser capaz de desenvolver aplicações e sistemas, escaláveis e fiáveis, para computação na cloud.
The aim of the course is to provide students with a broad and integrative perspective of cloud computing. At the end of the course, students should be able to systematize a vertical approach to the various cloud computing technologies that provide applications and services with greater flexibility, better resource utilization, greater scalability and adaptability, and reduced costs. Students should be able to assess the choices, solutions and commitments involved in configuring and managing cloud systems and should be able to develop scalable and reliable applications and systems for cloud computing.

Programa / Syllabus
Computação na cloud e modelos de serviços. Plataformas de cloud públicas. Características de plataformas grid e cloud. Paradigmas de programação paralela e distribuída. Suporte de programação em Google App Engine/Google Cloud Platform. Programação em Amazon AWS. Suporte de programação em Microsoft Azure. Ambientes de software cloud emergentes. Desempenho de sistemas distribuídos e cloud.
Cloud computing and service models. Comparison of public cloud platforms. Features of grid and cloud platforms. Parallel and distributed programming paradigms. Programming support of Google App Engine. Programming on Amazon AWS. Microsoft Azure programming support. Emerging cloud software environments. Performance of distributed and cloud systems.

Métodos e Critérios de Avaliação / Evaluation and Grading
Teste de avaliação de conhecimentos/Exame: 40%.
Trabalho de síntese: 15%.
Projetos laboratoriais ou de campo: 45% (3x15%).

Teste de avaliação de conhecimentos/Exame: Teste sem consulta com duração de 1 hora; Teste constituído por 20 perguntas com 4 opções das quais apenas uma está correta; Respostas erradas não descontam sobre a pontuação dessas questões.
Trabalho de síntese: Trabalho realizado em grupo, sendo cada grupo constituído por 2 estudantes; Deve ser elaborado um relatório sobre um tema para exploração; O relatório será avaliado com base na qualidade, abrangência, profundidade e valor de síntese no contexto do tema.
Projeto laboratorial ou de campo: Trabalhos realizados em grupo, sendo cada grupo constituído por 2 estudantes; São propostos 3 trabalhos laboratoriais para realização durante as aulas práticas.

Written test/Exam: 40%.
Theorectical work: 15%.
Field or laboratory projects: 45% (3x15%).

Written test/Exam: Test with closed book with duration of 1 hour; The test comprises 20 questions with four options of which only one is correct; Wrong answers do not discount on the score of a given question.
Theorectical work: Work to be carried out in a group, each group consisting of 2 students; A report on a theme for exploration should be drawn up; The report will be evaluated based on the quality, breadth, depth and value of synthesis in the context of the theme.
Field or laboratory project: Works should be carried out in a group, each group consisting of 2 students; Three laboratory projects are proposed to be carried out during practical lectures.

Trabalho de síntese/Theorectical work
Tema 1 – Análise Comparativa de Apache Hadoop, Apache Spark e Apache Flink
Tema 2 – OpenStack versus Eucalyptus
Cada grupo deve escolher um destes dois temas e elaborar um breve relatório, no qual, de forma clara, rigorosa e pedagógica, descreve o objecto de estudo e eventuais perspectivas de desenvolvimento futuro do tema escolhido. O relatório deve ser escrito usando o template do IEEE disponível na parte dos Projetos Laboratoriais e deve ter, no máximo, 12 páginas. O relatório deve ser enviado por email, para o endereço mario@di.ubi.pt e com subject "CC 2017/2018 – Trabalho de Síntese", até 2018.06.08 23:59.

Projetos Laboratoriais
Enunciado do Projeto Laboratorial 1 – Desempenho de plataformas Hadoop
Enunciado do Projeto Laboratorial 2 – Desenvolvimento de uma aplicação para dois ambientes de cloud públicas e comparação das duas soluções tecnológicas
Enunciado do Projeto Laboratorial 3 – Instalação e Configuração de um Sistema Cloud: OpenStack ou OpenNebula

Template e Estrutura do Relatório do Projeto
Template de Artigos de Conferência do IEEE
Estrutura do Relatório do Projeto em 8 Páginas:
Título (<8 palavras): deve centrar-se no tópico, ser curto, claro e eye-catching; Autores e filiações (em 1-2 linhas após o título).
Abstract (<50 ~ 100 palavras): deve explicitar os objetivos da investigação, resumir os resultados da investigação e destacar as contribuições inovadoras.
Introdução (incluindo o título, abstract) (1 página): deve motivar os leitores para ler o resto do artigo e prepará-los com o background necessário.
Arquitetura, algoritmos, métodos, protocolos, resultados analíticos e exemplo ilustrado, etc. (2 páginas).
Configuração experimental (2 página): arquitetura do sistema implementado, detalhes de instalação e configuração, benchmarks e conjunto de dados utilizado.
Resultados experimentais 2 páginas): em figuras ou tabelas e respetivas interpretações e análise de desempenho.
Conclusões e Referências (1 página): Conclusões e lista de artigos relevantes referenciados no texto.

Bibliografia de Apoio à Unidade Curricular / Bibliography
Distributed and Cloud Computing: From Parallel Processing to the Internet of Things, Kai Hwang, Jack Dongarra, Geoffrey C. Fox (Authors), Morgan Kaufmann, 1st edition, 2011, ISBN-13: 978-0123858801, 672 pages.
Guide to Reliable Distributed Systems: Building High-Assurance Applications and Cloud-Hosted Services, Kenneth P. Birman (Author), Springer, 2012, ISBN-13: 978-1447124153, 730 pages.
Cloud Computing: A Hands-On Approach, Arshdeep Bahga, Vijay Madisetti (Authors), Vijay Madisetti, 2014, ISBN-13: 978-0996025508, 456 pages.


Plano das Aulas Teóricas / Schedule

Aula 1 (fevereiro 20, 2018, 16:00-18:00, sala 6.18).

Sumário: Apresentação do professor aos estudantes. Indicação do horário de atendimento e da localização do gabinete do professor. Objectivos da unidade curricular e competências a adquirir. Conteúdos programáticos. Método de avaliação. Bibliografia de apoio à unidade curricular.

Aula 2 (fevereiro 27, 2018, 16:00-18:00, sala 6.18).

Sumário: Computação na Cloud, Modelos de Serviços e Projeto de Datacenters.
Modelos de sistema para computação distribuída e na cloud. Clouds públicas, privadas e híbridas; Ecosistema cloud e tecnologias de suporte; Modelos de Serviços: Infrastructure-as-a-Service, Platform-as-a-Service, Software-as-a-Service, Anything-as-a-Service, Serverless computing.

Aula 3 (março 6, 2018, 16:00-18:00, sala 6.18).

Sumário: Plataformas de Cloud Públicas.
Clouds públicas e oferta de serviços; Comparação de plataformas de cloud públicas: IBM BlueCloud/Bluemix, Amazon Web Services (AWS), Google App Engine (GAE), Microsoft Windows Azure, Salesfource Force.com.

Aula 4 (março 13, 2018, 16:00-18:00, sala 6.18).

Sumário: Características de Plataformas Grid e Cloud.
Capacidades da cloud e características das plataformas; Aspetos comuns a grids e clouds; Cracterísticas de dados e base de dados; Suporte de programação e tempo de execução.

Aula 5 (março 20, 2018, 16:00-18:00, sala 6.18).

Sumário: Paradigmas de Programação Paralela e Distribuída.
Computação paralela e paradigmas de programação; MapReduce, Twister e Iterative MapReduce; Hadoop Library do Apache; Dryad e DryadLINQ da Microsoft; Linguagens de alto-nível Sawzall e Pig Latin; Aplicações de mapeamento para sistemas paralelos e distribuídos.

Aula 6 (abril 3, 2018, 16:00-18:00, sala 6.18).

Sumário: Paradigmas de Programação Paralela e Distribuída.
Computação paralela e paradigmas de programação; MapReduce, Twister e Iterative MapReduce; Hadoop Library do Apache; Dryad e DryadLINQ da Microsoft; Linguagens de alto-nível Sawzall e Pig Latin; Aplicações de mapeamento para sistemas paralelos e distribuídos.

Aula 7 (abril 10, 2018, 16:00-18:00, sala 6.18).

Sumário: Suporte de Programação em Google App Engine.
A plataforma de cloud pública Google App Engine; Programação em Google App Engine; Google File System (GFS); BigTable, Google's NOSQL system; Chubby, Google's Distributed Lock Service.

Aula 8 (abril 17, 2018, 16:00-18:00, sala 6.18).

Sumário: Suporte de Programação em Google App Engine.
A plataforma de cloud pública Google App Engine; Programação em Google App Engine; Google File System (GFS); BigTable, Google's NOSQL system; Chubby, Google's Distributed Lock Service.

Aula 9 (abril 24, 2018, 16:00-18:00, sala 6.18).

Sumário: Programação em Amazon AWS.
A plataforma de cloud pública Amazon Web Services (AWS), Programação em Amazon Elastic Compute Cloud (EC2), Amazon Simple Storage Service (S3), Amazon Elastic Block Store (EBS), SimpleDB e Amazon DynamoDB, AWS Lambda, monitorização de recursos e aplicações e escalabilidade (CloudWatch, Auto Scaling).

Aula 10 (maio 8, 2018, 16:00-18:00, sala 6.18).

Sumário: Programação em Amazon AWS.
A plataforma de cloud pública Amazon Web Services (AWS), Programação em Amazon Elastic Compute Cloud (EC2), Amazon Simple Storage Service (S3), Amazon Elastic Block Store (EBS), SimpleDB e Amazon DynamoDB, AWS Lambda, monitorização de recursos e aplicações e escalabilidade (CloudWatch, Auto Scaling).

Aula 11 (maio 15, 2018, 16:00-18:00, sala 6.18).

Sumário: Realização e correção da frequência.

Aula 12 (maio 22, 2018, 16:00-18:00, sala 6.18).

Sumário: Ambientes de Software Cloud Emergentes.
Open source Eucalyptus e Nimbus; OpenNebula, Sector/Sphere e OpenStack; Manjrasoft Aneka Cloud e Appliances.

Aula 13 (maio 29, 2018, 16:00-18:00, sala 6.18).

Sumário: Ambientes de Software Cloud Emergentes.
Open source Eucalyptus e Nimbus; OpenNebula, Sector/Sphere e OpenStack; Manjrasoft Aneka Cloud e Appliances.

Aula 14 (junho 5, 2018, 16:00-18:00, sala 6.18).

Sumário: Desempenho de Sistemas Distribuidos e Cloud.
Data-intensive scalable computing; Métricas de desempenho para sistemas HPC/HTC (High Performance/High Throughput Computing); Qualidade de serviço em computação na cloud; Benchmarking MPI, Azure, EC2, MapReduce e Hadoop.



“One of the problems of being a pioneer is you always make mistakes and I never, never want to be a pioneer. It’s always best to come second when you can look at the mistakes the pioneers made”.

Seymour Cray (1925-1996), Public Lecture at Lawrence Livermore Laboratories on the introduction of the CRAY-1, 1976.
Last update: 2018/03/06.