Os pipelines de dados geralmente se encaixam em um desses três paradigmas: extração e carregamento (EL), extração, carregamento e transformação (ELT) ou extração, transformação e carregamento (ETL). Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.



Building Batch Data Pipelines on GCP em Português Brasileiro
This course is part of Data Engineer, Big Data and ML on Google Cloud em Português Specialization

Instructor: Google Cloud Training
Access provided by New York State Department of Labor
(15 reviews)
What you'll learn
Analisar diferentes métodos de carregamento de dados: EL, ELT e ETL e quando usar cada um deles.
Executar o Hadoop no Dataproc, usar o Cloud Storage e otimizar os jobs do Dataproc.
Usar o Dataflow para criar pipelines de processamento de dados.
Gerenciar pipelines de dados com o Data Fusion e o Cloud Composer.
Details to know

Add to your LinkedIn profile
4 assignments
See how employees at top companies are mastering in-demand skills

Build your subject-matter expertise
- Learn new concepts from industry experts
- Gain a foundational understanding of a subject or tool
- Develop job-relevant skills with hands-on projects
- Earn a shareable career certificate


Earn a career certificate
Add this credential to your LinkedIn profile, resume, or CV
Share it on social media and in your performance review

There are 6 modules in this course
Neste módulo, vamos apresentar o curso e a programação.
What's included
1 video
Este módulo analisa diferentes métodos de carregamento de dados: EL, ELT e ETL e quando usar cada um deles.
What's included
6 videos1 assignment
Este módulo mostra como executar o Hadoop no Dataproc, como usar o Cloud Storage e como otimizar os jobs do Dataproc.
What's included
11 videos1 assignment1 app item
Este módulo aborda o uso do Dataflow para criar pipelines de processamento de dados.
What's included
13 videos1 assignment6 app items
Este módulo mostra como gerenciar pipelines de dados com o Cloud Data Fusion e o Cloud Composer.
What's included
13 videos1 assignment2 app items
Resumo do curso
What's included
1 video
Instructor

Offered by
Why people choose Coursera for their career




Learner reviews
15 reviews
- 5 stars
80%
- 4 stars
13.33%
- 3 stars
6.66%
- 2 stars
0%
- 1 star
0%
Showing 3 of 15
Reviewed on Jul 22, 2021
Apresentação fantastica sobre as principais ferramentas para criação e gerenciamento de pipelines.
Recommended if you're interested in Information Technology

Open new doors with Coursera Plus
Unlimited access to 10,000+ world-class courses, hands-on projects, and job-ready certificate programs - all included in your subscription
Advance your career with an online degree
Earn a degree from world-class universities - 100% online
Join over 3,400 global companies that choose Coursera for Business
Upskill your employees to excel in the digital economy