Computação distribuída com Spark SQL

coursera.inc

coursera.inc

Computação distribuída com Spark SQL

Descrição

Prazos flexíveis

Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Certificado compartilhável
Ganhe um certificado após a conclusão
100% online
Comece instantaneamente e aprenda em sua própria programação.
Curso 3 de 4 no
Aprenda o básico do SQL para especialização em ciência de dados
Nível intermediário
Aproximadamente. 14 horas para concluir
Inglês
Legendas: inglês, espanhol

Brooke Wenig
Prática de aprendizado de máquina liderança em bancos de dados
Educação Continuada e Profissional
Conor Murphy
Cientista de dados líder nos bancos de dados
Subsídio de Educação Continuada e Profissional – O que você aprenderá com este curso
Introdução ao Spark
Neste módulo, você poderá discutir os conceitos principais de computação distribuída e poder reconhecer quando e onde aplicá -los. Você poderá identificar a estrutura básica de dados do Apache Spark ™, conhecida como DataFrame. Além disso, você usará o espaço de trabalho colaborativo dos Databricks e gravará o código SQL que é executado em um cluster de máquinas.
Spark Core Concepts
Neste módulo, você poderá explicar os conceitos principais de Spark. Você aprenderá maneiras comuns de aumentar o desempenho da consulta, armazenando em cache dados e modificando as configurações de Spark. Você também usará a interface do usuário do Spark para analisar o desempenho e identificar gargalos, além de otimizar consultas com execução de consulta adaptativa.
Dados de engenharia Pipelines
Neste módulo, você poderá identificar e discutir as demandas gerais dos aplicativos de dados. Você poderá acessar dados em vários formatos e comparar e contrastar as compensações entre esses formatos. Você explorará e examinará dados JSON semiestruturados (comuns em ambientes de big data), bem como esquemas e dados paralelos. Você poderá criar um pipeline de ponta a ponta que lê dados, transforma-os e salva o resultado.
Lagos de dados, armazéns e lakehouses
Neste módulo, você identificará as principais características dos lagos de dados, data warehouses e lakehouses. As lascas combinam a escalabilidade e o armazenamento de baixo custo dos lagos de dados com as garantias transacionais de velocidade e ácido dos armazéns de dados. Você construirá um Lakehouse de grau de produção combinando Spark com o projeto de código aberto, Delta Lake. Quem disse que a viagem no tempo não é possível não foi para uma casa de lago!

Módulos e Conteúdo

Pré-requisitos

Avaliações

Avaliações

Não há avaliações ainda.

Seja o primeiro a avaliar “Computação distribuída com Spark SQL”

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Institucional

PHP Code Snippets Powered By : XYZScripts.com