Prazos flexíveis
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Certificado compartilhável
Ganhe um certificado após a conclusão
100% online
Comece instantaneamente e aprenda em sua própria programação.
Curso 3 de 4 no
Aprenda o básico do SQL para especialização em ciência de dados
Nível intermediário
Aproximadamente. 14 horas para concluir
Inglês
Legendas: inglês, espanhol
Brooke Wenig
Prática de aprendizado de máquina liderança em bancos de dados
Educação Continuada e Profissional
Conor Murphy
Cientista de dados líder nos bancos de dados
Subsídio de Educação Continuada e Profissional – O que você aprenderá com este curso
Introdução ao Spark
Neste módulo, você poderá discutir os conceitos principais de computação distribuída e poder reconhecer quando e onde aplicá -los. Você poderá identificar a estrutura básica de dados do Apache Spark ™, conhecida como DataFrame. Além disso, você usará o espaço de trabalho colaborativo dos Databricks e gravará o código SQL que é executado em um cluster de máquinas.
Spark Core Concepts
Neste módulo, você poderá explicar os conceitos principais de Spark. Você aprenderá maneiras comuns de aumentar o desempenho da consulta, armazenando em cache dados e modificando as configurações de Spark. Você também usará a interface do usuário do Spark para analisar o desempenho e identificar gargalos, além de otimizar consultas com execução de consulta adaptativa.
Dados de engenharia Pipelines
Neste módulo, você poderá identificar e discutir as demandas gerais dos aplicativos de dados. Você poderá acessar dados em vários formatos e comparar e contrastar as compensações entre esses formatos. Você explorará e examinará dados JSON semiestruturados (comuns em ambientes de big data), bem como esquemas e dados paralelos. Você poderá criar um pipeline de ponta a ponta que lê dados, transforma-os e salva o resultado.
Lagos de dados, armazéns e lakehouses
Neste módulo, você identificará as principais características dos lagos de dados, data warehouses e lakehouses. As lascas combinam a escalabilidade e o armazenamento de baixo custo dos lagos de dados com as garantias transacionais de velocidade e ácido dos armazéns de dados. Você construirá um Lakehouse de grau de produção combinando Spark com o projeto de código aberto, Delta Lake. Quem disse que a viagem no tempo não é possível não foi para uma casa de lago!
Copyright © 2022 Nortial Assessoria e Consultoria LTDA | CNPJ 24.682.337/0001-94 | Todos os direitos reservados
Avaliações
Não há avaliações ainda.