Integração e Processamento de Big Data

coursera.inc

coursera.inc

Integração e Processamento de Big Data

Descrição

Ao final do curso, você será capaz de:

 

* Recupere dados de bancos de dados de exemplo e sistemas de gerenciamento de big data;

*Descreve as conexões entre as operações de gerenciamento de dados e os padrões de processamento de big data necessários para utilizá-los em aplicativos analíticos de larga escala;

*Identifique quando um problema de big data precisa de integração de dados;

*Execute integração e processamento simples de big data nas plataformas Hadoop e Spark.

 

Certificados compartilháveis e 100% on-line

Aproximadamente 18 horas para concluir

Curso em: Inglês

Legendas: Árabe, Francês, Portuguese (European), Italiano, Vietnamita, Coreano, Alemão, Russo, Inglês, Espanhol.

 

Instrutor: Ilkay Altintas, Diretor de ciência de dados;

Instrutor: Amarnath Gupta, Diretor, Laboratório de processamento avançado de consultas.

Módulos e Conteúdo

Módulo 1: Bem-vindo à Integração e Processamento de Big Data.
- Bem-vindo ao terceiro curso da Especialização em Big Data. Nesta semana, você será apresentado aos conceitos básicos de integração e processamento de big data. Você será orientado a instalar a VM Cloudera, baixar os conjuntos de dados a serem usados ​​para este curso e aprender a executar o servidor Jupyter.

Módulos e Conteúdo

Módulo 2: Recuperando Big Data (Parte 1).
- Este módulo cobre os vários aspectos da recuperação de dados e consulta relacional. Você também será apresentado ao banco de dados Postgres.

Módulos e Conteúdo

Módulo 3: Recuperando Big Data (Parte 2).
- Este módulo abrange os vários aspectos da recuperação de dados para dados NoSQL, bem como a agregação de dados e o trabalho com quadros de dados. Você será apresentado ao MongoDB e ao Aerospike e aprenderá como usar o Pandas para recuperar dados deles.

Módulos e Conteúdo

Módulo 4: Integração de Big Data.
- Neste módulo, você será apresentado às ferramentas de integração de dados, incluindo Splunk e Datameer, e obterá algumas informações práticas sobre como os processos de integração de informações são executados.

Módulos e Conteúdo

Módulo 5: Processamento de Big Data. - Este módulo apresenta aos alunos pipelines e fluxos de trabalho de big data, bem como processamento e análise de big data usando o Apache Spark.

Módulos e Conteúdo

Módulo 6: Análise de Big Data usando Spark.
- Neste módulo, você se aprofundará no processamento de big data aprendendo o funcionamento interno do Spark Core. Você será apresentado a duas ferramentas principais no kit de ferramentas Spark: Spark MLlib e GraphX.

Módulos e Conteúdo

Módulo 7: Aprenda fazendo: colocando MongoDB e Spark para trabalhar.
- Neste módulo, você obterá experiência prática aplicando o que aprendeu sobre Spark e MongoDB para analisar dados do Twitter.

Módulos e Conteúdo

Este curso é para iniciantes em ciência de dados. Recomenda-se a conclusão da Introdução ao Big Data.

Nenhuma experiência anterior em programação é necessária, embora a capacidade de instalar aplicativos e usar uma máquina virtual seja necessária para concluir as tarefas práticas. Consulte os requisitos técnicos de especialização para especificações completas de hardware e software.

Requisitos de Hardware:
(A) Processador Quad Core (recomenda-se suporte a VT-x ou AMD-V), 64 bits; (B) 8 GB de RAM; (C) 20 GB de disco livre. Como encontrar suas informações de hardware: (Windows): Abra o Sistema clicando no botão Iniciar, clicando com o botão direito do mouse em Computador e, em seguida, clicando em Propriedades; (Mac): Abra Visão geral clicando no menu Apple e clicando em “Sobre este Mac”. A maioria dos computadores com 8 GB de RAM comprados nos últimos 3 anos atenderá aos requisitos mínimos. Você precisará de uma conexão de internet de alta velocidade porque estará baixando arquivos de até 4 Gb de tamanho.

Requisitos de Software:
Este curso conta com várias ferramentas de software de código aberto, incluindo o Apache Hadoop. Todo o software necessário pode ser baixado e instalado gratuitamente (exceto as cobranças de dados do seu provedor de internet). Os requisitos de software incluem: Windows 7+, Mac OS X 10.10+, Ubuntu 14.04+ ou CentOS 6+ VirtualBox 5+.

Avaliações

Não há avaliações ainda.

Seja o primeiro a avaliar “Integração e Processamento de Big Data”

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Cursos Relacionados

PHP Code Snippets Powered By : XYZScripts.com