Especialização de Big Data

coursera.inc

coursera.inc

Especialização de Big Data

Descrição

Sobre essa especialização

 

Conduza melhores decisões de negócios com uma visão geral de como o Big Data é organizado, analisado e interpretado. Aplique suas idéias a problemas e perguntas do mundo real.

 

Você precisa entender o big data e como isso afetará seus negócios? Esta especialização é para você. Você entenderá o que o Big Data pode oferecer através da experiência prática com as ferramentas e sistemas usados ​​por cientistas e engenheiros de big data. A experiência anterior de programação não é necessária! Você será guiado pelo básico do uso do Hadoop com MapReduce, Spark, Pig e Hive. Seguindo o código fornecido, você experimentará como alguém pode executar modelagem preditiva e alavancar análises de gráficos para modelar problemas. Essa especialização preparará você para fazer as perguntas certas sobre dados, se comunicar efetivamente com os cientistas de dados e fazer exploração básica de conjuntos de dados grandes e complexos. No projeto Final Capstone, desenvolvido em parceria com a empresa de software de dados Splunk, você aplicará as habilidades que aprendeu para fazer análises básicas de big data.

 

Certificados compartilháveis e 100% on-line

Aproximadamente 8 meses para concluir

Ritmo sugerido de 3 horas/semana

Curso em: Inglês

Legendas: Árabe, Francês, Portuguese (European), Italiano, Vietnamita, Alemão, Russo, Inglês, Espanhol

Instrutores: 

Ilkay Altintas,  Diretor de ciência de dados – San Diego Supercomputer Center

Mai Nguyen, Líder de Análise de Dados – San Diego Supercomputer Center

Amarnath Gupta, Diretor Laboratório de processamento avançado de consultas – San Diego Supercomputer Center (SDSC)

Módulos e Conteúdo

Módulo 1: Introdução a Big Data

- Interessado em aumentar seu conhecimento sobre o cenário de Big Data? Este curso é para iniciantes em ciência de dados e interessados ​​em entender por que a Era do Big Data surgiu. É para aqueles que desejam se familiarizar com a terminologia e os principais conceitos por trás dos problemas, aplicativos e sistemas de big data. É para quem quer começar a pensar em como o Big Data pode ser útil em seus negócios ou carreira. Ele fornece uma introdução a uma das estruturas mais comuns, o Hadoop, que tornou a análise de big data mais fácil e acessível -- aumentando o potencial dos dados para transformar nosso mundo!

Ao final deste curso, você será capaz de:

* Descrever o cenário de Big Data, incluindo exemplos de problemas de big data do mundo real, incluindo as três principais fontes de Big Data: pessoas, organizações e sensores.

* Explique os Vs do Big Data (volume, velocidade, variedade, veracidade, valência e valor) e por que cada um afeta a coleta, monitoramento, armazenamento, análise e geração de relatórios de dados.

* Obtenha valor do Big Data usando um processo de 5 etapas para estruturar sua análise.

* Identificar o que são e o que não são problemas de big data e ser capaz de reformular problemas de big data como questões de ciência de dados.

* Forneça uma explicação dos componentes arquitetônicos e modelos de programação usados ​​para análise de big data escalável.

* Resumir os recursos e o valor dos principais componentes da pilha do Hadoop, incluindo o sistema de gerenciamento de tarefas e recursos YARN, o sistema de arquivos HDFS e o modelo de programação MapReduce.

* Instale e execute um programa usando o Hadoop!

Este curso é para iniciantes em ciência de dados. Nenhuma experiência anterior em programação é necessária, embora a capacidade de instalar aplicativos e utilizar uma máquina virtual seja necessária para concluir as tarefas práticas.

Requisitos de hardware: (A) Processador Quad Core (recomenda-se suporte a VT-x ou AMD-V), 64 bits; (B) 8 GB de RAM; (C) 20 GB de disco livre. Como encontrar suas informações de hardware: (Windows): Abra o Sistema clicando no botão Iniciar, clicando com o botão direito do mouse em Computador e, em seguida, clicando em Propriedades; (Mac): Abra Visão geral clicando no menu Apple e clicando em “Sobre este Mac”. A maioria dos computadores com 8 GB de RAM comprados nos últimos 3 anos atenderá aos requisitos mínimos. Você precisará de uma conexão de internet de alta velocidade porque estará baixando arquivos de até 4 Gb de tamanho.

Requisitos de software: Este curso conta com várias ferramentas de software de código aberto, incluindo o Apache Hadoop. Todo o software necessário pode ser baixado e instalado gratuitamente. Os requisitos de software incluem: Windows 7+, Mac OS X 10.10+, Ubuntu 14.04+ ou CentOS 6+ VirtualBox 5+.

Módulo 2: Modelagem de Big Data e Sistemas de Gestão

- Depois de identificar um problema de big data para analisar, como você coleta, armazena e organiza seus dados usando soluções de Big Data? Neste curso, você experimentará vários gêneros de dados e ferramentas de gerenciamento apropriadas para cada um. Você será capaz de descrever as razões por trás da infinidade em evolução de novas plataformas de big data a partir da perspectiva de sistemas de gerenciamento de big data e ferramentas analíticas. Por meio de tutoriais práticos guiados, você se familiarizará com as técnicas que usam exemplos de dados semiestruturados e em tempo real. Os sistemas e ferramentas discutidos incluem: AsterixDB, HP Vertica, Impala, Neo4j, Redis, SparkSQL. Este curso fornece técnicas para extrair valor de fontes de dados inexploradas existentes e descobrir novas fontes de dados.

Ao final deste curso, você será capaz de: * Reconhecer diferentes elementos de dados em seu próprio trabalho e em problemas da vida cotidiana * Explique por que sua equipe precisa projetar um plano de infraestrutura de Big Data e um design de sistema de informações * Identifique as operações de dados frequentes necessárias para vários tipos de dados * Selecione um modelo de dados para atender às características de seus dados * Aplicar técnicas para lidar com dados de streaming * Diferencie um Sistema de Gerenciamento de Banco de Dados tradicional de um Sistema de Gerenciamento de Big Data * Aprecie por que existem tantos sistemas de gerenciamento de dados * Projetar um sistema de informações de big data para uma empresa de jogos online

Este curso é para iniciantes em ciência de dados. Recomenda-se a conclusão da Introdução ao Big Data. Nenhuma experiência anterior em programação é necessária, embora a capacidade de instalar aplicativos e utilizar uma máquina virtual seja necessária para concluir as tarefas práticas. Consulte os requisitos técnicos de especialização para especificações completas de hardware e software.

Requisitos de hardware: (A) Processador Quad Core (recomenda-se suporte a VT-x ou AMD-V), 64 bits; (B) 8 GB de RAM; (C) 20 GB de disco livre. Como encontrar suas informações de hardware: (Windows): Abra o Sistema clicando no botão Iniciar, clicando com o botão direito do mouse em Computador e, em seguida, clicando em Propriedades; (Mac): Abra Visão geral clicando no menu Apple e clicando em “Sobre este Mac”. A maioria dos computadores com 8 GB de RAM comprados nos últimos 3 anos atenderá aos requisitos mínimos. Você precisará de uma conexão de internet de alta velocidade porque estará baixando arquivos de até 4 Gb de tamanho.

Requisitos de software: Este curso conta com várias ferramentas de software de código aberto, incluindo o Apache Hadoop. Todo o software necessário pode ser baixado e instalado gratuitamente (exceto as cobranças de dados do seu provedor de internet). Os requisitos de software incluem: Windows 7+, Mac OS X 10.10+, Ubuntu 14.04+ ou CentOS 6+ VirtualBox 5+.

Módulo 3: Integração e Processamento de Big Data

- Ao final do curso, você será capaz de:

*Recuperar dados do banco de dados de exemplo e sistemas de gerenciamento de big data *Descrever as conexões entre as operações de gerenciamento de dados e os padrões de processamento de big data necessários para utilizá-los em aplicativos analíticos de larga escala *Identifique quando um problema de big data precisa de integração de dados *Execute integração e processamento simples de big data nas plataformas Hadoop e Spark

Este curso é para iniciantes em ciência de dados. Recomenda-se a conclusão da Introdução ao Big Data. Nenhuma experiência anterior em programação é necessária, embora a capacidade de instalar aplicativos e utilizar uma máquina virtual seja necessária para concluir as tarefas práticas. Consulte os requisitos técnicos de especialização para especificações completas de hardware e software.

Requisitos de hardware: (A) Processador Quad Core (recomenda-se suporte a VT-x ou AMD-V), 64 bits; (B) 8 GB de RAM; (C) 20 GB de disco livre. Como encontrar suas informações de hardware: (Windows): Abra o Sistema clicando no botão Iniciar, clicando com o botão direito do mouse em Computador e, em seguida, clicando em Propriedades; (Mac): Abra Visão geral clicando no menu Apple e clicando em “Sobre este Mac”. A maioria dos computadores com 8 GB de RAM comprados nos últimos 3 anos atenderá aos requisitos mínimos. Você precisará de uma conexão de internet de alta velocidade porque estará baixando arquivos de até 4 Gb de tamanho.

Requisitos de software: Este curso conta com várias ferramentas de software de código aberto, incluindo o Apache Hadoop. Todo o software necessário pode ser baixado e instalado gratuitamente (exceto as cobranças de dados do seu provedor de internet). Os requisitos de software incluem: Windows 7+, Mac OS X 10.10+, Ubuntu 14.04+ ou CentOS 6+ VirtualBox 5+.

Módulo 4: Aprendizado de máquina com Big Data

- Quer entender os volumes de dados que você coletou? Precisa incorporar decisões baseadas em dados em seu processo? Este curso fornece uma visão geral das técnicas de aprendizado de máquina para explorar, analisar e aproveitar dados. Você será apresentado a ferramentas e algoritmos que pode usar para criar modelos de aprendizado de máquina que aprendem com dados e dimensionar esses modelos para problemas de big data.

Ao final do curso, você será capaz de: • Projete uma abordagem para aproveitar os dados usando as etapas do processo de aprendizado de máquina. • Aplicar técnicas de aprendizado de máquina para explorar e preparar dados para modelagem. • Identificar o tipo de problema de aprendizado de máquina para aplicar o conjunto apropriado de técnicas. • Construa modelos que aprendam com os dados usando ferramentas de código aberto amplamente disponíveis. • Analisar problemas de big data usando algoritmos de aprendizado de máquina escalonáveis ​​no Spark.

Requisitos de software: Cloudera VM, KNIME, Spark

Avaliações

Não há avaliações ainda.

Seja o primeiro a avaliar “Especialização de Big Data”

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Cursos Relacionados

PHP Code Snippets Powered By : XYZScripts.com