Ciência de dados aplicada com R Specialization

coursera.inc

coursera.inc

Ciência de dados aplicada com R Specialization

Descrição

Através desses cinco cursos on -line, você desenvolverá as habilidades necessárias para reunir frequentemente fontes de dados díspares e desconectadas e usará a linguagem de programação R para transformar dados em insights que ajudam você e suas partes interessadas a tomar decisões mais informadas.

No final desta especialização, você poderá executar tarefas básicas de programação R para concluir o processo de análise de dados, incluindo preparação de dados, análise estatística e modelagem preditiva. Você também poderá criar bancos de dados relacionais e consultar os dados usando SQL e R e comunicar suas descobertas de dados usando técnicas de visualização de dados.

-Realize tarefas básicas de programação R, como trabalhar com estruturas de dados, manipulação de dados, usar APIs, webscraping e usar R Studio e Jupyter;
-Crie bancos de dados e tabelas relacionais, carregue-os com dados de arquivos CSV e consulte dados usando SQL e R usando o JupyterLab;
-Conclua o processo de análise de dados, incluindo preparação de dados,
análise estatística e modelagem preditiva;
-Comunique as descobertas da análise de dados com gráficos, plotagens e painéis de visualização de dados usando bibliotecas como ggplot, leaflet e R Shiny.

 

Certificado compartilhável: Ganhe um certificado após a conclusão
100% cursos online: Comece instantaneamente e aprenda em sua própria programação.
Horário: Flexível, defina e mantenha prazos flexíveis.
Nível: iniciante
Aproximadamente 7 meses para concluir
Ritmo sugerido de 3 horas/semana
Idioma: Inglês
Legendas: inglês

 

Instrutores:

 

Yan Luo: Instrutor, Ph.D., cientista de dados e desenvolvedor – IBM

Tiffany Zhu: Instrutora e cientista de dados – Codait

Gabriela de Queiroz: Instrutora, diretora de programa – Open Source, Data & AI Technologies

Jeff Grossman: Instrutor, PME em ciência e engenharia de dados – Tecnologias de Habilidade

Rav Ahuja: Instrutor, diretor de programa global – Rede de Habilidades IBM

Yiwen Li: Instrutora, engenheiro de software – Tecnologias de código aberto, dados e IA

Saishruthi Swaminathan: Instrutora, cientista de dados e desenvolvedor Advocate – IBM CODAIT

Módulos e Conteúdo


Módulo 1: Introdução à programação R para ciência de dados
Ao trabalhar na área de ciência de dados, você definitivamente se familiarizará com a linguagem R e o papel que ela desempenha na análise de dados. Este curso apresenta os fundamentos da linguagem R, como tipos de dados, técnicas de manipulação e como implementar tarefas fundamentais de programação. Você começará o processo de compreensão de estruturas de dados comuns, fundamentos de programação e como manipular dados, tudo com a ajuda da linguagem de programação R. A ênfase neste curso é o aprendizado prático e prático. Você escreverá um programa simples usando RStudio, manipulará dados em um quadro ou matriz de dados e concluirá um projeto final como analista de dados usando notebooks Watson Studio e Jupyter para adquirir e analisar insights orientados por dados. Nenhum conhecimento prévio de R ou programação é necessário.

Módulo 2: SQL para Ciência de Dados com R
Muitos dos dados do mundo residem em bancos de dados. SQL (ou Linguagem de Consulta Estruturada) é uma linguagem poderosa usada para comunicação e extração de dados de bancos de dados. Um conhecimento prático de bancos de dados e SQL é essencial se você deseja se tornar um cientista de dados. O objetivo deste curso é apresentar os conceitos de banco de dados relacional e ajudá-lo a aprender e aplicar o conhecimento básico das linguagens SQL e R. Também se destina a dar os primeiros passos na execução do acesso SQL em um ambiente de ciência de dados. A ênfase neste curso está no aprendizado prático e prático. Dessa forma, você trabalhará com bancos de dados reais, ferramentas de ciência de dados reais e conjuntos de dados do mundo real. Você criará uma instância de banco de dados na nuvem. Por meio de uma série de laboratórios práticos, você praticará a criação e a execução de consultas SQL. Você também aprenderá como acessar bancos de dados de notebooks Jupyter usando SQL e R. Nenhum conhecimento prévio de bancos de dados, SQL, R ou programação é necessário. Qualquer pessoa pode auditar este curso sem nenhum custo. Se você optar por fazer este curso e obter o certificado do curso Coursera, também poderá obter um selo digital da IBM após a conclusão bem-sucedida do curso.

Módulo 3: Análise de dados com R
A linguagem de programação R foi desenvolvida especificamente para análise de dados. R é a chave que abre a porta entre os problemas que você quer resolver com dados e as respostas que você precisa para atingir seus objetivos. Este curso começa com uma pergunta e, em seguida, orienta você no processo de respondê-la por meio de dados. Primeiro, você aprenderá técnicas importantes para preparar (ou organizar) seus dados para análise. Você aprenderá como obter uma melhor compreensão de seus dados por meio da análise exploratória de dados, ajudando você a resumir seus dados e identificar relacionamentos relevantes entre variáveis ​​que podem levar a insights. Assim que seus dados estiverem prontos para análise, você aprenderá como desenvolver seu modelo e avaliar e ajustar seu desempenho. Ao seguir esse processo, você pode ter certeza de que sua análise de dados será executada de acordo com os padrões que você definiu e poderá ter confiança nos resultados. Você construirá uma experiência prática desempenhando o papel de um analista de dados que analisa os dados de partida e chegada da companhia aérea para prever atrasos nos voos. Usando um conjunto de dados de desempenho pontual da transportadora de relatórios de companhias aéreas, você praticará a leitura de arquivos de dados, o pré-processamento de dados, a criação de modelos, a melhoria de modelos e a avaliação deles para, finalmente, escolher o melhor modelo. Assista aos vídeos, trabalhe nos laboratórios e adicione ao seu portfólio. Boa sorte! Observação: o pré-requisito para este curso são as habilidades básicas de programação em R. Por exemplo, certifique-se de ter concluído um curso como Introduction to R Programming for Data Science da IBM.

Módulo 4: Visualização de dados com R
Neste curso, você aprenderá a Gramática de gráficos, um sistema para descrever e construir gráficos, e como o pacote de visualização de dados ggplot2 para R aplica esse conceito a gráficos básicos de barras, histogramas, gráficos de pizza, gráficos de dispersão, gráficos de linha e caixas parcelas. Você também aprenderá como personalizar ainda mais seus gráficos e plotagens usando temas e outras técnicas. Em seguida, você aprenderá como usar outro pacote de visualização de dados para R chamado Leaflet para criar plotagens de mapa, uma maneira única de plotar dados com base em dados de geolocalização. Por fim, você será apresentado à criação de painéis interativos usando o pacote R Shiny. Você aprenderá como criar e personalizar aplicativos Shiny, alterar a aparência dos aplicativos adicionando HTML e componentes de imagem e implantar seus aplicativos de dados interativos na web. Você praticará o que aprender e desenvolverá experiência prática concluindo os laboratórios em cada módulo e um projeto final no final do curso. Assista aos vídeos, trabalhe nos laboratórios e veja sua habilidade em ciência de dados crescer. Boa sorte! NOTA: Este curso requer conhecimento de como trabalhar com R e dados. Se você não tiver essas habilidades, é altamente recomendável fazer primeiro os cursos de Introdução à programação R para ciência de dados e Análise de dados com R da IBM antes de iniciar este curso. Observação: o pré-requisito para este curso são as habilidades básicas de programação em R.

Módulo 5: Ciência de Dados com R - Projeto Capstone
Neste curso fundamental, você aplicará várias habilidades e técnicas de ciência de dados que aprendeu como parte dos cursos anteriores no IBM Data Science com especialização R ou IBM Data Analytics com Excel e R Professional Certificate. Para este projeto, você assumirá o papel de um Cientista de Dados que ingressou recentemente em uma organização e enfrentará um desafio que requer coleta de dados, análise, teste de hipóteses básicas, visualização e modelagem a serem executados em conjuntos de dados do mundo real. Você coletará e entenderá dados de várias fontes, conduzirá a organização e preparação de dados com o Tidyverse, realizará análises exploratórias de dados com SQL, Tidyverse e ggplot2, modelará dados com regressão linear, criará gráficos e plotagens para visualizar os dados e criará um painel interativo. O projeto culminará com a apresentação do seu relatório de análise de dados, com sumário executivo para os diversos stakeholders da organização.

Avaliações

Não há avaliações ainda.

Seja o primeiro a avaliar “Ciência de dados aplicada com R Specialization”

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Institucional

PHP Code Snippets Powered By : XYZScripts.com