Especialização do aprendizado de reforço

coursera.inc

coursera.inc

Especialização do aprendizado de reforço

Descrição

O que você aprenderá
Crie um sistema de aprendizado de reforço para a tomada de decisão seqüencial.
Entenda o espaço dos algoritmos RL (aprendizado de diferenças temporais, Monte Carlo, Sarsa, Q-Learning, Gradientes de Política, Dyna e muito mais).
Entenda como formalizar sua tarefa como um problema de aprendizado de reforço e como começar a implementar uma solução.
Entenda como o RL se encaixa sob o guarda -chuva mais amplo do aprendizado de máquina e como ele complementa o aprendizado profundo, o aprendizado supervisionado e sem supervisão

Habilidades que você vai ganhar
Inteligência Artificial (AI)
Aprendizado de máquina
Aprendizagem de reforço
Aproximação da função
Sistemas inteligentes
Sobre essa especialização

A especialização de aprendizado de reforço consiste em 4 cursos explorando o poder dos sistemas de aprendizado adaptativo e da inteligência artificial (IA).

Aproveitar todo o potencial da inteligência artificial requer sistemas de aprendizado adaptativo. Aprenda como as soluções de aprendizado de reforço (RL) ajudam a resolver problemas do mundo real através da interação de tentativa e erro, implementando uma solução completa de RL do começo ao fim.

No final desta especialização, os alunos entenderão os fundamentos de grande parte da inteligência artificial probabilística moderna (IA) e estarão preparados para fazer cursos mais avançados ou aplicar ferramentas e idéias de IA a problemas do mundo real. Esse conteúdo se concentrará em problemas de “pequena escala”, a fim de entender os fundamentos do aprendizado de reforço, como ensinado por especialistas de renome mundial na Universidade de Alberta, Faculdade de Ciência.

As ferramentas aprendidas nesta especialização podem ser aplicadas ao desenvolvimento de jogos (IA), interação com o cliente (como um site interage com clientes), assistentes inteligentes, sistemas de recomendação, cadeia de suprimentos, controle industrial, finanças, oleodutos e gasodutos, sistemas de controle industrial, sistemas de controle industrial, e mais.

Certificado compartilhável
Ganhe um certificado após a conclusão
100% cursos online
Comece instantaneamente e aprenda em sua própria programação.
Horário flexível
Defina e mantenha prazos flexíveis.
Nível intermediário
Probabilidades e expectativas, álgebra linear básica, cálculo básico, Python 3.0 (pelo menos 1 ano), implementando algoritmos de pseudocode
Aproximadamente 5 meses para concluir
Ritmo sugerido de 4 horas/semana
Inglês
Legendas: inglês, árabe, francês, português (europeu), italiano, vietnamita, alemão, russo, espanhol

Como a especialização funciona
Faça cursos
Uma especialização em Coursera é uma série de cursos que ajuda a dominar uma habilidade. Para começar, inscreva -se diretamente na especialização ou revise seus cursos e escolha o que você gostaria de começar. Quando você se inscreve em um curso que faz parte de uma especialização, é automaticamente inscrito na especialização completa. Não há problema em concluir apenas um curso – você pode pausar seu aprendizado ou encerrar sua assinatura a qualquer momento. Visite o painel do aluno para rastrear as matrículas do curso e seu progresso.
Projeto prático
Toda especialização inclui um projeto prático. Você precisará terminar com sucesso o (s) projeto (s) para concluir a especialização e obter seu certificado. Se a especialização incluir um curso separado para o projeto prático, você precisará terminar cada um dos outros cursos antes de poder iniciá-lo.
Ganhe um certificado
Ao terminar todos os cursos e concluir o projeto prático, você obterá um certificado que poderá compartilhar com possíveis empregadores e sua rede profissional.

Fundamentos do aprendizado de reforço
O aprendizado de reforço é um subcampo de aprendizado de máquina, mas também é um formalismo de uso geral para a tomada de decisão automatizada e a IA. Este curso apresenta você às técnicas de aprendizado estatístico, onde um agente toma explicitamente ações e interage com o mundo. Compreender a importância e os desafios dos agentes de aprendizagem que tomam decisões é de vital importância hoje, com mais e mais empresas interessadas em agentes interativos e tomada de decisão inteligente.
Métodos de aprendizado baseados em amostras
Este curso apresenta você aos fundamentos da aprendizagem de reforço. Quando você terminar este curso, você irá:
– formalizar problemas como processos de decisão de Markov
– Entenda os métodos básicos de exploração e a troca de exploração/exploração
-Entenda as funções de valor, como uma ferramenta de uso geral para a tomada de decisão ideal
– Saiba como implementar a programação dinâmica como uma abordagem de solução eficiente para um problema de controle industrial

Este curso ensina os principais conceitos de aprendizado de reforço, algoritmos clássicos e modernos subjacentes na RL. Depois de concluir este curso, você poderá começar a usar o RL para problemas reais, onde você tem ou pode especificar o MDP.

Este é o primeiro curso da especialização de aprendizado de reforço.
Previsão e controle com aproximação de função
Neste curso, você aprenderá sobre vários algoritmos que podem aprender políticas quase ideais com base na interação de tentativa e erro com o ambiente-aprendendo com a experiência do próprio agente. Aprender com a experiência real é impressionante porque não requer conhecimento prévio da dinâmica do ambiente, mas ainda pode atingir um comportamento ideal. Abordaremos os métodos de Monte Carlo intuitivamente simples, mas poderosos, e métodos de aprendizado de diferenças temporais, incluindo Q-Learning. Vamos encerrar este curso investigando como podemos obter o melhor dos dois mundos: algoritmos que podem combinar o planejamento baseado em modelo (semelhante à programação dinâmica) e atualizações de diferenças temporais para acelerar radicalmente o aprendizado.Martha White
Professor assistente
Ciência da computação
Adam White
Professor assistente
Ciência da computação

Módulos e Conteúdo

Pré-requisitos

Avaliações

Avaliações

Não há avaliações ainda.

Seja o primeiro a avaliar “Especialização do aprendizado de reforço”

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Institucional

PHP Code Snippets Powered By : XYZScripts.com