Um sistema completo de aprendizado de reforço (Capstone)

coursera.inc

coursera.inc

Um sistema completo de aprendizado de reforço (Capstone)

Descrição

Prazos flexíveis

Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Certificado compartilhável
Ganhe um certificado após a conclusão
100% online
Comece instantaneamente e aprenda em sua própria programação.
Curso 4 de 4 no
Especialização do aprendizado de reforço
Nível intermediário
Probabilidades e expectativas, álgebra linear básica, cálculo básico, Python 3.0 (pelo menos 1 ano), implementando algoritmos do pseudocódigo.
Aproximadamente. 16 horas para concluir
Inglês
Legendas: árabe, francês, português (europeu), italiano, vietnamita, alemão, russo, inglês, espanhol

Martha White
Professor assistente
Ciência da computação
Adam White
Professor assistente
Computing Sciencesyllabus – O que você aprenderá com este curso
Bem -vindo ao curso final Capstone!
Bem -vindo ao curso final da Capstone da Especialização de Aprendizagem de Reforço !!
Milestone 1: Formalize o problema das palavras como MDP
Nesta semana, você lerá uma descrição de um problema e a traduzirá em um MDP. Você concluirá o código do esqueleto para esse ambiente, para obter um MDP completo para uso neste projeto Capstone.
Milestone 2: Escolha do algoritmo certo
Nesta semana, você selecionará entre três algoritmos, para aprender uma política para o meio ambiente. Você refletirá e discutirá a adequação de cada algoritmo para esse ambiente.
Milestone 3: Identifique os principais parâmetros de desempenho
Nesta semana, você identificará os principais parâmetros que afetam o desempenho do seu agente. O objetivo é entender o espaço das opções, para permitir posteriormente qual parâmetro você investigará profundamente para o seu agente.
Milestone 4: implemente seu agente
Nesta semana, você implementará seu agente usando o SARSA esperado ou o q-learning com redes RMSPROP e neurais. Para usar o NNS, você precisará usar uma estratégia de seleção STEPSIE mais cuidadosa, e é por isso que você usará o RMSPROP. Você também verificará a correção do seu agente.
Milestone 5: Envie seu estudo de parâmetros!
Nesta semana, você identificará um parâmetro para estudar, para o seu agente. Depois de selecionar o parâmetro para estudar, forneceremos uma gama de valores e valores específicos para outros parâmetros. Você escreverá um script para executar seu agente e ambiente no conjunto de parâmetros, para determinar o desempenho nesses parâmetros. Você obterá informações sobre o impacto dos parâmetros no desempenho do agente. Você também poderá visualizar os agentes que aprende. Seu estudo de parâmetros consistirá em uma matriz de valores que verificaremos a correção.

Módulos e Conteúdo

Pré-requisitos

Avaliações

Avaliações

Não há avaliações ainda.

Seja o primeiro a avaliar “Um sistema completo de aprendizado de reforço (Capstone)”

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Institucional

PHP Code Snippets Powered By : XYZScripts.com