Prazos flexíveis
Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Certificado compartilhável
Ganhe um certificado após a conclusão
100% online
Comece instantaneamente e aprenda em sua própria programação.
Curso 4 de 4 no
Especialização do aprendizado de reforço
Nível intermediário
Probabilidades e expectativas, álgebra linear básica, cálculo básico, Python 3.0 (pelo menos 1 ano), implementando algoritmos do pseudocódigo.
Aproximadamente. 16 horas para concluir
Inglês
Legendas: árabe, francês, português (europeu), italiano, vietnamita, alemão, russo, inglês, espanhol
Martha White
Professor assistente
Ciência da computação
Adam White
Professor assistente
Computing Sciencesyllabus – O que você aprenderá com este curso
Bem -vindo ao curso final Capstone!
Bem -vindo ao curso final da Capstone da Especialização de Aprendizagem de Reforço !!
Milestone 1: Formalize o problema das palavras como MDP
Nesta semana, você lerá uma descrição de um problema e a traduzirá em um MDP. Você concluirá o código do esqueleto para esse ambiente, para obter um MDP completo para uso neste projeto Capstone.
Milestone 2: Escolha do algoritmo certo
Nesta semana, você selecionará entre três algoritmos, para aprender uma política para o meio ambiente. Você refletirá e discutirá a adequação de cada algoritmo para esse ambiente.
Milestone 3: Identifique os principais parâmetros de desempenho
Nesta semana, você identificará os principais parâmetros que afetam o desempenho do seu agente. O objetivo é entender o espaço das opções, para permitir posteriormente qual parâmetro você investigará profundamente para o seu agente.
Milestone 4: implemente seu agente
Nesta semana, você implementará seu agente usando o SARSA esperado ou o q-learning com redes RMSPROP e neurais. Para usar o NNS, você precisará usar uma estratégia de seleção STEPSIE mais cuidadosa, e é por isso que você usará o RMSPROP. Você também verificará a correção do seu agente.
Milestone 5: Envie seu estudo de parâmetros!
Nesta semana, você identificará um parâmetro para estudar, para o seu agente. Depois de selecionar o parâmetro para estudar, forneceremos uma gama de valores e valores específicos para outros parâmetros. Você escreverá um script para executar seu agente e ambiente no conjunto de parâmetros, para determinar o desempenho nesses parâmetros. Você obterá informações sobre o impacto dos parâmetros no desempenho do agente. Você também poderá visualizar os agentes que aprende. Seu estudo de parâmetros consistirá em uma matriz de valores que verificaremos a correção.
Copyright © 2022 Nortial Assessoria e Consultoria LTDA | CNPJ 24.682.337/0001-94 | Todos os direitos reservados
Avaliações
Não há avaliações ainda.