Aprendizado de máquina: classificação

coursera.inc

coursera.inc

Aprendizado de máquina: classificação

Descrição

Prazos flexíveis

Prazos flexíveis
Redefinir os prazos de acordo com sua programação.
Certificado compartilhável
Ganhe um certificado após a conclusão
100% online
Comece instantaneamente e aprenda em sua própria programação.
Curso 3 de 4 no
Especialização do aprendizado de máquina
Aproximadamente. 21 horas para concluir
Inglês
Legendas: árabe, francês, português (europeu), italiano, vietnamita, coreano, alemão, russo, inglês, espanhol

Emily Fox
Professor do SALGENO DE MACHINE APRENDIZAGEM
Estatisticas
Carlos Guestrin
Professor do SALGENO DE MACHINE APRENDIZAGEM
Ciência da Computação e Engenharia do Sablabus – O que você aprenderá com este curso
Receber!
A classificação é uma das técnicas mais amplamente utilizadas no aprendizado de máquina, com uma ampla gama de aplicações, incluindo análise de sentimentos, direcionamento de anúncios, detecção de spam, avaliação de riscos, diagnóstico médico e classificação de imagem. O objetivo principal da classificação é prever uma categoria ou classe Y de algumas entradas x. Através deste curso, você se familiarizará com os modelos e algoritmos fundamentais usados ​​na classificação, além de vários conceitos principais de aprendizado de máquina. Em vez de cobrir todos os aspectos da classificação, você se concentrará em algumas técnicas principais, amplamente utilizadas no mundo real para obter desempenho de ponta. Seguindo nossa abordagem prática, você implementará seus próprios algoritmos em várias tarefas do mundo real e compreenderá profundamente as técnicas principais necessárias para ter sucesso com essas abordagens na prática. Esta introdução ao curso fornece uma visão geral dos tópicos que abordaremos e os conhecimentos e recursos em segundo plano que assumimos que você tem.
Classificadores lineares e regressão logística
Os classificadores lineares estão entre os métodos de classificação mais práticos. Por exemplo, em nosso estudo de caso de análise de sentimentos, um classificador linear associa um coeficiente à contagem de cada palavra na frase. Neste módulo, você se tornará proficiente nesse tipo de representação. Você se concentrará em um tipo particularmente útil de classificador linear chamado regressão logística, que, além de permitir que você preveja uma classe, fornece uma probabilidade associada à previsão. Essas probabilidades são extremamente úteis, pois fornecem um grau de confiança nas previsões. Neste módulo, você também poderá construir recursos a partir de entradas categóricas e resolver problemas de classificação com mais de duas classes (problemas multiclasse). Você examinará os resultados dessas técnicas em uma tarefa de análise de sentimentos de produto do mundo real.
Aprendendo classificadores lineares
Uma vez familiarizado com os classificadores lineares e a regressão logística, agora você pode mergulhar e escrever seu primeiro algoritmo de aprendizado para classificação. Em particular, você usará ascensão de gradiente para aprender os coeficientes do seu classificador a partir dos dados. Você primeiro precisará definir a métrica de qualidade para essas tarefas usando uma abordagem chamada estimativa máxima de probabilidade (MLE). Você também se familiarizará com uma técnica simples para selecionar o tamanho da etapa para a subida do gradiente. Uma parte avançada e opcional deste módulo cobrirá a derivação do gradiente para regressão logística. Você implementará seu próprio algoritmo de aprendizado para regressão logística do zero e o usará para aprender um classificador de análise de sentimentos.
Excesso de ajuste e regularização em regressão logística
Como vimos no curso de regressão, o excesso de ajuste é talvez o desafio mais significativo que você enfrentará ao aplicar abordagens de aprendizado de máquina na prática. Esse desafio pode ser particularmente significativo para a regressão logística, como você descobrirá neste módulo, pois não apenas corremos o risco de obter um limite de decisão excessivamente complexo, mas seu classificador também pode se tornar excessivamente confiante sobre as probabilidades que prevê. Neste módulo, você investigará o excesso de ajuste na classificação em detalhes significativos e obterá informações práticas amplas de algumas visualizações interessantes das saídas dos classificadores. Você adicionará um termo de regularização à sua otimização para mitigar o excesso de ajuste. Você investigará a regularização de L2 para penalizar grandes valores de coeficientes e a regularização de L1 para obter esparsidade adicional nos coeficientes. Por fim, você modificará seu algoritmo de ascensão gradiente para aprender classificadores regularizados de regressão logística. Você implementará seu próprio classificador de regressão logística regularizada do zero e investigará o impacto da penalidade de L2 nos dados de análise de sentimentos do mundo real.
Árvores de decisão
Juntamente com classificadores lineares, as árvores de decisão estão entre as técnicas de classificação mais amplamente usadas no mundo real. Esse método é extremamente intuitivo, simples de implementar e fornece previsões interpretáveis. Neste módulo, você se familiarizará com a representação principal das árvores de decisão. Você projetará um algoritmo ganancioso simples e recursivo para aprender árvores de decisão a partir de dados. Por fim, você estenderá essa abordagem para lidar com insumos contínuos, um requisito fundamental para problemas práticos. Neste módulo, você investigará um novo estudo de caso no setor financeiro: prevendo o risco associado a um empréstimo bancário. Você implementará seu próprio algoritmo de aprendizado de árvore de decisão sobre dados reais de empréstimo.
Prevendo o excesso de ajuste nas árvores de decisão
De todas as técnicas de aprendizado de máquina, as árvores de decisão estão entre as mais propensas a excesso de ajuste. Nenhuma implementação prática é possível sem incluir abordagens que atenuem esse desafio. Neste módulo, através de várias visualizações e investigações, você investigará por que as árvores de decisão sofrem de problemas significativos de ajuste. Usando o princípio da navalha de Occam, você mitigará o excesso de ajuste aprendendo árvores mais simples. A princípio, você projetará algoritmos que interromperão o processo de aprendizado antes que as árvores de decisão se tornem excessivamente complexas. Em um segmento opcional, você projetará uma abordagem muito prática que aprenda uma árvore excessivamente complexa e a simplifica com a poda. Sua implementação investigará o efeito dessas técnicas na mitigação do excesso de ajuste em nosso conjunto de dados de empréstimos do mundo real.
Manuseio de dados ausentes
Os problemas de aprendizado de máquina do mundo real estão repletos de dados ausentes. Ou seja, muitas vezes, algumas das entradas não são observadas para todos os pontos de dados. Esse desafio é muito significativo, acontece na maioria dos casos e precisa ser abordado cuidadosamente para obter um ótimo desempenho. E essa questão raramente é discutida nos cursos de aprendizado de máquina. Neste módulo, você enfrentará o desafio de dados ausentes de frente. Você começará com as duas técnicas mais básicas para converter um conjunto de dados com dados ausentes em um conjunto de dados limpo, a saber, pulando valores ausentes e inserindo valores ausentes. Em uma seção avançada, você também projetará uma modificação do algoritmo de aprendizado de árvores de decisão que cria decisões sobre a falta de dados diretamente no modelo. Você também explorará essas técnicas em sua implementação de dados reais.
Impulsionando
Uma das perguntas teóricas mais emocionantes que foram feitas sobre o aprendizado de máquina é se classificadores simples podem ser combinados em um conjunto altamente preciso. Essa questão leva ao desenvolvimento do impulso, uma das técnicas mais importantes e práticas no aprendizado de máquina hoje. Essa abordagem simples pode aumentar a precisão de qualquer classificador e é amplamente utilizada na prática, por exemplo, é usada por mais da metade das equipes que ganham as competições de aprendizado de máquina Kaggle. Neste módulo, você definirá primeiro o classificador do conjunto, onde vários modelos votam na melhor previsão. Você então explorará um algoritmo de reforço chamado Adaboost, que fornece uma ótima abordagem para aumentar os classificadores. Através de visualizações, você se familiarizará com muitos dos aspectos práticos dessas técnicas. Você criará sua própria implementação do Adaboost, do zero e o usará para aumentar o desempenho do seu preditor de risco de empréstimo em dados reais.
Recall de precisão
Em muitas configurações do mundo real, a precisão ou erro não são as métricas de melhor qualidade para classificação. Você explorará um estudo de caso que destaca significativamente esse problema: usando a análise de sentimentos para exibir críticas positivas em um site de restaurante. Em vez de precisão, você definirá duas métricas: precisão e recall, que são amplamente utilizadas em aplicativos do mundo real para medir a qualidade dos classificadores. Você explorará como a saída de probabilidades pelo seu classificador pode ser usada para trocar precisão com a recuperação e mergulhar nesse espectro, usando curvas de precisão de precisão. Na sua implementação prática, você calculará essas métricas com seu classificador instruído nos dados de análise de sentimentos do mundo real.
Escalando para enormes conjuntos de dados e aprendizado online
Com o advento da Internet, o crescimento das mídias sociais e a incorporação de sensores no mundo, as magnitudes dos dados que nossos algoritmos de aprendizado de máquina devem suportar tremendamente na última década. Esse efeito às vezes é chamado de “big data”. Assim, nossos algoritmos de aprendizado devem ser escalados para conjuntos de dados mais maiores e maiores. Neste módulo, você desenvolverá uma pequena modificação da subida de gradiente chamada gradiente estocástico, que fornece acelerações significativas no tempo de execução de nossos algoritmos. Essa mudança simples pode melhorar drasticamente a escala, mas torna o algoritmo menos estável e mais difícil de usar na prática. Neste módulo, você investigará as técnicas práticas necessárias para tornar viável o gradiente estocástico e, portanto, obter algoritmos de aprendizado que se escalam para enormes conjuntos de dados. Você também abordará um novo tipo de problema de aprendizado de máquina, aprendizado on -line, onde os dados fluem ao longo do tempo, e devemos aprender os coeficientes à medida que os dados chegam. Esta tarefa também pode ser resolvida com gradiente estocástico. Você implementará seu próprio algoritmo de subida de gradiente estocástica para regressão logística do zero e avaliará -lo nos dados de análise de sentimentos.

Avaliações

Não há avaliações ainda.

Seja o primeiro a avaliar “Aprendizado de máquina: classificação”

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Cursos Relacionados

PHP Code Snippets Powered By : XYZScripts.com