Compara - PowerPoint PPT Presentation

About This Presentation
Title:

Compara

Description:

Compara o e integra o de m todos de classifica o Apresentadores Andrey C. Cavalcanti George Soares da Silva Limpeza de Dados Problema: a baixa qualidade dos ... – PowerPoint PPT presentation

Number of Views:47
Avg rating:3.0/5.0
Slides: 8
Provided by: jacq199
Category:

less

Transcript and Presenter's Notes

Title: Compara


1
Comparação e integração de métodos de
classificação
  • Apresentadores
  • Andrey C. Cavalcanti
  • George Soares da Silva

2
Limpeza de Dados
  • Problema a baixa qualidade dos dados
  • PERIGO gt Limpeza de dados automática
  • Melhorando árvores de decisão
  • Simplificando
  • Sem perda de precisão
  • Menor tamanho
  • Melhora a performance
  • Como Simplificar?
  • Através da remoção de instâncias não
    classificadas do conjunto de treinamento e
    reaprendendo

3
Combinando Múltiplos Modelos
  • Motivação descoberta de outliers
  • Político e expert da computação
  • Em geral melhora robustez, porém com maior custo
    computacional
  • Alguns métodos com combinação
  • Bagging
  • Boosting
  • Stacking
  • Error-correcting output codes
  • Bagging e Boosting usam o mesmo método de
    combinação de modelos diferentes.

4
Bagging
  • Combina decisões de diferentes modelos numa única
  • Na classificação ? votação com pesos iguais
  • Previsão numérica ? calcula a média p/ cada
  • Funcionamento
  • Dado um conjunto de dados p/ treinamento, são
    feitas amostras. Então é aplicado um esquema de
    aprendizado para cada uma e classificador gerado
    vota.
  • Não gera amostras sempre ? apenas altera

5
Boosting
  • Não usa pesos iguais numa votação como o bagging
  • Depende da performance do modelo construído
    anteriormente para escolha da atribuição de pesos
  • Previsão numérica e classificação Bagging.
    Diferente apenas na atribuição de pesos
  • Começa com pesos iguais para todas as instâncias
    do conjunto de treinamento

6
Stacking
  • Menos usado que bagging e boosting
  • Dificuldade de analisá-lo teoricamente
  • Não há melhor maneira aceita de fazê-lo
  • Diferença de Bagging e Boosting
  • Não combina modelos de um mesmo tipo
  • Pode ter um decision tree inducer, a Naive Bayes
    learner e outros modelos construídos por
    diferentes algoritmos de aprendizagem.
  • Procedimento de votação é diferente
  • Usa um meta learner ? algoritmo de aprendizado
    responsável na escolha de quais classificadores
    são os mais confiáveis

7
Error-Correcting Output Codes
  • Técnica de melhoramento de performance de
    algoritmos de classificação
  • Exemplo
  • Ex a instância 1011111

Não é error correcting
Class Class Vector
a 1000
b 0100
c 0010
d 0001
Class Class Vector
a 1111111
b 0000111
c 0011001
d 0101010
É error correcting
Write a Comment
User Comments (0)
About PowerShow.com