Para esse laboratório considere os seguintes classificadores:
- KNN;
- Naïve Bayes;
- Linear Discriminant Analysis;
- Logistic Regression;
- Perceptron.
Considere também as base de treinamento (20000 exemplos) e teste (58646 exemplos), as quais contem 10 classes balanceadas e 132 características.
Escreva um breve relatório que:
- Compare o desempenho desses classificadores em função da disponibilidade de base de treinamento. Alimente os classificadores com blocos de 1000 exemplos e plote num gráfico o desempenho na base de testes. Analise em qual ponto o tamanho da base de treinamento deixa de ser relevante.
- Indique qual é o classificador que tem o melhor desempenho com poucos dados < 1000 exemplos.
- Indique o classificador que tem melhor desempenho com todos os dados.
- Indique o classificador mais rápido para classificar os 58k exemplos de teste.
- Analise as matrizes de confusão. Os erros são os mesmos para todos os classificadores quando todos eles utlizam toda a base de teste?