As desvantagens de regressão logística

A regressão logística ajuda os pesquisadores a construir modelos preditivos.

regressão logística, também chamado de regressão logística ou modelagem logit, é uma técnica estatística permitindo aos pesquisadores criar modelos preditivos. A técnica é mais útil para a compreensão da influência de diversas variáveis ​​independentes em uma única variável desfecho dicotômico. Por exemplo, a regressão logística permitiria que um investigador para avaliar a influência do ponto de classe média, os resultados dos testes e dificuldade currículo na variável resultado da admissão em uma universidade particular. A técnica é útil, mas tem limitações significativas.

Identificar as variáveis ​​independentes

  • A regressão logística tenta prever os resultados com base em um conjunto de variáveis ​​independentes, mas se os pesquisadores incluem as variáveis ​​independentes erradas, o modelo terá pouco ou nenhum valor preditivo. Por exemplo, se as decisões de admissão das faculdades dependem mais cartas de recomendação que os resultados dos testes, e os pesquisadores não incluem uma medida de cartas de recomendação em seu conjunto de dados, então o modelo logit não vai fornecer previsões úteis ou precisos. Isto significa que a regressão logística não é uma ferramenta útil a menos que os investigadores já identificaram todas as variáveis ​​independentes relevantes.

Variáveis ​​de resultados limitados



  • A regressão logística funciona bem para prever resultados categóricos, como a admissão ou rejeição em uma faculdade particular. Ele também pode prever resultados multinomiais, como admissão, rejeição ou lista de espera. No entanto, a regressão logística não pode prever os resultados contínuos. Por exemplo, regressão logística não poderia ser utilizado para determinar como febre alta de um paciente irá subir gripe, porque a escala de medição de temperatura - - é contínua. Investigadores podem tentar converter a medição da temperatura em categorias discretas como "febre alta" ou "febre baixa," mas isso iria sacrificar a precisão do conjunto de dados. Esta é uma desvantagem significativa para os pesquisadores que trabalham com escalas contínuas.

Observações independente exigida

  • A regressão logística exige que cada ponto de dados ser independente de todos os outros pontos de dados. Se as observações são relacionados uns aos outros, então o modelo tenderá a excesso de peso o significado dessas observações. Esta é uma grande desvantagem, porque um monte de pesquisa científica e social-científica se baseia em técnicas de pesquisa envolvendo múltiplas observações dos mesmos indivíduos. Por exemplo, testes de drogas usam frequentemente par projetos que comparam dois indivíduos semelhantes, um tomando uma droga e os outros tomaram um placebo combinado. A regressão logística não é uma técnica adequada para estudos usando este projeto.

Overfitting o Modelo

  • tentativas de regressão logística para prever resultados com base em um conjunto de variáveis ​​independentes, mas modelos logit são vulneráveis ​​ao excesso de confiança. Ou seja, os modelos podem parecer ter mais poder preditivo do que realmente fazer como resultado de viés de amostragem. No exemplo admissões da faculdade, uma amostra aleatória de candidatos pode levar um modelo logit para prever que todos os alunos com uma média de pelo menos 3,7 e uma pontuação SAT no percentil 90 será sempre admitiu. Na realidade, porém, a faculdade pode rejeitar algumas pequena percentagem destes candidatos. Uma regressão logística, portanto, seria "overfit," o que significa que exagera a precisão de suas previsões.

De esta maneira? Compartilhar em redes sociais:

LiveInternet