Como determinar o número de caixas para um histograma

Um histograma é uma representação gráfica de dados introduzido pela primeira vez pelo estatístico Karl Pearson. Um histograma é constituída por uma série de rectângulos, ou "bins", em que a altura do rectângulo representa a frequência de observações, e a largura do rectângulo representa a quantidade a ser medida. Portanto, a superfície do rectângulo representa o número total de observações. O histograma é configurado como um gráfico, com números no eixo horizontal dispostas sequencialmente de modo a frequência relativa de eventos podem ser comparados. Não há número exato de lixo para um histograma, mas existem regras gerais que podem ser seguidas para ajudá-lo no desenvolvimento de um histograma.

  • Determinar a largura que você gostaria que o bin para ser. Por exemplo, suponha que você gostaria que cada bin para representar dois valores consecutivos no eixo horizontal (digamos 1 e 2, ou 5 e 6) - portanto, a largura bin é 2.



  • Subtrair o valor máximo nos dados estabelecidos por o valor mínimo no conjunto de dados. Por exemplo, se a observação máximo é 24 e o mínimo é zero, a diferença resultante é 24.

  • Dividir a diferença entre os valores máximos e mínimos por a largura das caixas. Para o exemplo aqui, isso significaria dividir 24 por 2, que dá 12. Este é o número de caixas que devem ser usados ​​para o seu histograma.

dicas avisos

  • Se o número ideal de caixas calculados é um número decimal, em volta deste número para o número inteiro mais próximo, independentemente do valor. Por exemplo, se o número escaninho óptima foi calculada como sendo de 4,15, isto seria arredondado para 5.
  • Uma grande variedade de técnicas podem ser utilizadas para determinar o tamanho e número escaninho óptima. O método descrito aqui é o mais geralmente applicable- No entanto, a técnica específica utilizada pode depender da aplicação específica do histograma.
De esta maneira? Compartilhar em redes sociais:

LiveInternet