Quais são as lacunas, clusters e outliers no matemática?

Negócios, governamentais e acadêmicos atividades quase sempre requerem a recolha e análise de dados. Uma das maneiras de representar dados numéricos é através de gráficos, histogramas e gráficos. Estas técnicas de visualização permitem que as pessoas para obter uma melhor visão sobre os problemas e encontrar soluções. Lacunas, clusters e valores atípicos são características de conjuntos de dados que influenciam a análise matemática e são facilmente visíveis em representações visuais.

Buracos no Dados

  • Lacunas referem-se a áreas perdidos em um conjunto de dados. Por exemplo, se uma experiência científica recolhe dados de temperatura na gama de 50 graus centígrados a 100 graus Fahrenheit, mas nada entre 70 e 80 graus, que representaria uma lacuna existente no conjunto de dados. Um gráfico de linha deste conjunto de dados teria "X" marcas para temperaturas entre 50 e 70 e novamente entre 80 e 100, mas não haveria nada entre 70 e 80. Os pesquisadores podem cavar mais fundo e explorar por que certos pontos de dados não aparecem em uma amostra coletada.

Grupos isolados



  • Clusters são grupos isolados de pontos de dados. gráficos de linha, que são uma das maneiras de representar conjuntos de dados, são linhas com "X" marcas colocadas acima números específicos para descrever sua frequência de ocorrência no conjunto de dados. Um conjunto é descrito como um conjunto de estes "X" marcas em um pequeno subconjunto intervalo ou dados. Por exemplo, se as notas dos exames para uma classe de 10 alunos são 74, 75, 80, 72, 74, 75, 76, 86, 88 e 73, o mais "X" marcas sobre uma trama de linha será no intervalo de pontuação 72-to-76. Isso representaria um cluster de dados. Observe a frequência para 74 e 75 é dois, mas para todas as outras pontuações, é um.

Nos extremos

  • Outliers são valores extremos - pontos de dados que se encontram significativamente fora outros valores em um conjunto de dados. Um outlier deve ser significativamente menor do que ou maior do que a maioria dos números de série de dados. A definição de "extremo" depende da circunstância e um consenso dos analistas envolvidos na pesquisa. Outliers podem ser pontos de dados ruins, também conhecido como ruído, ou eles podem conter informações valiosas sobre o fenômeno a ser investigado e da própria metodologia de coleta de dados. Por exemplo, se as pontuações de classe são na sua maioria na faixa de 70 a 80, mas um par de pontuações são na década de 50 baixos, aqueles podem representar valores atípicos.

Juntando tudo

  • Lacunas, outliers e clusters em conjuntos de dados podem impactar os resultados da análise matemática. Lacunas e clusters podem representar erros na metodologia de coleta de dados. Por exemplo, se um telefone sondagens de pesquisa apenas determinados códigos de área, tais como complexos de habitação de baixa renda ou high-end áreas residenciais suburbanas, e não um amplo corte transversal da população, as chances são de que haverá lacunas e clusters nos dados . Outliers pode distorcer o valor médio ou médio de um conjunto de dados. Por exemplo, a média ou valor médio de um conjunto de dados que consiste em quatro números - 50, 55, 65 e 90 - é de 65. Sem o outlier 90, no entanto, a média é de cerca de 57.

De esta maneira? Compartilhar em redes sociais:

LiveInternet