Construção de classes - quantidade e tamanho das classes

ProfessorGuru.com.br - Todos os direitos reservados - 2018

site seguro ssl
Hospedagem Professor Guru - One.com
logotipo professor guru

ESTATÍSTICA - PROBABILIDADE - DICAS DE ESTUDO - VÍDEO AULAS

TUTORIAIS PHOTOSHOP - CURSOS PARA PROFESSORES

Inscrever-se no Facebook - Professor Guru
Assinar canal Professor Guru no Youtube
Assinar canal Professor Guru no Youtube
Assinar canal Professor Guru no Youtube
Assinar canal Professor Guru no Youtube

Construção de classes: determinação do número de classes

Determinação da quantidade de classes

 

Spiegel (1975) apresenta algumas sugestões de como elaborar uma distribuição de frequências:

 

“1. Determinam-se o maior e o menor número dos dados brutos e, então, calcula-se a amplitude total do rol (diferença entre o maior e o menor daqueles números).

2. Divide-se a amplitude total em um número conveniente de intervalos de classe que tenham a mesma amplitude. Se isto não é possível, usam-se intervalos de classe de amplitudes diferentes ou abertos. O número de intervalos de classe é comumente tomado entre 5 e 20, dependendo dos dados. Os intervalos de classe são escolhido também, de maneira que seus pontos médios coincidam com os dados realmente observados. Isso tende a diminuir o denominado erro de agrupamento que surge em análises matemáticas ulteriores. Entretanto, os limites reais de classe não coincidiriam com os dados realmente observados.

3. Determinam-se o número de observações que caem dentro de cada intervalo de classe, isto é, calculam-se as frequências de classe.”

 

Vejamos, também, o que Lima (2001) diz a respeito: “apesar de não adotarmos nenhuma regra formal quanto ao total de faixas, utilizamos, em geral, de 5 a 8 faixas com mesma amplitude. Entretanto, ressaltamos que faixas de tamanho desigual podem ser convenientes para representar valores na extremidade da tabela.”

 

Daremos a seguir 5 formas de determinarmos a quantidade e o tamanho de cada classe. Para isso, suponhamos uma amostra de tamanho 200 em que observamos as idades das pessoas. A menor idade foi 10 anos e a maior, 70 anos.

 

1°) Classes desiguais. Critério subjetivo.

 

As classes variam segundo os interesses do pesquisador.

 

Exemplo

 

Foram construídas 6 classes, de acordo com algumas fases da vida. As classes apresentam tamanhos (amplitudes) diferentes.

 

 

2°) Classes de mesmo tamanho; número de classes pré-fixado.

 

Suponhamos que desejamos construir 7 classes. O valor mínimo da nossa amostra é 10 e o máximo é 70. A amplitude total (AT) é:

 

AT = máx. – mín.

AT = 70 – 10 = 60

 

Como o número de classes (k) é 7, a amplitude de cada classe (h) é:

 

h = AT / k

h = 60 / 7 >>> 8,57

 

Vamos utilizar h = 9. Obteremos:

 

Utilizamos uma amplitude de classe um pouco superior à calculada. Por isso, a 7ª classe vai de 64 até 73 (embora o maior valor observado seja 70).

3°) Regra de Sturges.

 

É uma das regras mais utilizadas na prática. Vamos utilizar a regra de Sturges para calcular o número de classes (k). Se tivermos n valores, o número de classes será:

 

Essa fórmula pode ser “resumida” na tabela a seguir:

Em nosso caso, n = 200. Logo:

 

 

k = 1 + 3,3.log 200

k = 1 + 3,3 . 2,3010

k = 1 + 7,5933

k = 8,5933 >>> 9

 

A amplitude de cada classe é

 

Finalmente, as classes são:

4°) Critério da raiz quadrada.

 

O número de classes (k) é dado por

Em nosso exemplo:

O tamanho de cada classe é

Vamos considerar h = 5. Teremos:

Nota: a última classe teve os dois extremos fechados.

 

 

5°) Critério da desigualdade:

 

O valor de k é o menor inteiro tal que 2k n.

(fonte: http://alea-estp.ine.pt/ingles/html/nocoes/html/cap3_2¬5.html)

 

Em nosso caso, devemos descobrir k tal que 2k que seja maior ou igual a 200. Como 27 = 128 e 28 = 256, então k = 8. Amplitude:

 

Em resumo, qualquer regra para determinação do número de classes não nos leva a uma decisão final, que depende, na realidade, de um julgamento do pesquisador.

Alguns problemas na montagem das classes

 

Vejamos alguns exemplos que nos permitam verificar alguns problemas que ocorrem com certa frequência na escolha das classes a serem utilizadas.

 

Na tabela A, foi mantida a mesma amplitude de intervalo de classe (R$ 100) em toda a tabela. Como resultado, há muitas classes com frequência igual a zero e os detalhes são “escassos” para salários altos.

Na tabela B, as classes vazias e os detalhes escassos foram evitados mediante emprego do intervalo aberto “1200 ou mais”. A desvantagem disso é que a tabela torna inaplicável a realização de certos cálculos matemáticos.

Na tabela C, foi adotada uma amplitude do intervalo de classe igual a R$ 200. Uma desvantagem é que desaparecem muitas informações referentes aos salários menores e os detalhes ainda são escassos para salários mais altos.

Na tabela D, foram empregadas amplitudes de intervalo de classe desiguais. Uma desvantagem é que certos cálculos matemáticos (quando feitos sem o auxílio de um computador) perdem a simplicidade. Também, quanto maior for a amplitude do intervalo de classe, tanto maior será o erro de agrupamento.

Exemplo

 

Construir uma tabela com as distribuições de frequências absoluta e acumulada para os 80 valores a seguir, utilizando a Regra de Sturges:

Observando a tabela, temos que:

 

- Total de dados: n=80.

- Limite inferior (ou valor mínimo): LI = 5,1.

- Limite superior (ou valor máximo): LS = 14,9.

- Amplitude total: AT = LS - LI = 14,9 - 5,1 = 9,8

- Número de classes (fórmula de Sturges):

k = 1 + 3,3 . log n

k = 1 + 3,3 . log 80

k = 7,28

 

Arredondando, temos: k = 7.

 

- Amplitude do intervalo de cada classe:

 

h=9,8/7=1,4

 

Quando necessário, arredondar o valor de h sempre para mais.

 

A partir desse resultado, construímos a tabela:

 

Comparação da Regra de Sturges com outros critérios

 

A Regra de Sturges é uma das regras mais utilizadas na Estatística. Isso porque a fórmula de Sturges nos fornece uma quantidade adequada de classes para os mais variados tamanhos de amostras.

 

Existem várias regras e critérios para a determinação do número de classes. Aqui, estudamos, além da Regra de Sturges, o critério da Raiz Quadrada e o critério da Desigualdade. É importante notar que dependendo do critério adotado e do tamanho da amostra, teremos quantidade de classes diferentes para cada critério. Na tabela a seguir, podemos comparar os resultados para cada um dos três critérios considerando amostras de tamanhos 20, 200, 2000 e 20000:

 

Perceba que o critério da Raiz Quadrada só é adequado para valores pequenos de n (funciona bem para valores de n menores que 100 ou, no máximo, 150). Já o critério da Desigualdade e a Regra de Sturges, nos fornecem resultados muito próximos. Porém, devido a dificuldade em se calcular o valor de k no critério da Desigualdade, geralmente acabamos por optar em trabalhar com a Regra de Sturges.

Página inicial
Menu