Estimadores Pontuais

ProfessorGuru.com.br - Todos os direitos reservados - 2018

site seguro ssl
Hospedagem Professor Guru - One.com

ESTATÍSTICA - PROBABILIDADE - DICAS DE ESTUDO - VÍDEO AULAS

TUTORIAIS PHOTOSHOP - CURSOS PARA PROFESSORES

Inscrever-se no Facebook - Professor Guru
Assinar canal Professor Guru no Youtube
Assinar canal Professor Guru no Youtube
Assinar canal Professor Guru no Youtube
Assinar canal Professor Guru no Youtube

Estimadores Pontuais

Introdução

 

Em linhas gerais, a Inferência Estatística objetiva estudar a população através de evidências fornecidas pela amostra. É a amostra que contém os elementos que podem ser observados e é onde as quantidades de interesse podem ser medidas.

 

Para exemplificar, considere que é de interesse estudar a proporção de alunos, em uma escola do ensino médio, que pretendem fazer vestibular. Para tanto, podemos selecionar uma amostra de alunos e perguntar a eles sobre suas intenções futuras de estudo. Podemos usar a proporção dos que pretendem prosseguir os estudos nesse grupo como uma indicação para o valor da proporção na escola como um todo. Suponha que a escola tenha 1000 alunos e selecionamos 20 para a amostra. Podemos escolher os 20 em uma mesma classe ou selecionar aleatoriamente as 20 pessoas de toda a escola ou, ainda, escolher uma quantidade igual de meninos e meninas, independentemente da série cursada.

 

Uma forma simples de escolher é associar um número a cada um dos 1000 alunos, colocar todos esses números numa lista e sortear 20 números. Os alunos correspondentes aos números sorteados formariam a amostra. Suponha que você realize o sorteio dessa forma e um amigo seu, desconhecendo sua iniciativa, repita o mesmo procedimento. Você acha que as amostras sorteadas por você e por seu amigo serão as mesmas? Provavelmente não. Se realizarmos várias vezes a amostragem descrita, provavelmente obteremos amostras compostas por alunos diferentes.

 

Porém, apesar de termos amostras diferentes, será que podemos ter respostas próximas ou iguais nas diversas amostras? A resposta é sim, conforme estudaremos mais adiante.

 

Resumindo, podemos dizer que devido à natureza aleatória geralmente envolvida no procedimento amostral, não podemos garantir que repetições de amostras produzam sempre resultados idênticos. Assim, ao coletarmos uma amostra, não podemos prever antecipadamente seu resultado.

 

Note que se a população inteira entra na amostra temos, na verdade, toda a informação possível, visto que estamos realizando uma espécie de censo, ou seja, não há aleatoriedade envolvida. Por exemplo, se os 1000 alunos da escola mencionada acima forem entrevistados, teremos o valor exato da proporção dos que desejam continuar os estudos na universidade. Neste caso, toda a população faz parte da amostra e o resultado obtido irá ser sempre o mesmo, não importando quantas vezes repetimos a coleta da amostra. É claro que estamos supondo que os alunos não trocam de opinião entre as coletas e, portanto, como todos os alunos sempre entram na amostra, a proporção obtida se mantém.

 

Inferência ou Indução Estatística

 

Como visto, trata-se do processo de obter informações sobre uma população com base em resultados observados em amostras aleatórias.

 

De modo geral, há uma população e deseja-se, por meio de uma amostra dessa população, conhecer o mais próximo possível alguma característica da população.

Seja X uma variável da população que se deseja estudar. Seja (lê–se: “teta”) uma característica (medida) de X que se quer conhecer. O parâmetro populacional é desconhecido; para tanto necessitaremos construir um estimador (lê–se: “teta chapéu”) que, mediante os elementos da amostra, ofereça um valor mais aproximado de . A figura seguinte ilustra o processo de Inferência Estatística.

teta chapéu
teta
teta
inferência estatística

Amostra Aleatória

 

Seja X uma variável populacional que se deseja estudar. Uma amostra aleatória de X é um conjunto de n variáveis aleatórias independentes (X1, X2, ..., Xn), tal que cada Xi (i =1, 2, ..., n) tem a mesma distribuição de probabilidade da variável X. Assim, se X ~ N( ; ), cada Xi terá distribuição Xi ~ N( ; ).

 

sigma ao quadrado
sigma ao quadrado
mi
mi

Estimador ou Estatística

 

Dada uma amostra aleatória (X1, X2, ..., Xn), estimador ou estatística é qualquer variável aleatória função dos elementos amostrais. Esta definição permite que qualquer combinação da amostra aleatória (X1, X2, ..., Xn) seja um estimador. Em particular, as medidas de posição e dispersão estudadas anteriormente são exemplos de estimadores. Porém, há os “melhores” estimadores, que satisfazem algumas condições estatísticas específicas: o melhor estimador é aquele que é não viciado (ou não viesado) e é consistente. Tais propriedades não serão estudadas neste momento, e assumiremos que os estimadores apresentados às satisfazem.

 

Estimador da média populacional

 

A média aritmética ou média amostral:

 

média amostral

é um estimador da média populacional .

mi

Estimador da variância populacional

 

A variância amostral:

 

variância amostral

ou ainda,

 

variância amostral

é um estimador da variância populacional .

 

sigma ao quadrado

Estimador do desvio padrão populacional

 

O desvio padrão amostral, que é a raiz quadrada da variância amostral

 

variância amostral

é um estimador do desvio padrão populacional .

sigma

Estimador da proporção populacional

 

A frequência relativa fri, que passaremos a chamar de (lê–se: “p chapéu”)

 

p chapéu
variância amostral

é um estimador da proporção, ou probabilidade p do evento na população.

Estimativa

 

O valor numérico de um estimador é chamado estimativa de seu respectivo parâmetro.

 

Por exemplo: uma pesquisa socioeconômica em uma amostra aleatória de 80 estudantes universitários revelou que 60% eram mulheres. Podemos afirmar que a estimativa da proporção de mulheres estudantes dessa população é de 60%.

 

Distribuição Amostral

 

Como você pode observar, o parâmetro populacional (por exemplo, a média ) é constante (embora normalmente seja desconhecido), seu valor não se altera de amostra para amostra. Contudo, o valor de uma amostra (por exemplo, a média ) é dependente da amostra selecionada; cada amostra revelará um diferente valor de .

 

Como os valores do estimador (as estimativas) variam de amostra para amostra e a inferência estatística baseia-se no estimador, precisamos conhecer como se dá a distribuição de probabilidade do parâmetro.

 

Conhecida a distribuição de probabilidade do parâmetro, teremos condições de avaliar o grau de incerteza das inferências estatísticas realizadas a partir de amostras aleatórias selecionadas da população que se está estudando.

 

Assim, a distribuição amostral de um parâmetro é obtida, empiricamente, pela distribuição de frequência dos valores de das amostras aleatórias de tamanho n, selecionadas da população.

 

A figura a seguir ilustra o processo empírico de construção de um estimador .

 

x barra
mi
x barra
teta
teta chapéu
teta chapéu
obtenção de um estimador

Distribuição Amostral das Médias

 

Vimos que

 

é um estimador da média populacional . O estimador é uma variável aleatória. Portanto, buscamos conhecer sua distribuição de probabilidade.

 

Teorema 1

 

A média da distribuição amostral das médias, denotada por é igual à média populacional. Isto é:

mi de  x barra
x barra
esperança de x barra

Logo, a média das médias amostrais é igual à média populacional, tanto para uma população finita como infinita.

Teorema 2

 

Se a população é infinita, ou se a amostragem é com reposição, a variância da distribuição amostral das médias é:

variância amostral das médias

Ou seja, a variância da distribuição das médias é igual à variância da população dividida pelo tamanho da amostra (n).

 

Logo, o desvio padrão das médias é dado por:

variância amostral das médias

O desvio padrão das médias também é chamado de erro padrão de .

erro padrão
x barra

Teorema 3

 

Se a população é finita, ou se a amostragem é sem reposição, a variância da distribuição amostral das médias é:

 

variância amostral das médias

E o desvio padrão é:

desvio padrão amostral das médias

ou ainda:

desvio padrão amostral das médias

Onde n é o tamanho da amostra e N é o tamanho da população.

 

Importante: o fator de correção finita

fator de correção finita

deve ser utilizado sempre que o tamanho da amostra é maior que 5% da população finita, ou seja, quando

critério de uso do fator de correção finita

Teorema do Limite Central ou Teorema Central do Limite

 

No que foi discutido até aqui, consideramos a distribuição amostral da média X, calculada em uma amostra cujos elementos são constituídos por variáveis aleatórias independentes e com distribuição Normal. Na prática, muitas vezes não temos informações a respeito da distribuição das variáveis constituintes da amostra, o que nos impede de utilizar o resultado apresentado. Felizmente, satisfeitas certas condições, pode ser mostrado que, para um tamanho de amostra suficientemente grande, a distribuição de probabilidade da média amostral pode ser aproximada por uma distribuição Normal. Este fato é um dos teoremas mais importantes da área de Estatística e Probabilidade e é denominado Teorema Central do Limite ou Teorema do Limite Central, cuja demonstração requer técnicas mais avançadas e será omitida.

 

TEOREMA

 

Suponha uma amostra aleatória simples de tamanho n retirada de uma população com média "mi" e variância "sigma ao quadrado" (note que o modelo da variável aleatória não é especificado). Representando tal amostra por n variáveis aleatórias independentes (X1,..., Xn) e, denotando sua média por , temos que

 

 

 

 

 

com Z ~ N(0,1), que é uma variável Normal Padrão.

x barra
teorema central do limite

Em palavras, o teorema garante que para n grande a distribuição da média amostral, devidamente padronizada, se comporta segundo um modelo Normal com média 0 e variância 1. De imediato, podemos notar a importância do Teorema Central do Limite, pois em muitas situações práticas, em que o interesse reside na média amostral, o teorema permite que utilizemos a distribuição Normal para estudar X probabilisticamente. Pelo teorema temos que quanto maior o tamanho da amostra, melhor é a aproximação. Estudos, envolvendo simulações, mostram que em muitos casos valores de n ao redor de 30 fornecem aproximações bastante boas para as aplicações práticas. Em casos em que a verdadeira distribuição dos dados é simétrica, excelentes aproximações são obtidas, mesmo com valores de n inferiores a 30.

 

Para verificar o efeito do tamanho da amostra sobre a distribuição de X, vamos considerar diversos modelos de variáveis aleatórias e vários tamanhos de amostra. Com o auxílio do computador, simulamos a coleta de amostras de um determinado tamanho do modelo escolhido. Repetindo essa coleta um número grande de vezes e calculando as correspondentes médias amostrais, podemos obter um histograma dessas realizações que ficaria muito próximo da função de probabilidade de X.

 

Por exemplo, fixe um tamanho da amostra e repita a coleta 100 vezes. Como cada amostra fornece uma média amostral, temos 100 médias amostrais observadas e com elas construímos um histograma. É claro que, quanto maior for a coleta e as repetições, mais aproximado será o histograma, da função densidade de X. Teremos, então, através dessa simulação, uma ideia de como X se comportaria numa amostra grande e poderemos perceber sua semelhança com a distribuição Normal, conforme assegura o Teorema Central do Limite.

 

Na figura seguinte, apresentamos uma aplicação do procedimento descrito acima. Procuramos escolher modelos bem diferentes de modo a ilustrar a rapidez, no sentido do tamanho da amostra, e a qualidade da aproximação. Os modelos escolhidos foram um Uniforme Discreto, um Binomial, um Exponencial e um modelo contínuo.

 

histogramas mostrando o teorema central do limite

Pode-se observar que, mesmo partindo de distribuição assimétricas, discretas ou contínuas, à medida que o tamanho da amostra cresce, a distribuição de X vai se aproximando para a forma de um modelo Normal. A velocidade da convergência depende da distribuição inicial, sendo mais rápida nas distribuições simétricas.

 

Em resumo: independente de a população ter ou não ter distribuição normal com média e variância , a distribuição das médias amostrais será normalmente distribuída para um valor de n grande.

 

sigma quadrado
mi

Distribuição Amostral das Proporções

 

Seja p um parâmetro que expressa a probabilidade, ou proporção, de determinado evento da população. O estimador de p é, como já vimos, chamade de "p chapéu". Como as variáveis possuem uma distribuição de Bernoulli, concluímos que a média e variância do estimador são:

esperança e variância da proporção amostral

Para n suficientemente grande (n>30), pelo Teorema do Limite Central temos que:

proporção amostral - teorema do limite central

A figura a seguir apresenta vários histogramas obtidos a partir de uma simulação de uma Binomial com parâmetros n e p, considerando alguns valores para n (um para cada coluna) e para p (um para cada linha).

histogramas mostrando o teorema central do limite

Exemplo 1

 

As alturas de árvores de carvalho adultas são normalmente distribuídas, com uma média de 90 pés e desvio padrão de 3,5 pés. Amostras aleatórias de tamanho 4 são tiradas de uma população e a média de cada amostra é determinada. Encontre a média e o erro padrão da média da distribuição amostral.

 

A média da distribuição amostral é igual à média da população e o erro padrão é igual ao desvio padrão da população dividido por raiz de n. Então,

 

exemplo 1

Interpretação: com base no teorema do limite central, como a população é normalmente distribuída, a distribuição amostral de médias das amostras também é normalmente distribuída.

 

Compare os gráficos da distribuição da população e da distribuição amostral:

 

distribuição das alturas da população
distribuição das alturas das amostras

Exemplo 2

 

O gráfico a seguir mostra o período que as pessoas passam dirigindo todos os dias. Você seleciona aleatoriamente 50 motoristas com idade entre 15 e 19 anos. Qual é a probabilidade de que a média de tempo que eles passam dirigindo todos os dias esteja entre 24,7 e 25,5 minutos? Suponha que =1,5 minutos.

sigma
gráfico exercício 2

Como o tamanho da amostra é maior que 30, então podemos usar o teorema do limite central para concluir que a distribuição de médias das amostras é aproximadamente normal com uma média e um desvio padrão de:

resolução exercício 2

Escrevendo a probabilidade procurada e fazendo a padronização da variável temos:

resolução exercício 2

Graficamente:

gráfico exercício 2

Utilizando a tabela da Normal Padrão, temos que:

 

P(–1,41<Z<2,36) = 0,4207 + 0,4909 = 0,9116.

 

Interpretação: na amostra de 50 motoristas de idade entre 15 e 19 anos, 91,16% terá uma média entre 24,7 e 25,5 minutos dirigindo. Isso implica que, supondo que um valor de 25 minutos esteja correto, somente 8,84% da amostra estará fora do intervalo dado.

Exercícios

 

Exercício 1

 

Os gastos médios com quarto e refeição por ano de faculdades de quatro anos são de $ 6803. Você seleciona aleatoriamente 9 faculdades de quatro anos. Qual é a probabilidade de que a média de quarto e refeição seja menor que $ 7088? Suponha que os gastos com quarto e refeição sejam normalmente distribuídos, com desvio padrão de $ 1125.

 

Exercício 2

 

Um auditor de banco declara que as contas de cartões de crédito são normalmente distribuídas com média de $ 2870 e um desvio padrão de $ 900.

a) Qual a probabilidade de que um titular de cartão de crédito aleatoriamente selecionado tenha uma conta menor que $ 2500?

b) Você seleciona 25 titulares de cartões de crédito de forma aleatória. Qual é a probabilidade de que a média da conta deles seja menor que $ 2500?

c) Compare as probabilidades anteriores e interprete a resposta nos termos da declaração do auditor.

 

Exercício 3

 

Uma população é constituída pelos números 2,3,4,5. Considerar todas as amostras possíveis, de tamanho 2, que podem ser extraídas dessa população com reposição. Determinar:

a) a média da população;

b) o desvio padrão da população;

c) a média da distribuição amostral das médias;

d) o desvio padrão da distribuição amostral das médias;

 

e) verifique que e .

 

Exercício 4

 

Coleta–se uma amostra de 10 observações independentes de uma distribuição normal N(2,2) (ou seja, com média 2 e variância 2). Determine a probabilidade de a média amostral:

a) ser inferior a 1;

b) ser superior a 2,5;

c) estar entre 0 e 2.

 

Exercício 5

 

Supõe–se que o consumo mensal de água por residência em certo bairro paulistano tem distribuição Normal com média 10 e desvio padrão 2 (em m3). Para uma amostra de 25 dessas residências, qual é a probabilidade de a média amostral não se afastar da verdadeira média por mais de 1 m3?

Exercício 6

 

Em uma amostra de 800 postos de gasolina, o preço médio da gasolina comum na bomba era $ 2,876 por galão e o desvio médio era de $ 0,009 por galão. Uma amostra aleatória de tamanho 55 é extraída da população.

 

a) É necessário utilizar o fator de correção finita, ou seja, trabalhar com ?

 

b) Qual é a probabilidade de que o preço médio por galão seja menor que $2,871?

 

Download das respostas
Página inicial
Menu