SAUDAÇÕES!

Seja bem vindo à página do professor Pedro Albuquerque. Para saber mais sobre meu currículo, disciplinas ministradas e interesses de pesquisa, navegue no menu disponível no topo da página.

segunda-feira, 28 de maio de 2012

Cálculo do tamanho de amostras: proporções.
















Se eu ganhasse um real para cada vez que alguém me perguntasse qual deve ser o tamanho amostral hoje eu estaria rico!!!

Isso se deve principalmente a uma falta de conhecimento de como os delineamentos amostrais são construídos.

No caso de planos amostrais vale a máxima:


"É melhor qualidade do que quantidade."


Ou seja, o tamanho amostral é importante mas não é mais importante do que a qualidade desse plano amostral. E a qualidade é medida pela variabilidade dos estimadores construídos, quanto menor a variabilidade maior a eficiência do plano amostral.

Essa variabilidade é alterada pelo tipo de delineamento amostral. Exemplos de desenhos amostrais são: amostragem aleatória simples, amostragem sistemática, amostragem por conglomerados, amostragem de Poisson, etc.

Entretanto, apesar da estimação da variância em planos amostrais e a construção de delineamentos sofisticados serem fundamentais, esses não serão escopo desse post.

Falarei aqui sobre como calcular o tamanho amostral para estimadores de proporção em amostras aleatórias simples.

Para outros tipos de estimadores, como: parâmetros de regressão, variância e correlações ou ainda estimadores em planos amostrais diferentes da amostra aleatória simples, outros textos são necessários (veja por exemplo: Cochran (1977); Schaeffer, et. al (2011), Särndal, et.al (2003)).



Cálculo do tamanho amostral para estimadores de proporção.



Para o cálculo do tamanho amostral necessário para estimar proporções alguns ingredientes são importantes:

  1. Tamanho da população: é o tamanho da população alvo. Representado usualmente por $N$
  2. Erro permissível: é o erro admitido para o estimador de proporção. Por exemplo, quando você assisti o Jornal Nacional e o William Bonner diz que o percentual de pessoas que aprovam o governo Dilma é de 68.4% com uma margem de erro de dois pontos percentuais para mais ou para menos (±2%), essa margem é o erro permissível. O tamanho amostral para a estimação de proporções leva em consideração o quanto você "aceita errar" na estimativa do parâmetro populacional. Para proporções esse erro deve estar entre 0 e 1 (varia entre 0% a 100%).
  3. Confiabilidade: como amostragem é um processo probabilístico, existe uma probabilidade desse erro permissível (ou seja o erro máximo aceitável) não ser satisfeito. Definimos como nível de confiança (confiabilidade) a probabilidade do erro máximo permissível ser satisfeito. Usualmente, trabalha-se com probabilidades como 90%, 95%, 99% ou ainda 99.9% dependendo do tipo de estudo. O nível de confiança (representado por $1-\alpha$ onde $\alpha$ é o nível crítico.) varia entre 0 e 1 (varia entre 0% a 100%)
  4. Proporção:o último ingrediente para o cálculo do tamanho amostral necessário é o valor da proporção representado por $\hat{p}$, esse valor varia entre 0 e 1 (varia entre 0% a 100%). Você deve ter pensado: "Mas pera aí... Como eu vou fornecer o valor da proporção para o cálculo do tamanho amostral se é JUSTAMENTE ISSO QUE EU QUERO ENCONTRAR ???". Você está certo em se indignar... Esse é o componente mais complicado de ser encontrado. Há no entanto algumas sugestões:
    • Utilize $\hat{p}=0.5$. Nesse caso, o "pior dos casos" é construído e o tamanho amostral máximo é obtido. (Cochran (1977) página 72.)
    • Encontre o valor de $\hat{p}$ utilizando outro estudo. Por exemplo, procure alguma estatística ou algum artigo que indique "mais ou menos" qual deve ser o valor da proporção. Suponha que o objetivo seja calcular a proporção de computadores quebrados na UnB, podemos usar algum texto ou artigo que estime a proporção de computadores em outra instituição de pesquisa e então essa proporção é utilizada como proxy.
    • Faça uma amostra piloto utilizando um tamanho amostral arbitrário. Com base nessa amostra piloto calcule o valor da proporção e então estime o tamanho amostral necessário. Por exemplo, suponha que o objetivo seja, novamente, calcular a proporção de computadores quebrados na UnB. Podemos amostrar dez computadores e calcular o valor da proporção. Então utilizamos esse valor para estimar o tamanho da amostra. Suponha que encontremos o valor de 234 para o tamanho amostral. Isso significa que temos que amostrar 234 computadores... Mas, como dez computadores já foram amostrados, o tamanho da amostra deverá ser 224=234-10.
Com base nessa breve explicação, considere o seguinte exemplo: o total de alunos matriculados na UnB em 2011 foi de 30757 alunos. Suponha que desejamos fazer uma pesquisa sobre a proporção de alunos que aprovam o uso de cotas no vestibular, nesse caso temos que definir algumas informações.

Podemos definir o erro permissível como 0.05, ou seja, adimite-se que a proporção de alunos que aprovam o uso de cotas no vestibular pode variar 5 pontos percentuais para mais ou para menos, o nível de confiança mais utilizado é de 95% isso significa que se o processo amostral for repetido muitas vezes espera-se que a margem de erro ±5% seja satisfeita em 95% das vezes. Por fim, como não conhecemos a priori nenhuma informação sobre o percentual de alunos que aprovam o uso de cotas, podemos fazer $\hat{p}=0.5$ como abordagem conservadora.

Abaixo segue o programa para o cálculo do tamanho amostral:


Tamanho da população:


Erro permissível:


Proporção:


Confiabilidade:


Tamanho da amostra:



Note que ao executar o programa o tamanho da amostra estimado foi de 380. Esse valor poderia ser reduzido se fizéssemos uma amostra piloto ou se tivéssemos uma estimativa menos rígida para a proporção de alunos que aprovam o uso de cotas.

Maiores detalhes sobre esse processo, incluindo a fórmula para o cálculo do tamanho amostral você encontra em (Cochran (1977) página 75.)

21 comentários:

  1. Professor, bom dia!

    Esse cálculo serviria para definir uma amostra da quantidade de documentos de um sistema a serem verificados?
    Ex: No sistema X tenho 1000 casos de uso e no sistema Y tenho 10 casos de uso. A amostragem adequada para ambos seria qual?

    Você teria essa fórmula no excel? Poderia me passar? (glennamb@yahoo.com.br ou glenna.balthar@gmail.com)
    Obrigada!

    ResponderExcluir
    Respostas
    1. Se essa é somente a informação que você tem, o melhor é usar a abordagem de proporção. Mude apenas o tamanho da população para a população que você quer 1000 e 10, respectivamente o que fornece tamanhos amostrais iguais a 278 e 10.

      Excluir
    2. Oi professor!
      Muito obrigada pela resposta!!!

      Você sabe se o tamanho da amostra para o exemplo 1 (1000) seria o produto de todas as variáveis?

      Tamanho da população:
      30757


      Erro permissível:
      0.05


      Proporção:
      0.5


      Confiabilidade:
      0.95


      Tamanho da amostra: 278

      Excluir
    3. Não é simplesmente o produto. A fórmula você encontra aqui: (Cochran (1977) página 75.)

      Excluir
  2. Boa noite professor. Saberia me explicar como eu faço a seguinte questão?
    Um estudo será feito numa população pra se estimar a proporção de mulheres possuidoras de veiculos. Qual o tamanho da amostra se desejarmos estar confiantes em 99% de que a estimativa não difira da verdadeira proporção em mais do que 1%. Estou travada nessa questão há dias

    ResponderExcluir
    Respostas
    1. Olá.. Essa é uma questão de amostragem em populações infinitas de curso de estatística básica. Dê uma olhada no livro Introdução à Estatística do Triola na parte de Proporções e lá deve ter alguns exemplos de como proceder.

      Excluir
  3. Boa noite professor. Saberia me explicar como eu faço a seguinte questão?
    Um estudo será feito numa população pra se estimar a proporção de mulheres possuidoras de veiculos. Qual o tamanho da amostra se desejarmos estar confiantes em 99% de que a estimativa não difira da verdadeira proporção em mais do que 1%. Estou travada nessa questão há dias

    ResponderExcluir
  4. Boa noite professor. Saberia me explicar como eu faço a seguinte questão?
    Um estudo será feito numa população pra se estimar a proporção de mulheres possuidoras de veiculos. Qual o tamanho da amostra se desejarmos estar confiantes em 99% de que a estimativa não difira da verdadeira proporção em mais do que 1%. Estou travada nessa questão há dias

    ResponderExcluir
  5. Olá professor Pedro. Obrigado pela postagem, me ajudou a entender algumas coisas que eu não sabia a respeito da amostragem.

    Eu tenho uma dúvida, se o senhor puder me ajudar eu te agradeço.

    Sou acadêmico e estou desenvolvendo um estudo transversal em uma instituição de saúde e estamos com dificuldade de calcular a amostra, uma vez que a população que vai até a instituição é, como posso dizer... não-fixa... há dias em que diversas pessoas vão e em outros dias não. Estamos aplicando questionários com as pessoas presentes. Existe uma lista de quantas pessoas deveriam estar presentes lá naquele dia, no entanto, são poucas as que vão.

    Nós devemos estimar a quantidade de pessoas atendidas durante o período em que estamos lá coletando os dados com os clientes ( estabelecemos que seria de agosto até dezembro deste ano - assim devemos estimar quantas pessoas estiveram presentes durante esse período?)? Se sim, como fazer isso, uma vez que há uma lista um pouco "defasada" de quantas pessoas deveriam estar lá?

    Abs,
    Felipe.

    ResponderExcluir
    Respostas
    1. Felipe,
      No seu caso a abordagem é outra... Chama abordagem de populações infinitas. Existe um software que te ajuda a calcular. Chama PASS.. A última versão dele acho que é a 14. Grande abraço.
      Pedro

      Excluir
  6. Cara, preciso da sua ajuda. Não consigo descobrir o resultado:

    2- Suponha que um total de 789.654 famílias residia em um bairro em São Paulo Capital e 563.282 delas possuem casas próprias. Uma amostra de 240 famílias é selecionada a partir desse bairro e 158 delas possuem casa própria. Encontre a proporção de famílias na amostra, que possuem casa própria.

    Grato.

    ResponderExcluir
    Respostas
    1. R- A proporção de famílias na amostra que possuem casa própria: 158/240
      n = Z2 x [ P x (1-P) ] / E2
      onde n=tamanho da amostra,
      Z=nivel de confiança (=1,96 p/ =5% e ic=95%),
      P=proporção,
      E=erro amostral

      E2 = 1/240 = 0,004 (aproximadamente.)
      158 = 1,962 x [ P x (1-P) ] / 0,004
      0,6583 = 3,8416 x [ P x (1-P) ]
      [ P x (1-P) ] = 0,1714
      P = 0,22 ou 22% aproximadamente
      Resposta: Proporção de famílias que possuem casa própria é de 22% aproximadamente

      a) E se a amostra fosse 560 famílias selecionadas e 270 com casa própria.
      n = Z2 x [ P x (1-P) ] / E2 onde n=tamanho da amostra,
      Z=nivel de confiança (=1,96 p/ =5% e ic=95%),
      P=proporção,
      E=erro amostral
      E2 = 1/560 = 0,002 (aproximadamente.)
      270 = 1,962 x [ P x (1-P) ] / 0,002
      0,4821 = 3,8416 x [ P x (1-P) ]
      [ P x (1-P) ] = 0,1255
      P = 0,15 ou 15% (aproximadamente.)
      Resposta: Proporção de famílias que possuem casa própria é de 15% aproximadamente

      a) E se a amostra fosse 1.423 famílias selecionadas e 861 com casa
      n = Z2 x [ P x (1-P) ] / E2 onde n=tamanho da amostra,
      Z=nivel de confiança (=1,96 p/ =5% e ic=95%),
      P=proporção,
      E=erro amostral
      E2 = 1/1423 = 0,0007 (aproximadamente.)
      861 = 1,962 x [ P x (1-P) ] / 0,0007
      0,6027 = 3,8416 x [ P x (1-P) ]
      [ P x (1-P) ] = 0,1569
      P = 0,195 ou 19,5% (aproximadamente.)
      Resposta: Proporção de famílias que possuem casa própria é de 19,5% aproximadamente

      Excluir
  7. tenho 10000 amostras e quero o menor numero de amostragem para verificação, qual seria o melhor valor para proporção???

    ResponderExcluir
  8. Boa tarde professor, eu pretendo avaliar o nível de satisfação dos turistas que visitam a um determinado atractivo turistico. Segundo a Direcção, aquele local tem recibido entre 750 a 800 turistas por semana e 2500 a 3000 por mês. Agora qual deve ser a amostra? anselmosamo@gmail.com

    ResponderExcluir
  9. Ola Professor, tudo bem? Estou realizando uma pesquisa junto à uma fan page de uma prefeitura. Minha pesquisa se estende por todo o ano de 2015, porém como estou analisando às postagens sobre vários aspectos, precisa encontrar uma amostra eficiente. Por exemplo nesta página tem em torno de 2400 postagens (2015), fiz os cálculos e me forneceu um número de 66 postagens, tendo como erro permissível 0,10 - confiabilidade de 0,90. Posso utilizar a proporção de 0,5? Esta é a fórmula de Cochran?

    ResponderExcluir
  10. Oi professor, gostaria de saber como poderia calcular uma amostra, tenho informações do ano 2000 até o ano de 2015, porém só consigo acessar os valores de 2011 a 2015. Gostaria de saber se a amostra que eu pegar entre 2011 e 2015 pode ser relacionada ao todo. Por exemplo. quero fazer uma pesquisa nos prontuarios dos pacientes que foram submetidos a extração dentária, e quero ver dentro dessas extrações quais que tiveram alveolite no pós operatório, os atendimentos começaram no ano de 2000 porém o sistema de cadastro de pacientes foi emplementado no ano de 2011, seria inviável buscar estes prontuarios antes de 2011. Como poderia resolver essa situação, e conseguir uma amostragem significativa que representasse essa "população". Desde já agradeço!

    ResponderExcluir
  11. Bom dia, professor!!
    Estou elaborando uma pesquisa e fiquei preso na amostragem.
    A população da cidade x corresponde a 100.000, e o meu público representa 12.400. Como extrair a amostra do meu público alvo com a margem de confiança em torno dos 95%?

    ResponderExcluir
  12. Boa tarde, professor!
    Quando se trata de amostra estratificada proporcional e os números possuem valores muito distantes, como devo calcular? Lembro que eu fazia o calculo para amostra proporcional estratificada e depois multiplicava cada resultado por um número (acho que era 4,alguma coisa). Eu me esqueci e não consigo encontra na internet. Eu estava fazendo uma pesquisa em clinicas e o número dos atendimentos variava entre 15 numa clinica, 300 em outra e 600 em outra diferente, por exemplo. Nesse casos como calcular a proporção?

    ResponderExcluir
  13. Selecionei 200 peças de um dia de produção. Dessas verifiquei que 60 são para um único cliente, dessas 10 tinha defeito sendo que 6 foram corrigidas e 4 passaram. Gostaria de saber como calcular uma amostra para comprovar o % defeito desse cliente.

    ResponderExcluir
  14. Ola, então. o meu estudo experimental será composto de 3 grupos. Para a variável escolhida eu quero uma diferença de 20%. Como faço esse calculo amostral para saber quantos indivíduos preciso em cada grupo para obter essa diferença de 20%?

    ResponderExcluir