segunda-feira, 11 de fevereiro de 2008

Sobre a amostra por cotas

A discussao vai e volta na lista de estatistica e nao se chega a uma conclusao. Parece, no entanto que os mais esclarecidos apontam os defeitos, mas nao chegam a serem contra. Os mais academicos abominam uma vez que a aleatoriedade tao pregada no curso de amostragem vai por agua abaixo.

Eh preciso vivenciar a pratica para criticar a amostra por cota e a dita probabilistica, eh preciso conhecer a realidade para poder compara-las. Nem sujeito nao estatistico accostumado a trabalhar com cotas nem o academico acostumado a ler livros de estatistica geralmente estao aptos para falar disso.

O primeiro ponto que precisa ficar claro penso que eh uma critica valida a amostra por cotas. E nem eh ao tipo de amostra, mas ao jeito de divulgar e analisar dados. Na pressa da divulgacao de resultados do mundo dos negocios, costuma-se relevar a segundo plano itens importantes da teoria estatistica como o calculo da variabilidade e consequentemente do erro amostral. A amostra seja qual metodologia for deve ser analisada apropriadamente, deve se deixar claro metodologias e suposicoes. Eh um assunto dificil, mas importante, pois a medida que se faz amostra por cota sem padrao algum de coleta de dados e de divulgacao o meio da pesquisa e tambem o nosso meio profissional fica uma bagunca. Isso valeria para amostras probabilisticas, mas o problema eh visto nas amostras por cotas porque elas que sao feitas. Eu costumo falar em erro aproximado, deixando claro que amostra por cota nao tem erro mensuravel e que suposicoes estou fazendo, mas concordo que isso nao eh suficiente. Mas eh dificil, bem dificil caminhar nesse assunto uma vez que faltam teorias, os estatisticos vao para o mercado de trabalho sem saber o que eh uma amostra por cota, quando essa eh a unica coisa que se pratica lah. Eh uma falha academica que depois de muito bater cabeca corremos atras de sanar. E aqui entra tambem a amostra probabilistica, pois no curso de estatistica aprendemos a famosa AAS que nunca vamos conseguir aplicar na vida e boa. Nunca ouvimos sequer falar da nao resposta, e, pelo menos no meu caso, pouquissimas vezes ouvimos fazlar das amostras complexas, como analisa-las e como desenha-las. Na pratica nos deparamos entao com o que nunca encontramos na teoria, e com a impossibilidade da aplicacao da teoria que aprendemos.

Aparte do problema da divulgacao dos resultados, da f0rma correta de analisar resultados e mostra-los, temos o problema tambem muito discutido da validade da amostra por cotas. Me parece que quem eh familiarizado com o assunto nao entra nessa discussao, eles jah nao sao contra amostra por cotas, a discussao eh mais sobre como faze-las da melhor forma e como divulgar e analisar os resultados. Eu estou nesse grupo embora nao me considero assim familiarizado com o assunto. a questao eh que nao podemos dizer que amostra por cotas eh pior ou melhor do que a probabilistica sem pelo menos uma analise de cada caso. Em qualquer caso onde amostramos a populacao geral, a amostra probabilistica simplesmente nao pode ser feita por causa da nao resposta. Uma vez que nao conseguimos atribuir a cada individuo uma probabilidade de resposta, conseguimos apenas uma probabilidade de selecao, pronto, a rigor nao temos mais uma amostra probabilistica. E em certos casos a nao resposta eh tao grande que ninguem sabe o tipo de vies que pode se ter. Muitas suposicoes sao necessarias, como sao na amostra por cotas. Falar em amostra probabilistica quando se amostra a populacao geral acaba nem tendo sentido. Entao porque defender algo que nao pode ser feito? Podemos argumentar que pelo menos na probabilistica o entrevistador nao escolhe ninguem, ha uma nao resposta mas nao hah uma escolha deliberada do respondente, como na amostra por cota. Mas pra mim isso pouco quer dizer uma vez que vc vai precisar de suposicoes e de informacoes para trabalhar com a nao resposta na probabilistica e nao se pode dizer que elas sao melhroes ou piores do que as suposicoes da amostra por cotas.

Minha opiniao acaba sendo que nos estatisticos precisamos ter muito cuidado na forma como analisamos e divulgamos os resultados de qualquer pesquisa, deixando claras as suposicoes e metodologias, e justificando-as. Mas alem disso muita pesquisa eh necessaria para que consigamos chegar a um meio termo menos nebuloso onde sejam definidas algumas diretrizes para a pratica da amostragem e nao fique cada estatistico palpando no escuro por conta propria depois de descobrir que o que aprendeu na universidade nao vale. Soh uma uniao maior da nossa categoria nos possibilitaria sermos mais fortes junto aos institutos de pesquisas e exigir mais rigor tecnico nos procedimentos, ainda que isso dependa de mais recursos financeiros.

Um comentário:

Anônimo disse...

Acho válida tua colocação sobre não aceitar passivamente nem a mitificação da aleatorização (divinizada pela estatística frequentista) e nem a supervalorização da experiência inconsciente.

O método estatístico se caracteriza matematicamente por ser um grande problema de otimização: obter o máximo de informação ao menor custo possível (entenda-se suficiência), a fim de tomar a melhor decisão. Enfim, deste ponto de vista, jogar fora qualquer informação prévia sobre a população a ser amostrada é, no mínimo, ineficiente.

Talvez uma possibilidade, ao invés de estimar a variabilidade das estimativas, seja modelar probabilisticamente esta variabilidade. Uma espécie de distribuição priori sobre o erro da estimação (seja pontual, seja via distribuição posterior, etc.).

A questão é interessante é não deveria se fechar em uma discussão sobre dogmas. A responsabilidade do estatístico é com o problema a ser resolvido, e não com esta ou com aquela metodologia.

Volta ao Bairro Moss Park

Depois de uma semana lenta, eu escolhi um bairro do centro para contornar hoje, Sábado. O bairro Moss-Park é bastante falado por ser um bair...