Eu terminei de ler mais um artigo que achei interessante. Esse aqui. Infelizmente não dá para ver o artigo todo aí... É escrito pelo Agresti e outro carinha lá, mas o Agresti é um sujeito muito conhecido por nós estatisticos devido principalmente ao seu livro sobre análise de dados discretos, o qual, aliás, eu consegui praticamente ler inteiro. Mas acho que vou precisar ler uma segunda vez para realmente fixar os conceitos...putz...
Bom, primeiramente um ponto interessante é que o fato de que os intervalos exatos são muito conservadores é conhecido a longo tempo, desde a década de 30, e isso acontece para intervalos exatos de distribuições discretas. A boa notícia é que ele é conservativo e não o contrário, então não há problemas em usá-lo em situações práticas, outro que o de você obter um intervalo mais amplo do que poderia.
O intervalo que usamos frequentemente, chamado de Wald, esse tem desempenho horrível para amotras pequenas, mesmo para amostras de tamanho 100 ele é não conservador, cobrindo o valor do parâmetro em torno de 92% dos casos quando deveria ser 95%. Lembro que esse é o intervalo:
(1) p+-z*raiz((p(1-p)/n)),
onde p é o nosso p-chapeu. Esse intervalo é o resultado da transformação do teste de hipótese usual em intervalo de confiança. A estatistica do teste para testar se p = p0 (p-zero) é:
(2) (p-p0)/raiz((p0(1-p0)/n)).
Lembrando que isso tem uma distribuição aproximadamente normal sob H0 e lembrando do procedimento para construir intervalo com base na estatistica do teste de hipótese, vamos isolar p0 do denominador, e teremos um intervalo para p0 com p no numerador mas o p0 ainda continua no denomidador. p0 é no entanto desconhecido e o procedimento usual é substituir o p0 do denominador por p que é o valor estimado, e temos a equação (1) com intervalo cuja cobertura é bastante ruim.
Para se obter o intervalo do score, que tem cobertura muito melhor que esse de Wald, e não é tão conservador como o exato, basta isolar realmente p0 na equação (2) quando da derivação do intervalo, o que vai resultar numa expressão bem mais complicada para o intervalo de confiança, que será função somente de p, não de p e p0 como (2).
A definição de cobertura é um ponto onde o artigo dá uma deslizada da definição. A cobertura pode ser calculada para qualquer intervalo de confiança, mas não é a mesma para todo valor de p fizando se o tipo de intervalo. Então a definição tradicional de cobertura de um determinado intervalo de confiança é que ela é o valor mínimo encontrado entre todos os ps possíveis. Utilizando essa definição, o intervalo do score tem desempenho pior do que o exato porque sua cobertura é muito ruim em um conjunto muito pequeno de ps, mas segundo a definição essa seria a cobertura a ser considerada.
Nesse artigo o Agresti não usa esse valor mínimo da cobertura, mas o valor médio, integrando sobre os ps. Eu concordo que esse procedimento é muito mais válido do ponto de vista prático do que o da definição onde seria considerada uma cobertura para um valor p que dificilmente acontece. Mas para fazer a integração sobre valores de p, o Agresti precisa supor uma distribuição para p. Ele usou a distribuição uniforme e duas betas e segundo ele o resultado da cobertura média sempre foi similar.
Mas colocando uma distribuição para p, ele meio que escorrega para o lado Bayesiano, e eu sou obrigado a meio que criticar isso. Afinal na minha situação prática, o meu p pode não ter a distribuição uniforme ou Beta que ele supos, pensando que o tal p teria uma distribuição, o que pode ser estranho. Eu já tenho aceitado isso nos casos de pesquisas na população, por exemplo, porque a pesquisa é feita no decorrer de uma mês, vamos dizer, e o p real da população muda infinitas vezes no decorrer de um mês. Ele não mudaria se vc tirasse uma amostra instantênea e entrevistasse todo mundo instantaneamente tambem. Então acho que faz sentido pensar que o p populacional tá lá variando, com os valores que ele assume a cada segundo tendo uma distribuição X. Enfim, meio viajante, mas foi o jeito que eu achei de aceitar o argumento Bayesiano.
Os cálculos do Agresti são muito interessantes, apesar disso, claro, a crítica é mais uma brincadeira, embora do ponto de vista matemático acredito que seja válida, mas de um rigor desnecessário. Mas isso me levou a pensar que poderíamos calcular a cobertura de outra forma, através de simulações. Podemos construir uma população W de tamanho N com com parâmetro P e tirar um sem número de amostras de tamanho n dela, e testar a cobertura de cada tipo de intervalo. E podemos fazer isso para muitos Ps na população, mais ainda, poderiamos brincar com populações realmente pequenas e realmente grandes e tal. Enfim, fica aí a sugestão, se o PH quiser a gente faz isso e escreve um artigo...rs.
Outra coisa que eu gostaria de comentar sobre o artigo é a correção proposta para o intervalo de Wald, também já sugerida a muito tempo, na década de 2o. Usando a correção, segundo as conclusões do Agresti o intervalo do Wald que tem cobertura ruim passa a fica parecido com o intervalo do score, melhor que o exato. A correção é simples, consiste em usar na expressão (1) do intervalo de Wald n = n+4 e X = X+2 ( veja que o valor estimado de p muda um pouco). O Agresti refere-se a esta correção como adição de dois sucessos e dois fracassos.
Finalmente, o artigo é uma grande fonte de referência sobre esse assunto, para quem quiser estudar intervalos de confiança para binomiais, e seus muitos tipos existentes. Muitas referências interessantes são estudadas. Eu fiquei um pouco decepcionado que essa questão da cobertura seja conhecida a tanto tempo e eu ainda não sabia disso, ach oque isso devia ter sido falando no curso de estatística, afinal intervalos de confianças para proporções são das coisas que mais usamos no dia a dia.
Assinar:
Postar comentários (Atom)
Volta ao Bairro Moss Park
Depois de uma semana lenta, eu escolhi um bairro do centro para contornar hoje, Sábado. O bairro Moss-Park é bastante falado por ser um bair...
-
Estes dias apareceu esta notícia interessante onde um policial daqueles que andam de bicicleta foi vítima de um motorista que abriu a porta...
-
Depois de um tempão parado hoje eu rodei 7 km. Tudo começou com a onda de calor que tivemos, em um mês que eu já tava devagar. Mas o calor e...
-
E apareceu esta notícia na internet. Basicamente o título diz que os números finais do seu RG tem alguma associação com a sua decisão de co...
Nenhum comentário:
Postar um comentário