domingo, 2 de dezembro de 2007

Correlação e causa e outras coisas

Hoje, no blog Statistical Modeling, saiu um resultado de pesquisa interessante. Nos US fizeram uma pesquisa onde perguntaram aos respondentes sobre o que achavam de seu próprio estado de saude mental. O resultado deu que os republicanos tiveram o maior percentual de "Excelente", seguido pelos independentes e democratas. A primeiríssima idéia é que isso é estranho, visto que parece não ter sentido relacionar percepção de saude mental a direcionamento político. Mas pode ser que faça, pode ser que por algum motivo perfeitamente conpreensível os republicanos tenham essa percepção. Mas o sujeito do blog disse que esperaria o contrário, que o maior percentual de excelente fosse entre os democratas. Bom, independente disso, as pessoas mais leigas tendem a interpretar a correlação como causa, ou seja, olham o resultado e dizem que ter uma melhor saude mental faz com que a pessoa seja republicano (ou será que ser republicano faz com que tenhamos uma melhor saude mental?). É só percepção, não é realmente melhor saúde, mas... interpretação de pesquisa é assim mesmo. O que aconteceu é que no blog os participantes começaram a procurar o motivo da relação, como que pensando que ela ou está incorreta (problema de vies amostral talves) ou que simplesmente existe alguma terceira variável que explique isso, por exemplo, renda. Talvez os republicanos tenham renda maior e quem tem renda maior tem a percepção melhor, então a renda explicaria tudo. E o meu ponto é esse, uma das coisas que eu aprendi em pesquisa é que as pessoas sempre interpretam as correlações como causas, e as vezes é fácil ver que a causa na verdade é outra ou que simplesmente não faz sentido dizer que é causa. Isso para mim diz que o exercícicio da estatistica quando no ambiente prático jamais será baseado somente no que a matemática nos mostra. E cada vez mais tenho visto que as vezes o simples conhecimento que temos do ambiente estudado vale muito mais que querer aplicar técnicas estatiticas e suposições corretas, porque estas muitas vezes são aplicadas na formulação errada do problema.

Nenhum comentário:

Treino Leve

 Primeiro treino leve da nova planilha. Os treinos leves, que eram por tempo e tinham uma parte opcional, agora são por distância. Tanto ant...