sábado, 13 de março de 2010

Até onde vão as suposições?

Quando se fala em estatística imagino que suposições seja um assunto que dá para escrever um livro. Eu costumo dizer que qualquer análise ou resultado é justificável com suficientes suposições. E aí está um perigo porque pelo dinheiro estamos dispostos até a supor que nascemos de um ovo.

Um caso real. O cliente quer some "Advanced Analyses". Se o cliente está disposto a pagar, temos um monte de análises avançadas para ele, sabe como é.... A idéia é fazer análise causal usando um questionário já pronto e o estatístico é chamado para ver o que podemos fazer. A análise causal sempre cai na regressão, e aí, com 50 possiveis preditores (X), todos medindo a mesma coisa, fica complicado. Mais complicado ainda é que os demográficos (Z) causam mais a variavel dependente (Y) do que os denominados preditores. Eu já tentei ir dando meu exemplo, do pouco que conheço de análise causal - Sabemos que Idade (Z) é relacionada com a Y e que a Y não causa a Idade (Z) então é claro que Z causa Y. Então se quisermos ver se a variável X causa Y temos que controlar Z, sabido confundidor - e nesse ponto a galera parecia que tinha visto um fantasma, afinal taca-se uma correlação lá e ponto final, nunca se precisa de um indivíduo metido a professor de Haward... Quantas e quais suposições você precisa para que uma correlação simples te dê um efeito causal? Eu acho ok fazer uma análise simples se vc está feliz em ter essas suposições e defendê-las.

As pessoas são de opinião de que a estatística prática, em uma empresa que visa lucro, não é compatível com a estatística dos livros, temos que ser flexíveis e fazer o que dá para fazer, temos que ter certos comprometimentos com a teoria para possibilitar a prática. Eu acho que sem a estatística dos livros, sem a teoria não há estatística, assim como não há estatistica quando um indivíduo que sabe apenas lidar com SPSS vai lá e roda uma Regressão. É difícil para as pessoas entenderem que nosso papel não é rodar coisas nos softwares, que isso qualquer um faz, que a teoria estatística é sim importante, na prática de uma empresa capitalista ou na sala de aula de uma universidade. Vc pode rodar uma correlação somente se você sabe qual seria a técnica mais apropriada e como a correlação é diferente dela. Sem teoria você não sabe nada disso, está engannando a si próprio e possivelmente ao usuário de sua análise, e é nosso papel a disseminação dessa idéia, precisamos que as pessoas entendam que não estamos lá para apertar botões num computador, precisamos que elas entendam que uma correlação, ou um teste estatístico não são ferramentas simples que você usa a qualquer hora e em qualquer lugar, como um martelo. É uma luta difícil, mas é nossa e perdemos muitas batalhas, mas vencemos outras que são passos em direção a um melhro reconhecimento e valorização da nossa profissão.

No exemplo que eu dei acima o pessoal não ficou muito convencido. Mas as análises virão e teremos outra briga, e a vitória vem quando mostramos com resultado que o que estamos falando é sim aplicável no nosso dia a dia e não é tão complicado. Mas não é fácil pois muitas questões políticas e de relacionamento existem, e existem até situações onde os resultados precisam ser bons (não quero nem comentar aqui a definição de bons resultados), e existem problemas de intermediação, afinal vc nem sempre tem contato com o usuário final dos resultados... Mas precisamos começar a mover os tijolos se quisermos construir algo...

Nenhum comentário:

Progression Run

 Semana passada teve um Progression Run e hoje teve outro. 5 minutos de aquecimento, 20 de corrida leve acima de 5:20 por km, 10 de corrida ...