segunda-feira, 9 de novembro de 2009

Seria um caso de probabilidade condicional?

Voltando a outro caso no livro Blink.

Havia um hospital onde os recursos eram escassos em Chicago. Um dos maiores problemas que eles tinham era a enorme quantidade depacientes com dor no peito que acabava não sendo nada de grave, mas ainda assim ocupavam leitos no hospital pela dificuldade de se descartar o ataque cardíaco como a causa da dor. Foi criada-se uma área de observação onde pacientes com dor no peito deveriam ir, caso as suspeitas de ataque cardíacos não eram fortes o suficiente para mandar o paciente para a internação nem fraca o suficiente para mandar o paciente para casa. Ainda assim era difícil decidir para onde mandar o paciente em muitos casos.

Um dos médicos apareceu com um modelo matemático ( na verdade estatístico - provavelmente de Análise Discriminante!), que segundo ele usava apenas 3 variáveis e dizia com bastante precisão para onde o paciente deveria ir. Os outros médicos ficaram revoltados, afinal nenhum modelo idiota vai usar apenas 3 variáveis e entender o paciente melhor que eles que estudaram a vida inteira! O fato é que para piorar as 3 variáveis eram fáceis de serem medidas, o que economizava muito recursos, comparando com o procedimento usual de medir um monte de coisa. Foi então decidido fazer-se uma comparação, e por dois anos comparou-se o modelo e a previsão dos médicos para os pacientes que vinham ao hospital com dor no peito. O resultado foi muito favorável para o modelo, que foi implantando.

O livro então diz que em muitas situações menos informações é melhor do que mais informações. Eu digo que informação de qualidade é melhor do que informação ruim, de que informação usada corretamente é melhor do que usada incorretamente (grande coisa - mas é somente isso!), e ainda de que parece que precisamos tomar cuidado com os médicos e dar mais ouvidos aos estatísticos!

Mas o fato de que o modelo é melhor do que os médicos nos faz perguntar porque nesse caso os médicos estão usando tanta informação inútil. O livro dá a dica (apesar de sempre tirar as conclusões erradas e principalmente irrelevantes, impressionante). Os médicos dão peso muito grande a informações como idade, por exemplo, porque a probabilidade de ataque cardíaco aumenta muito com a idade. Com isso na cabeça dos médicos, uma pessoa mais de idade com uma dorzinha já é colocada no cuidado intensivo enquanto que um jovem se contorcendo de dor é mandado de volta para casa (e morre de ataque cardíaco) - esse parágrafo não está no livro de forma literal, mas implicitamente, pois o livro fala das variáveis usadas no modelo estatístico e as não usadas. No entanto o modelo diz que idade é irrelevante (o modelo usa 3 variáveis, entre elas não está a idade - e outras variáveis muito relacionada a probabilidade de ataque cardíaco).

A solução é simples - pessoas mais idosas tem maior probabilidade de ter ataque cardíaco na POPULAÇÃO. Isso NÃO é verdade quando selecionamos o grupo dos que chegam ao hospital com dor no peito. Nesse caso não estamos mais falando da população, nesse caso, considerando essa população especifica dos que chagam no hospital com dor no peito, idade pode não ser mais relacionada a ataque cardíaco entre essas pessoas, isso é normal. Estamos falando de um grupo diferente de pessoas agora, então tome cuidado com tudo que você aprendeu sobre ataque cardíaco na população geral.

Vamos a um exemplo (fictício) com números. Lembre que estamos falando apenas de pessoas que chegam no hospital com dor no peito. Pense que pessoas de idade, eles tem dor em todo lugar facilmente, inclusive no peito, e pode ser que em pessoas de idade apenas 10% das dores no peito são sintomas de ataque cardíaco. Os outros 90% com dor no peito são outras coisas que podem ou não ser importante, mas vamos ficar nos ataques cardíacos. Já pessoas jovens, eles raramente tem dores, muito menos no peito. Quando eles tem dor no peito é tiro e queda - ataque cardíaco. Digamos que 90% dos jovens com dor no peito seja ataque cardíaco. Isso não invalida que na população idosos tenham mais ataque cardíaco do que jovens. 10% dos idosos com dor no peito pode significar 100 idosos por mês com ataque cardíaco e 90% dos jovens pode significar 10 jovens por mês com ataque cardíaco (simplesmente porque tem muito mais idoso chegando no hospital com dor no peito), e isso faz com que na população geral tenhamos mais velhos com ataque cardíaco, que é o que os médicos aprendem na escola.

Agora, se você está vendo um jovem e um idoso com dor no peito, qual vai atender primeiro? Obviamente o jovem, pois ele tem 90% de probabilidade de ser ataque cardíaco, o idoso tem apenas 10%. Se essa é situação, você vai ver pouco jovem com dor no peito na emergencia de um hospital, mas quando ver a última coisa que deve fazer é mandá-lo para casa!

Seria então um caso de probabilidade condicional, onde a probabilidade de ter ataque cardíaco aumenta com a idade na população geral, mas dado os que tem dor no peito (ou condicionando nos que tem dor no peito), a idade tem efeito inverso (considerando o meu exemplo), os jovens tem mais probabilidade de ataque cardíaco.

O meu exemplo é extremo e certamente não real (ou não completamente real) mas o fato é que segundo o contado no livro idade não é importante para diagnosticar ataque cardíaco entre os que chegam ao hospital com dor no peito. Ou seja, o efeito que exagerei no exemplo deve acontecer de forma não tão exagerada na vida real (supondo que o relato do livro é fiel a realidade).

O outro ponto a se pensar, que não vou me estender, prometo, é o fato de que se os médicos talvez não estejam recebendo bom treinamento na faculdade. Afinal eles estão considerando informações irrelevantes em seus diagnósticos. Eles deveriam aprender que na emergência de um hospital, dado um paciente com dor no peito, eles devem considerar variáveis a, b e c. Dado que eles estão em seus consultórios, fazendo trabalho preventivo talvez, devem, aí sim, considerar outras como idade.

Esses são os pontos que eu tiro como interessante de um caso deles. O autor do livro, no entanto, viaja na maionese com sua teoria de que menos informação é melhor que muita informação. Essa parte eu nem leio pois não diz nada (e cá entre nós, não tem nem mesmo relação com o ponto do próprio autor, a intuição, o pensar sem pensar, não tem nada de intuição nessa estória..).

Nenhum comentário:

Treino Leve

 Primeiro treino leve da nova planilha. Os treinos leves, que eram por tempo e tinham uma parte opcional, agora são por distância. Tanto ant...