News Release 

Quando a aprendizagem contínua leva a uma estratégia de tomada de decisão ideal

Champalimaud Centre for the Unknown

Ao contrário do que acontece com as máquinas, o comportamento animal e humano inclui quase sempre um elemento de imprevisibilidade. Inúmeras experiências mostram que as nossas respostas face a um mesmo desafio são às vezes mais rápidas, outras mais lentas, às vezes corretas e outras erradas.

No campo da neurociência, essa variabilidade é frequentemente atribuída ao chamado "ruído" - um "balbucio neural", que está sempre presente, e que influencia a maneira como os cérebros processam e respondem à informação que recebem.

Um novo estudo, fruto de uma colaboração entre cientistas do Centro Champalimaud em Portugal, da Harvard Medical School nos EUA e da Universidade de Genebra na Suíça, vem mostrar que essa variabilidade é muitas vezes incorretamente interpretada como ruído. Esta ideia poderá ser o reflexo de uma estratégia comportamental que havia sido até agora negligenciada com base em pressuposições erróneas sobre como o indivíduo se deveria comportar. Estes resultados, publicados hoje (2 de Junho) na revista científica Nature Communications, questionam o que realmente significa "comportamento ideal" no desempenho de certas tarefas.

Uma estratégia inesperada

"Tudo começou com uma experiência simples", recorda Maria Inês Vicente, co-autora do estudo, que recolheu os dados experimentais durante o seu doutoramento no Centro Champalimaud, atualmente a trabalhar na Universidade de Leiden. "Partimos de dois odores diferentes e criámos várias misturas dos dois. Durante a experiência, as diferentes misturas eram apresentadas aos ratos, uma de cada vez. Em cada tentativa, os ratos tinham que responder qual dos dois odores era o dominante. Se achava que a resposta era o odor A, o rato tinha que se aproximar do bebedouro de água do lado direito, e se escolhesse o odor B, teria que ir para o lado esquerdo. Algumas misturas tinham muito mais odor de um tipo, do que do outro, facilitando a identificação daquele que era o odor mais saliente. Mas noutras misturas, a diferença era mais subtil. Se o rato respondesse corretamente, recebia uma recompensa (água)".

Os investigadores registaram a rapidez com que os ratos respondiam e se a resposta estava certa ou errada. Para sua surpresa, quando analisaram os dados, perceberam que o comportamento dos ratos não seguia uma regra comum de tomada de decisão. "Neste tipo de tarefa, tendemos a ver uma clara dependência entre a dificuldade e o tempo da tomada decisão: nos casos mais difíceis e súbtis, os animais (e humanos) levam mais tempo para decidir do que nos casos mais fáceis", diz Mendonça. "Mas em vez disto, o que observámos foi que os nossos ratos demoravam, em média, o mesmo tempo quer para tomar decisões difíceis, quer para as fáceis".

"Não foi trivial encontrar a explicação para esta observação inesperada", acrescenta Jan Drugowitsch, outro dos co-autores deste estudo. "Finalmente, conseguimos perceber o que se estava a passar - e para isso construímos um modelo matemático que une diferentes campos de investigação da tomada de decisões. De certo modo, o que fizemos foi replicar o comportamento dos ratos no 'cérebro de uma máquina' com o objetivo de descobrir quais as variáveis ??subjacentes, responsáveis por este resultado surpreendente".

O modelo revelou uma estratégia inesperada. Em cada julgamento, o que o rato estava a fazer era a reajustar o seu comportamento de acordo com os resultados do julgamento anterior. Se o rato estivesse correto na tentativa anterior quando a "pergunta" era difícil, a sua escolha seria desviada para o mesmo lado na próxima tentativa. E vice-versa, uma resposta incorreta levaria à mudança de julgamento na tentativa seguinte.

Por que é que os animais adotaram essa estratégia específica? "Esta estratégia é consistente com uma visão do mundo em que o ambiente está continuamente a mudar, o que leva os animais a atualizarem a sua abordagem de tomada de decisão, tentativa após tentativa. Visto de fora, o seu comportamento parece algo extremamente variável e por isso mesmo teria sido fácil interpretá-lo erroneamente como 'apenas' ruído", aponta Drugowitsch.

O comportamento ideal está nos olhos de quem o vê

Por que razão os ratos optaram por uma estratégia diferente da esperada? Os autores explicam que existem várias razões, a primeira é a natureza da tarefa. "Não existe apenas um tipo de tarefa de discriminação sensorial", diz Mendonça. "Na realidade, existem vários elementos da tarefa que podem desencadear diferentes estratégias de tomada de decisão. Se, por exemplo, tivéssemos pedido aos ratos para localizar um som, em vez de discriminar odores, a estratégia deles estaria alinhada com a nossa expectativa inicial. Isso ocorre porque para certas modalidades sensoriais existe uma clara separação "natural" entre esquerda e direita no cérebro, mas este não é o caso quando classificamos odores."

Outra das razões para o que os investigadores observaram é a confiança. "Assim como os humanos, os ratos parecem avaliar as suas próprias decisões e mudar o seu comportamento de acordo com essas decisões. Quando nos sentimos muito confiantes, acabamos por tomar a decisão correta, não havendo muito a aprender. Mas o que acontece quando estamos confiantes e acabamos por descobrir que na realidade estávamos errados? Neste caso, iremos acabar por mudar o nosso comportamento de forma drástica. Foi exatamente isto que vimos nos nossos ratos", explica Zachary Mainen, um dos líderes do grupo que desenvolveu este estudo, investigador principal no Centro Champalimaud.

Segundo os autores, outra explicação para a escolha da estratégia por parte dos ratos é o "circuito neuronal rígido" que envolve o processo de aprendizagem. "Ironicamente, se os ratos não estivessem constantemente a reajustar as suas respostas, com base no resultado do último julgamento, eles sair-se-iam muito melhor nas suas escolhas. O que estávamos inicialmente à espera era que construíssem uma categoria do tipo 'odor A - odor B' e que a implementassem", ressalta Alex Pouget, outro dos líderes do grupo e co-autor do estudo, investigador principal na Universidade de Genebra. "Ainda assim, a estratégia dos ratos faz todo o sentido."

Como os autores explicam, essa observação não significa que o rato é um animal mal adaptado, muito pelo contrário, eles afirmam que a comunidade científica deve reconsiderar o que define como "comportamento ideal". "Os ratos evoluíram ao longo de milhões de anos para explorar um ambiente em constante mudança. Portanto, quando avaliamos o comportamento desses animais, devemos recordar-nos que não se trata necessariamente apenas de desempenho propriamente dito. O comportamento ideal vai depender tanto do problema em si, como da natureza de quem o irá solucionar", argumenta Pouget.

"Acreditamos que o nosso trabalho é um bom ponto de partida para continuarmos a explorar como diferentes ramos do estudo da tomada de decisão podem interagir. Esperamos também que outros cientistas usem e refinem os nossos modelos utilizando-os em novas experiências. Seria fascinante e informativo ver quando, como e porquê este nosso modelo começa a falhar. Cometer um erro é uma oportunidade para aprender algo novo, que é o resultado e a mensagem do nosso estudo", conclui Mendonça.

###

Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.