domingo, 4 de março de 2007

Bons Rapazes Terminam em Primeiro – Parte 3

Continuação do texto Bons Rapazes Terminam em Primeiro – Parte 2(1).

Robustez Estratégica num Ambiente Sórdido

Então, identificámos anteriormente duas características ganhadoras: amabilidade e tolerância. Esta conclusão quase utópica – de que amabilidade e tolerância compensam – foi uma surpresa para muitos dos peritos, que tinham tentado ser muito astutos ao submeter estratégias subtilmente maldosas; enquanto por outro lado, mesmo os que tinham submetido estratégias amáveis, não tinham ousado nada tão tolerante como o Tit for Two Tats.

Axelrod anunciou um segundo torneio. Recebeu 62 entradas e adicionou outra vez a Casual, totalizando 63. Desta vez, o número exacto de movimentos por jogo não foi fixado em 200 mas deixado em aberto, por uma boa razão que abordarei mais tarde. Podemos continuar a expressar pontuações como uma porcentagem do “fiel da balança”, ou do resultado da estratégia ‘coopera sempre’, mesmo que esse fiel da balança necessite de cálculos mais complicados, e não seja fixado nos 600 pontos.

Os programadores no segundo torneio tiveram acesso aos resultados do primeiro, incluindo a análise de Axelrod de porque razão Tit for Tat e outras estratégias tolerantes e amáveis terminaram tão bem. Era esperado que os concorrentes, registassem essa informação de uma maneira ou doutra. De facto, os programadores dividiram-se em duas escolas de pensamento distintas. Alguns, concluíram que amabilidade e tolerância eram qualidades evidentemente ganhadoras, e submeteram assim, estratégias tolerantes e amáveis. John Maynard Smith foi tão longe ao ponto de submeter a super tolerante Tit for Two Tats. A outra escola de pensamento, raciocinou que muitos dos seu colegas, tendo lido a análise do Axelrod, iriam agora submeter estratégias tolerantes e amáveis. Eles submeteram dessa forma estratégias maldosas, tentando assim explorar essas amabilidades antecipadas!

Mas uma vez mais, maldade não compensa. Uma vez mais, Tit for Tat, submetida por Anatol Rapoport, foi a vencedora, e colectou uns massivos 96% da contagem do fiel da balança. E uma vez mais, as estratégias amáveis, em general, terminaram melhor que as maldosas. Todas, excepto uma, das 15 estratégias melhor classificadas eram amável, e na base da classificação, de todas as 15 estratégias, apenas uma não era maldosa. Mas apesar de Tit for Two Tats ter ganho o primeiro torneio se tivesse sido submetida, não ganhou o segundo. Isto porque o novo torneio incluiu estratégias maldosas mais subtis e capazes de vitimar cruelmente tais clemências repetidas.

Isto sustenta um ponto importante sobre estes torneios. O êxito de uma estratégia depende das outras submetidas. Esta é a única maneira de explicar a diferença entre o segundo torneio, em que Tit for Two Tats ficou classificado bem baixo na lista, e o primeiro, em que Tit for Two Tats teria ganho. Mas, como disse anteriormente, isto não é um livro sobre o talento dos programadores. Há alguma forma objectiva de nós podermos concluir qual é a estratégia verdadeiramente melhor, num sentido mais geral e menos arbitrário? Os leitores dos capítulos anteriores já estão preparados para encontrar resposta na teoria da Estratégia Evolucionariamente Estável(2).

Eu fui um desses por quem Axelrod circulou os seus resultados iniciais, com um convite para submeter uma estratégia para o segundo torneio. Eu não o fiz na altura, mas dei uma outra sugestão. Axelrod já tinha começado a pensar segundo os termos de EEE [Estratégia Evolucionariamente Estável, p. 69], mas senti que esta tendência era tão importante que lhe escrevi sugerindo que entrasse em contacto com W. D. Hamilton(3), que estava então, embora Axelrod não o soubesse, num departamento diferente na mesma universidade, a Universidade de Michigan. Ele de facto contactou imediatamente Hamilton, e o resultado da sua colaboração subsequente foi um brilhante artigo conjunto publicado no jornal Science em 1981, um artigo que ganhou o Prémio Newcomb Cleveland Prize of the American Association for the Advancement of Science(4). Além de discutir alguns exemplos biológicos encantadoramente excêntricos do dilema do prisioneiro iterado, Axelrod e Hamilton deram, o que eu considero como o devido reconhecimento à abordagem da EEE.

Contraste a aproximação de EEE com o sistema ‘round-robin’(5) que os dois torneios de Axelrod seguiram. Um round-robin é como uma liga de futebol. Cada estratégia foi confrontada contra cada uma das outras num número igual de vezes. A contagem final de uma estratégia foi a soma dos pontos ganhos contra todas as outras. Para ser bem sucedido num torneio de round-robin, uma estratégia tem de ser um bom competidor contra todas as outras que as pessoas possam ter submetido. Axelrod definiu que uma estratégia é ‘robusta’ quando é boa contra uma larga variedade de outras. Tit for Tat provou ser um estratégia robusta. Mas o conjunto de estratégias que as pessoas submeteram é arbitrário. Este era o ponto que nos preocupava acima. Aconteceu simplesmente que no torneio original de Axelrod, cerca de metade das estratégias eram amáveis. Tit for Tat ganhou neste clima, e Tit for Two Tats teria ganho neste clima se tivesse sido submetida. Mas suponha que quase todas as estratégias submetidas tivessem sido maldosas. Isto poderia muito facilmente ter ocorrido. Afinal de contas, 6 das 14 estratégias submetidas eram maldosas. Se 13 delas tivessem sido maldosas, Tit for Tat não teria ganho. O ‘ambiente’ teria sido mau para ele. Não só o dinheiro ganho, mas a ordem de êxito, depende das estratégias submetidas; depende, por outras palavras, de algo tão arbitrário quanto o capricho humano. Como poderemos nós, reduzir estas arbitrariedades? ‘pensando na EEE’.

A característica importante de uma estratégia evolutivamente estável, lembrar-se-á dos capítulos anteriores, está no facto de esta continuar a terminar bem, quando se torna numerosa numa população de estratégias. Dizer-se que Tit for Tat, é uma EEE, é o mesmo que dizer que Tit for Tat termina bem num ambiente dominado por Tit for Tats. Isto pode ser visto como um tipo especial de ‘robustez’. Como evolucionistas, somos tentados a vê-lo como o único tipo de robustez que importa. Por que importa tanto? Porque, no mundo do Darwinismo, vitórias não são pagas com dinheiro; elas são pagas como descendência. Para um Darwinista, uma estratégia bem sucedida é uma que se torna numerosa numa população de estratégias. Para uma estratégia permanecer bem sucedida, deve terminar bem especificamente quando é numerosa, isso é, num ambiente dominado por cópias de si própria.

Axelrod, aliás, lançou uma terceira ronda no seu torneio parecida à forma como a selecção natural poderia tê-lo feito através da EEE. Na realidade não lhe chamou terceiro Torneio, visto não ter solicitado novas entradas, mas, usou as mesmas 63 que as do Torneio 2. Acho conveniente tratá-lo como Torneio 3, porque penso diferir dos dois torneios ‘round-robin’ fundamentalmente mais, do que estes entre si.

Axelrod pegou nas 63 estratégias e inseriu-as outra vez no computador para criar ‘a geração 1’ de uma sucessão evolutiva. Na ‘geração 1’, portanto, o ‘ambiente’ consistiu numa representação igualitária de 63 estratégias. No fim da geração 1, as vitórias para cada estratégia serão pagas, não com “dinheiro” nem com “pontos”, mas com progénie, idêntica aos seus (assexuados) pais. Com o passar das gerações, algumas estratégias tornaram-se mais escassas e eventualmente extintas. Outras, tornaram-se mais numerosas. Como as proporções mudaram, mudou também, o “clima” no qual os movimentos futuros se desenrolaram.

Eventualmente, após aproximadamente 1.000 gerações, não havia mais nenhuma alteração nas proporções, mais nenhuma mudança no clima. A estabilidade teria sido alcançada. Antes disto, a prosperidade das várias estratégias oscilará, tal como na minha simulação de computador constituída por Vigaristas, Papalvos, e Grudgers. Algumas das estratégias começaram a extinguir-se logo desde o início, e a maioria foi extinta por volta da geração 200. Das estratégias maldosas, uma ou duas delas aumentaram a sua frequência, mas a prosperidade destas, como a do Vigarista na minha simulação, foi breve. A única estratégia maldosa a sobreviver para além da geração 200 foi a chamada de Harrington. A prosperidade de Harrington aumentou abruptamente nas primeiras 150 gerações. Depois declinou gradualmente, aproximando-se da extinção por volta da geração 1.000. Harrington prosperou bem temporariamente pela mesma razão que a do meu Vigarista original. Explorando a brandura dos Tit for Two Tats (demasiado clementes) enquanto estes se moviam em redor. Então, assim que tais branduras foram extintas, Harrington seguiu essa mesma extinção, por não ter agora nenhuma presa fácil à sua volta. O campo foi deixado livre para as estratégias ‘amáveis’ mas ‘retaliadoras’ como a Tit for Tat.

Tit for Tat, de facto, ficou no topo em cinco das seis rondas do Torneio 3, tal como nos Torneios 1 e 2. Cinco outras estratégias amáveis, mas retaliadoras, terminaram quase tão bem sucedidas (presença na população) como a Tit for Tat; de facto, uma delas ganhou a sexta ronda. Quando todas as estratégias maldosas foram extintas, não havia forma destas estratégias amáveis poderem ser distinguidas da Tit for Tat ou qualquer uma das outras, porque, sendo todas amáveis, simplesmente jogaram COOPERA umas contra as outras.

Uma consequência desta indistinguibilidade, é a de, apesar de Tit for Tat parecer uma EEE, estritamente falando não é uma EEE. Para ser uma EEE, lembre-se, uma estratégia não pode ser invadida quando é comum, por uma rara estratégia mutante. Agora, é verdade Tit for Tat não poder ser invadida por nenhuma estratégia maldosa, mas por outras estratégia amáveis a situação muda de figura. Como acabámos de ver, numa população de estratégias amáveis estas irão parecer e comportar-se de forma exactamente igual: irão jogar sempre COOPERA. Então, qualquer outra estratégia amável, como a totalmente santa “Coopera Sempre”, embora reconhecidamente não goze de uma vantagem selectiva positiva sobre a Tit for Tat, pode no entanto mover-se na população sem se fazer notar. Assim, tecnicamente Tit for Tat não é uma EEE.

Poderá pensar que, desde que o mundo permaneça igualmente amável, poderíamos considerar também Tit for Tat como uma EEE. Mas repare no que acontece de seguida. Ao contrário de Tit for Tat, a Coopera Sempre não é estável contra a invasão de estratégias maldosas como a Deserta Sempre. A Deserta Sempre prospera bem contra a Coopera Sempre, visto receber sempre a alta recompensa da ‘Tentação’. Estratégias maldosas como a Deserta Sempre, controlarão o número de estratégias demasiado amáveis como a Coopera Sempre.

Mas embora Tit for Tat não seja estritamente uma EEE, será provavelmente justo tratar algum tipo de mistura de comportamento amável e retaliativo parecido ao da ‘Tit for Tat’ como uma estratégia praticamente equivalente a uma EEE. Tal mistura talvez inclua uma pequena quantidade de precipitação. Robert Boyd e Jeffrey Lorberbaum, numa das continuações(6) mais interessantes do trabalho de Axelrod, procuraram uma mistura de Tit for Two Tats e uma estratégia chamada “Tit for Tat Desconfiado”. Tit for Tat Desconfiado é tecnicamente maldoso, mas não muito. Comporta-se tal como um Tit for Tat após o primeiro movimento, mas – e isto é que faz dele tecnicamente maldoso – deserta no primeiro movimento do jogo. Num clima inteiramente dominado por Tit for Tat, Tit for Tat Desconfiado não prospera, pois a sua deserção inicial desencadeia um ciclo de retaliação mútua. Mas quando encontra um Tit for Two Tats, por outro lado, a clemência de Tit for Two Tats quebra qualquer ciclo de recriminação mútua. Ambos os jogadores terminam o jogo com pelo menos a contagem do ‘fiel da balança’ da cooperação mútua, e com o Tit for Tat Desconfiado a colectar um bónus pela sua deserção inicial. Boyd e Lorberbaum mostraram que uma população de Tit for Tat pode ser invadida, evolutivamente falando, por um mistura de Tit for Two Tats e Tit for Tat Desconfiado, os dois a prosperar na companhia um do outro. Esta combinação quase certamente não é a única que a pode invadir desta maneira. Há provavelmente muitas misturas de estratégias ligeiramente maldosas com estratégias amáveis e muito clementes que juntas, são capazes de invadir. Alguns, poderão talvez ver isto como um espelho para os aspectos familiares da vida humana.

Axelrod reconheceu Tit for Tat com uma não EEE, e consequentemente cunhou o termo ‘Estratégia Colectivamente Estável’ para o descrever. Como no caso duma verdadeira EEE, é possível para mais do que uma estratégia ser simultaneamente uma Estratégia Colectivamente Estável. E uma vez mais, é uma questão de sorte saber qual virá a dominar uma determinada população. Deserta Sempre é também estável, assim como Tit for Tat. Numa população que venha a ser dominada por Deserta Sempre, nenhuma outra estratégia fará melhor. Podemos tratar o sistema como biestável, com o Deserta Sempre como um dos pontos estáveis, e Tit for Tat (ou alguma mistura de estratégias fundamentalmente amáveis e retaliadoras) como outro. Qualquer que seja o ponto estável que venha a dominar a população, tenderá a permanecer dominante.

Mas o que significa “dominar” em termos quantitativos? Quantos Tit for Tat terão de haver por forma a que Tit for Tat prospere em detrimento do Deserta Sempre? Isso depende dos pagamentos que o banqueiro definir para este jogo particular. Duma forma geral, tudo o que podemos dizer é que há uma frequência crítica, um limiar. Dum lado desse limiar, a frequência crítica de Tit for Tat é excedida, e a selecção favorecerá cada vez mais os Tit for Tat. No outro lado do limiar, a frequência crítica de Deserta Sempre é excedida, e a selecção favorecerá cada vez mais os Deserta Sempre. Encontramos o equivalente deste limiar, lembrar-se-á, na história do Grudgers e dos Vigaristas no Capítulo 10(7).

Importa obviamente, de que lado deste limiar uma população se inicia. E necessitamos de saber como poderá, uma população cruzar este limiar de um lado para o outro. Suponhamos que começamos com uma população que se encontra à partida do lado do Deserta Sempre. Os poucos indivíduos Tit for Tat não se irão encontrar o número de vezes suficiente para haver um benefício mútuo. Assim, a selecção natural empurrará a população ainda mais na direcção extrema do Deserta Sempre. Se ao menos a população pudesse administrar, por movimentos casuais, por forma a ultrapassar o limiar, a encosta para o lado do Tit for Tat, e dessa forma todos ganhariam muito mais às custas do banqueiro (ou natureza). Mas, claramente, populações não têm propósito, nem intenção ou vontade de grupo. Estas não se podem esforçar em pular o limiar. Estas cruzá-lo-ão apenas se as forças sem orientação da natureza, as dirigir nesse sentido.

Como poderá acontecer? Uma forma de expressar a resposta é que talvez aconteça por ‘acaso’. Mas ‘acaso’ é somente uma palavra que expressa ignorância. Significa ‘determinado por algum meio até agora desconhecido, ou por especificar’. Podemos fazer um pouco melhor que o simples ‘acaso’. Podemos tentar pensar em termos práticos pelos quais uma minoria de indivíduos Tit for Tat possa atingir uma massa crítica. Isto remete-nos para uma busca de possíveis maneiras, em que Tit for Tat se possam aglomerar num número suficiente de indivíduos por forma a beneficiarem às custas do banqueiro.

Esta linha de pensamento parece prometedora, mas é no entanto bastante vaga. Como poderão exactamente, indivíduos semelhantes aglomerarem-se num determinado local? Na natureza, o meio óbvio é o da ligação genética – parentesco. Os animais na maioria das espécies encontram-se normalmente a viver junto das suas irmãs, irmãos e primos, em vez de juntos a membros aleatórios da população. Isto não será necessariamente por escolha. É consequência imediata da “viscosidade” na população. A viscosidade significa qualquer tendência para os indivíduos continuarem a viver perto do local em que nasceram. Por exemplo, pela maioria da história, e na maioria das partes do mundo (embora não, como acontece, no nosso mundo moderno), indivíduos humanos raramente se desviaram mais do que algumas milhas de seu local de nascimento. Como resultado, agrupamentos locais de parentes tendem a acumular-se. Lembro-me de ter visitado uma ilha remota da costa ocidental da Irlanda, e de ter ficado espantado pelo facto de quase todos na ilha terem as orelhas enormes. Isto não podia ter estado relacionado com o clima (ventos fortes no mar alto). Assim era, porque a maioria dos habitantes da ilha eram parentes próximos.

Parentes genéticos tenderão a ser semelhantes não só nas suas características faciais, como igualmente em todas as outras. Por exemplo, eles tenderão a assemelhar-se no que diz respeito à tendência genética para jogar – ou não jogar – Tit for Tat. Portanto, mesmo que Tit for Tat seja raro na população como um todo, poderá mesmo assim ser localmente comum. Localmente, indivíduos Tit for Tat podem encontrar-se com a frequência suficiente para prosperarem através da cooperação mútua, mesmo que, o cálculo que leva apenas em conta a frequência global na população total, possa sugerir que estes estão sob o ‘limiar’ de frequência crítico.

Se isto assim é, indivíduos Tit for Tat, cooperando uns com os outros em pequenos enclaves de forma cómoda, poderão prosperar tanto, ao ponto de passarem de pequenos agrupamentos locais para agrupamentos locais bem maiores. Estes aglomerados locais podem crescer tanto, que se estenderão a outras áreas, áreas que até então tenham sido dominadas, numericamente, por indivíduos jogando Deserta Sempre. Pensando nestes enclaves locais, a minha ilha irlandesa é uma enganadora analogia, porque fisicamente se encontra isolada. Pense, em vez disso, numa grande população em que não há muito movimento, de modo que os indivíduos tendem a assemelhar-se mais com os seus vizinhos imediatos do que com os mais distantes, mesmo que hajam misturas contínuas sobre toda a área.

(a continuar)


(1) – Traduzido de http://www-static.cc.gatech.edu/%7Eidris/Essays/Dawkins_The_Selfish_Gene.htm
(2) – Ver Pombos e Falcões - http://seremosricos.blogspot.com/2007/01/pombos-e-falces.html
(3) – William Donald Hamilton, http://en.wikipedia.org/wiki/W._D._Hamilton
(4) –
American Association for the Advancement of Science, http://www.aaas.org/
(5) – Round-robin tournament, http://en.wikipedia.org/wiki/Round-robin_tournament
(6)
– No strategy is evolutionarily stable in the repeated prisoner's dilemma, http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=8022193&dopt=Citation
(7) – You scratch my back, I’ll ride yours – The Selfish Gene, Richard Dawkins

Sem comentários: