RPG, Teoria dos Jogos e o Dilema do Prisioneiro

Tudo que eu precisava saber sobre teoria dos jogos, eu aprendi com RPG.

Pois bem, depois do meu – ouso dizer revolucionário! – ensaio sobre Dr. Spock e o utilitarismo de fundo emotivista nos meio-vulcanos, agora gostaria de finalmente desenvolver este post que tenho anunciado faz tempo – qual seja: Teoria dos Jogos aplicada ou explicada pelo RPG.

Mais uma vez, eu preciso avisar qualquer N00b que tenha desgraçadamente vindo parar neste blog que RPG aqui não é entendido como aquele método de massagem terapêutica exercício para postura (valeu, Marcelo!) ou como uma arma de assalto típica da primeira guerra do iraque. RPG, os chamados Role Play Games, são o passatempo preferido de 5 entre cada 7 dos indivíduos que tu costumava apontar e dizer “um dia desses este maluco vai sacar uma porra de uma faca e matar uns quinze”.

Sigo o baile. Porque RPG?

Por que teoria dos jogos?

Ora, pergunte primeiro pela essência da pergunta do porquê se esconde no abismo da pergunta pela essência, e diante deste abismo te questione pela poiesis desta ilucidez lúcida – mas quase silenciosa no seu fúnebre êxtase – e então encontre no movimento de expansão e contração de uma dialética delirante pela mentira que é o conceito do pensamento fictício que se esconde no Ser do Outro que vem à palavra – quase como uma nascente de prismas belos e opacos numa servidão senil.

Sim?

Nada?

Ótimo, podemos nos mover para o que interessa, que é a matematização do quotidiano.

Fantástico.

Como eu ia dizendo, existe uma série de relações possíveis entre teoria de jogos e RPG, a primeira delas é a noção de jogo-pelo-jogo. Ora, porque alguém entra num jogo? Sei lá. Quem é que ganha um jogo? Que tipo de jogo tem vencedores? O RPG nos coloca numa situação bacana, porque é uma situação onde o jogo é mais importante que os resultados do jogo, e onde jogadores não conseguem jogar para ganhar. Mais ou menos como este absurdo completo que a gente convencionou chamar de “este amontoado de coisa que algum idiota resolveu sacanear e chamar de vida”.

Segundo, RPG é um jogo finito, temos um sistema de regras auto-referente, com coerência interna mais ou menos bem desenhada, e com uma possibilidade de informação total. Como assim? Eu posso saber das possibilidades dos meus adversários e companheiros em um jogo de RPG, mais ou menos como sei destas possibilidades no xadrez. É verdade, temos um número de possibilidades que desafia a memória dos pouco treinados. Mas sabemos, ou podemos saber, todas as possibilidades de um sistema de RPG. Pelo menos se o Ferrari não resolver inventar coisa para acabar com tua felicidade ser criativo.

Neste sentido, primeiro gostaria de explicitar o jogo de RPG como um jogo de RISCO, ou seja, um jogo onde tuas ações implicam em estratégias de jogo pensadas em logo ou curto prazo, para resultados mais ou menos suportáveis do ponto de vista racional.

Por exemplo:

É possível desenhar uma estratégia dominante para uma determinada situação em um jogo de RPG, onde, por exemplo, em um jogo de Exalted um indivíduo Solar agraciado com o signo dos Nights, se encontra numa situação onde está cercado de inimigos. Nesta situação, o Night em questão pode

a) Arriscar um rolamento com 15% de chance de sucesso, e ser totalmente bem-sucedido.

b) Arriscar um rolamento com 85% de chance de sucesso, e escapar com poucos problemas

c) Arriscar um rolamento com 100% de sucesso e tomar no cu, mas sair, vá-lá, vivo.

Podemos então valorar o rolamento a (100), o rolamento b (51) e o rolamento c (1) de acordo com o nivel de satisfação do jogador. No entanto, um jogador racional precisa aqui matematizar seu risco de forma razoável. Em (a), o indivíduo tem 85% de chance de ter uma falha. Em (b), as chances de falha são mínimas, mas o indivíduo não tem a sua satisfação total. Em ( c) o indivíduo simplesmente se conforma com o mínimo resultado possível.

O indivíduo que opta por a, está optando por uma estratégia Max-Max. Ou seja, uma estratégia de Maximização do Máximo sucesso possível (impossível nas outras). Em (b), o indivíduo opta por uma situação MaxMini, onde o mínimo máximo resultado possível é buscado. Em ( c), o indivíduo opta por uma situação Minimax, onde o máximo mínimo pior resultado possível garantido.

Cada uma destas estratégias é defensável, mas seria alguma destas estratégias dominantes?

Mas Fabrício, que diabos é uma estratégia dominante?”

Nas palavras do professor Clinton, uma estratégia dominante é a escolha de um jogador cujo resultado é sempre bom, pelo menos em um sentido que a situação dele é melhor que antes da jogada, ou diante das outras possibilidades.

Voltando aos Valores esperados pelo jogador temos

a) EV = 100

b) EV = 51

c) EV = 1

Logicamente,

a-b < b – c

-2b < -a-c

b<a/2+c/2

Ou seja, a escolha lógica – dominante – é B, já que ela sempre oferece uma possibilidade maior de satisfação mínima do valor esperado. No entanto, este cálculo presume a estabilidade do jogo, ou seja, que existe uma situação fixa no jogo. Onde os resultados são totalmente previsíveis.

Ok, no RPG os resultados são previsíveis, mas não totalmente previsíveis. Basicamente por causa da interação com outros indivíduos e da chamada sorte.

Tá, então que diabos de modelo dá conta de RPG?

Dar conta” é um termo forte, mas eu gostaria de brincar um pouco aqui com os chamados jogos sem equilíbrio, que me parece ser o caso do RPG. Porque ? Porque ele é o único modelo capaz de dar conta de um rolamento de dados (sim, isso mesmo!) na escolha da estratégia.

Pensamos dois jogadores. A (x) e B(y)

B

1

2

A

1

5,-5

0,0

2

-4,4

3,-3

Cada jogador deve escolher uma estratégia, correto? Escolher uma estratégia aqui significa para A escolher uma LINHA, e para B, uma COLUNA. A esolha de A exclui uma escolha de B, e vice-versa. Então quem joga primeiro é fundamental. Por isso, crianças, é imprescindível comprar pontos de percepção e raciocínio em jogos onde a soma destes define quem tem o primeiro turno.

Neste sentido, o jogo pode ser de pura estratégia, quando a tua escolha independe das escolhas possíveis para B, ou de estratégia composta, quando a tua estratégia é definida pelas possibilidades de B. No jogo que enunciei ali em cima, B vai buscar excluir a estratégia dominante para A no contexto dado, ou seja, a escolha da linha “1”. Para fazê-lo, ele busca ele mesmo a primeira coluna, retirando assim o melhor resultado possível para A . No entanto, isso ainda não expressa o elemento de SORTE inerente ao jogo. Simplesmente o elemento de exclusão de estratégias dominantes. Também aqui, o jogo está CEGO, ou seja, as pessoas não sabem como as outras estão jogando, nem tem certeza do outcome de suas ações.

Na realidade, começo a me questionar se vou conseguir expressar isso de forma adequada através de teoria dos jogos. No entanto, ali em cima eu já estabeleci uma ordem aritmética de prioridades, onde

para A (x,1-x) e B (y,1-y). Agora, vamos adicionar o fator SORTE e ampliar a tabela. Estou mantendo dois jogadores aqui. Porque? Porque estou colocando a coisa não mais nos termos iniciais, de um Night versus um cenário, mas vários jogadores (B) versus um story-teller (A).

B

A

0,0

-1,1

3,-3

3,-3

2,-2

1,-1

4,-4

1,-1

0,0

Aqui, mais uma vez, o jogo é de exclusão. Para B, temos uma claramente uma estratégia dominante, que seria evitar a coluna da esquerda (EV=-7). A, neste sentido, pode cortar esta coluna das possibilidades de jogo de B, de forma que ficamos com:

-1,1

3,-3

2,-2

1,-1

1,-1

0,0

Considerando este cenário, B sabe que A deve pegar (se for racional) a linha mais baixa (EV=1). Temos agora:

-1,1

3,-3

2,-2

1,-1

Aqui, o EV (e podemos simplesmente falar em número esperado de sucessos e falhas, em termos de RPG), não se expressa de fora dominante nem para A ou para B, ou seja, precisamos neutralizar a relaçào entre a e b, para expressar a probabilidade de escolha de linhas por A e colunas por B quando diante deste último cenário.

Minha tabela guia aqui é a seguinte (para A):

Y

1-y

X

-1 a

3b

1-x

2c

1d

(x,1-x)

ax+c(1-x)

bx+d(1-x)

Para neutralizar A versus B para A, precisamos equalizar os resultados possíveis, de tal forma que

ax+c(1-x)=bx+d(1-x)

(a-c-b+d).x=d-c

x=d-c/(a-b)+(d-c)

Numericamente:

x = 1-2/1-3+(1-2)

x=1/5

Portanto, para neutralizar B existe 4/5 de possibilidades que A deve escolher a linha de baixo, e 1/5 que ele arrisque a linha de cima. Agora temos, portanto, as possibilidades de x,1-x, quais sejam, (1/5,4/5) e podemos re-calcular o valor do jogo para A de tal forma:

X

-1 a

3b

1-x

2c

1d

(x,1-x)

ax+c(1-x)

bx+d(1-x)

(1/5,4/5)

1.(2/5)

1.(2/5)

Fazendo a prova real, temos um valor do jogo que é

V= ad-bc/(a-b)+(d-c)

ou

V=-1-6/-4-1=7/5=1(2/5) [q.e.d.]

Agora, vamos largar A e estabelecer o jogo para B. Ou seja, vamos estabelecer o valor de y nesta patota toda.

Vou focar numericamente, apenas para estabelecer a formula, quem quiser verificar os valores, pode ir em frente. É aritmética básica.

B (y, 1-y)

a

b

ay+b(1-y)

c

d

cy+d(1-y)

Percebam que ay+b(1-y) é o caso, se e apenase se, A escolher a linha do topo, e cy+d(1-y) é o caso, se e apenas se, A escolher a lina de baixo.

Assim, temos em termos de VALOR ESPERADO e para a formulação do valor do jogo para B (se for racional),

ay+b(1-y)=cy+d(1-y)

se substituirmos pelos números acima explicitados, teremos, o valor de jogo de -1(1/5) para B, que é o valor diretamente oposto ao de A . Ou seja, B ganha quando perde! O melhor cenário possível para B é um de perda, mas isso porque A tinha as melhores possibilidades possíveis desde o início, tinha o melhor cenário e as melhores hipóteses de sucesso. Em termos simples: ele tinha as melhores rolagens de dados possíveis, melhores armas. Para B, o jogo é sempre um jogo de administração de crise. Um deus ex-machina.

Por isso, que os indivíduos que constituem B e suas decisões jogam muito mais consigo mesmos do que contra o indivíduo-narrador.

E daí a necessidade de agora movermos do cenário de dilema do prisioneiro. Ou seja, o cenário onde os jogadores estão em situação de tensão e que só podem se beneficiar de colaboração mútua direta – no entanto, existe uma tendência ao absurdo individualista, que acaba obrigando a emergência de um deus benevolente (também conhecidos como Bentley Preto, Fuscão em Fogo, Pássaro Gigante Voador, Capitão Armageddon e Sr. Juizo Final).

Mas agora devo explicar aos colegas no que consiste o dilema do prisioneiro. O dilema do prisioneiro consiste na tua vida. Na minha vida. Na vida de todo mundo. O dilema do prisioneiro foi a forma como Hobbes nos explicou porque invariavelmente tudo que a gente tenta nesta vida dá errado de forma miserável e inevitável. Porque, no fim das contas, não vai dar certo e todo mundo vai nadar em um mar de churrio fedorento, inexoravelmente fadados à destruição mútua.

O dilema do prisioneiro funciona assim:

B,W

S,S

T,T

W,B

Entenderam?

Não?

Então deixa eu tentar explicar para vocês:

Vocês são um grupo de quatro jogadores, em uma campanha de Exalted. Indivíduos disciplinados, já criaram um grupo na primeira sessão (o que pode ser explicado por um milagre, tendo em vista que geralmente demoramos pelo menos tres dias de jogo para conseguir estabelecer um grupo, mas estes somos nós). Pois bem, o narigudo narrador diz o seguinte:

Vocês entram na cidade de coloque nome estúpido aqui e entre outras coisas, existe uma movimentação grande de mercadores, vocês conseguem ver um grupo destacado, parece estar carregando uma nobre, talvez coloque nome de personagem obscuro aqui, que tem uma determinada barraca bastante destacada (continua narração)

Um jogador normal, aqui, espera o narrador continuar a explicação, e a quest ser enunciada.

Um jogador normal, claramente, não tem muito o que fazer no nosso grupo.

O que acontece aqui, um dos indivíduos, vamos chama-lo do nome hipotético Filburg O Lançador de Flechas que Esguiam Na Noite Como A Alma Gritante do Sol E Orgulha A Família. Este indivíduo encontra-se entediado pela narração e então diz:

Eu largo uma flechada de fogo no acampamento da nome de personagem obscuro

Tu faz o quê?”

Eu largo uma flechada de fogo. Vou usar meus charms de archery e de stealth em combo [mostra ficha de personagem] e vou tentar acertar a barraca dela mesma”

MAS PORQUÊ?”

Porque eu posso”

Fabrício, tu vai acabar com o jogo de todo mundo”

Qual é a natureza do meu personagem, mesmo?”

Daredevil”

Pois é, né?”

Porra.”

Vou rolar”

* barulhos de dados *

10-8-8-10-8-7-7-4-3-10-8-7-4-6

Hehe.”

Ok, gente. O acampamento tá pegando fogo. Inclusive, a porra da vila tá começando a pegar fogo”

Vejam, aqui é uma situação onde o personagem em tela busca o próprio benefício, o seu próprio melhor cenário possível, e ignora solemente as necessidades e prioridades de seus colegas. No caso, se o personagem tivesse agido de forma coletiva, certamente não teria terminado a sessão sendo espancado pelo mesmo grupo que tinha carinhosamente lhe adotado duas sessões anteriores (não sem antes ter sido quase devorado por uma aranha gigante na floresta ao redor da cidade-aquela).

Temos então a chamada situação Best-Worst. O camarada busca o seu melho cenário, mas aaba expondo todos os demais para os seus piores cenários possíveis.

Em um jogo de RPG, esta é a situação clássica. Se indivíduos agirem individualisticamente, as chnces deles levarem todo mundo para o buraco com eles é grande. Ou, deles se beneficiarem individualmente e massacrarem o grupo – o que na long run, dá na mesma que dar um tiro no pé.

Mas então, agir racionalmente em um jogo de RPG é agir de acordo com as necessidades coletivas?
Bem, não necessariamente.

Porque o insight pessoal pode decidir um jogo mais do que o insight coletivo, e já vi situações onde o camarada gritando A GENTE VAI MORRER SE A GENTE TENTAR ENTRAR NESTA PIRAMIDE ESTAVA CERTO, muito embora ele fosse uma voz isolada e chamada de MEDROSA pelos seus companheiros.

Ainda assim, fica claro que a única forma de escapar da situação de dilema do prisioneiro é através de estratégias cooperativas, e quanto maior – e mais diverso -for o grupo, mais dificil fica a situação. Permitem que eu mostre isso com uma DUPLA.

(a),(b) (2)

(-a,2b) (3)

A,B (1)

(2a),-b (4)

-a-b (5)

Pois bem, aqui temos quatro situações de jogo. Em 1 temos a posição original de ALGUÉM DEVE JOGAR. Em (5) o cenário é de desastre, em 4, de ganho absoluto de A, 3, ganho absoluto de B, e 2 ganho relativo mútuo. Vamos pensar no seguinte, na posição original, a possibilidade de colaboração é maior.

Inclusive, num jogo de RPG, este é o caso nas primeiras sessões, quando os camaradas querem formar um grupo para permitir que o jogo prossiga. Portanto, as pessoas colaboram. “Eu sou um Dawn, tu é um Night, ela é uma Eclipse, quem sabe a gente forma um grupinho e domina o universo?”

Esta é a parte fácil. Acontece que quando chegamos em (2), os indivíduos não podem mais voltar para a posição original, mas podem com certeza estabelecer um conflito, já que a vai querer se mover para (4) e b para (3). Ambos podem confiar na manutenção da situação de (2), mas com as possibilidades de mudança e ganho, eles podem assumir o comportamento adequado do seu companheiro de grupo?

Percebam, que no meu gráfico ali em cima temos apenas duas pessoas jogando. Imaginem um cenário com 5 indivíduos, onde dois são completamente dementes (vou dar uma pista, um deles costuma nomear todos seus personagens, desde 1995, de Filburg. O outro costuma jogar com uma versão maior e mais agressiva dele mesmo, tendo em vista que ele mesmo já poderia transformar os desavisados em poças amorfas de sangue). Qual é a possibilidade média de cooperação?

Na realidade, tu te surpreenderia. Porque a não-cooperação persistente leva ao não-jogo. No fim das contas, mesmo o narrador que, como demonstrei, está em situação clara de vantagem, costuma colaborar mandando todo tipo de milagre para viabilizar o jogo.

E no fim das contas, este micro-cosmo pode nos dar uma via de acesso interessante para como a gente toma decisões no nosso quotidiano, mas isso é tema para o distropia.

Comments
15 Responses to “RPG, Teoria dos Jogos e o Dilema do Prisioneiro”
  1. Marcelo disse:

    Cara,
    como tu consegue escrever tanto sobre nada?

  2. 6 anos de direito.
    Dois anos em um mestrado de filosofia.
    Quase dois anos em um doutorado em filosofia.

    A pergunta é retórica, né?

  3. Em tempo.
    Se o Ferrari e o Tiago não comentarem esta joça, eu vou voltar com o discurso aviadado de fechar o blog.

    Pront’falei.

  4. Ferrari disse:

    Vamos por partes
    – O RPG nos coloca numa situação bacana, porque é uma situação onde o jogo é mais importante que os resultados do jogo, e onde jogadores não conseguem jogar para ganhar.
    Te ouvir falar isso é MUITO divertido.
    – Pelo menos se o Ferrari não resolver inventar coisa para acabar com tua felicidade
    Fabrício, fala o que quiser, mas me fala UMA vez que eu tenha matado um personagem, especialmente por causa de pormenores de regras.
    – Quanto ao Exalted, tu continua interpretando as regras de maneira errada. Serei obrigado a invocar o japa estatístico pra te explocar
    – Bentley Preto – WIN
    – Pois bem, o narigudo narrador diz o seguinte: – Mais uma vez, midivirtu
    -O nome estúpido é NEXUS. Sério, não tem cidade com um nome mais fácil
    -Só pra constar, o Fabrício e o Tiago jogando só podem ser unidos pelas coisas que motivam eles a jogar, respectivamente PODER e MATAR. Depois reclamam das minhas mestragens.
    -No fim das contas, mesmo o narrador que, como demonstrei, está em situação clara de vantagem, costuma colaborar mandando todo tipo de milagre para viabilizar o jogo.
    Resumindo, só me fodo.

    Gostei bastante. Se bem que onde tem número eu não entendo lhufas. Uma vez me explicaram e eu entendi, achei fascinante, fui dormir e acordei burro.

  5. Ferrari disse:

    Bah, que comentário emo, Fabs.
    Estava escrevendo o comentário quando li ele

    “Mi ama!” Mi ama ou te deixo!”

  6. Habkost disse:

    ferrari, seu burro. não é matar o que me motiva. e sim fazer coisas quebrarem. ou apertar botões

  7. Denis disse:

    Cara, a pergunta do nobre Marcelo é completamente pertinente. Tu vai gastar dinheiro dos cofres publicos do tio sam pra escrever sobre nada? Bah, doutorado em filosofia é muito barbada mesmo!

  8. Não, não. O denis tá equivocado.
    Eu gasto do erário público brasileiro, principalmente. O americano paga algumas das minhas taxas, mas quase nada, mesmo. Ou seja, de certa forma, o Denis contribuiu com este post, assim como todos vcs. Ou como eu gosto de chama-los, meus pequenos minions financeiros!

    Em tempo: doutorado em filosofia é uma barbada imensa. Recomendo entusiasticamente. Inclusive, é especialmente fácil para minorias como Engenheiros ou Azeitonas. De tal forma, que sugiro submissão imediata da candidatura.

    Viu, e vocês achando que eu não poderia contribuir com algo prático!

  9. Ferrari disse:

    Bom, Tiago, o meu argumento só se reforça então

  10. Ferrari disse:

    http://www.bbc.co.uk/portuguese/ciencia/2009/08/090818_zumbisinfeccao_ba.shtml
    Os matemáticos gastam o dinheiro público assim. Interessante tbm.

  11. G.D. disse:

    Bem.

    Diagmos que eu nao consigo ver um link claro com o “Dilema…” no post pelo simples fato de que o post explora algo que eu sempre considerei meio bizarro no jogo/proposta:

    a ausencia de referenciais para se pensar na aplicacao eminentemente COTIDIANA da questao. Ex: enquanto o “Dilema…” for aplicado em competicoes entre scholars universidades a fim de desenvolver “estrategias” (acho que tu sabe do que falo: aquelas premissas de posicionamentos como a estrategia de “sempre delatar o parceiro” ou “sempre silenciar” em busca de “pontos” na “disputa”) tudo vai muito bem.

    Mas convenhamos que existe uma certa e decepcionante “alea” que toca tudo por agua abaixo em certas subsuncoes do quadro.

    Se pensarmos naqueles acordos de “delacao premiada” comuns nos EUA e no combate a Mafia Italiana (um exemplo bem LITERAL da aplicacao do “Dilema”), podemos ver que de nada adianta trabalhar com hipoteses de “ganho/perda” se descontarmos que, sei eu, algum filha da puta comprado pode PASSAR ao outro sujeito o posicionamento, por exemplo, silente de um primeiro submetido a oferta.

    Nao estou DESCARACTEZIZANDO, nem poderia, a importancia e a genialidade que se pode retirar das proposituras do “Dilema” que leva a “logica” a consequencias muito interessantes.

    Mas, justamente,quando sorte (aka RABO) e outros fatores como CRETINICE entram, sao mais do que “variaveis”.

    E, de fato: essas paradas de numero no meio do texto FODEM o cristao.

  12. GêDê, não é por nada. :)

    mas tu tá ligado que parte da argumentação do dilema do prisioneiro é JUSTAMENTE em cima da delação premiada. As parte se beneficiam se colaborarem, no sentido que elas saem sem QUALQUER dano se colaborarem. Elas OPTAM por agir de forma individualista, por medo que o outro escolha a delação premiada primeiro .

    :)

  13. anelim disse:

    isso e d+

  14. alindre disse:

    isso nau tem nada h ve com o qe eu procuro

  15. Ivan. disse:

    Bom dia.

    Olha gostei muito da forma como vc explicou Teoria dos jogos e o dilema do prisoneiro foi muito criativo de sua parte em repassar isso dando exemplo o jogo de RPG.

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: