Introdução à Teoria dos Jogos (Parte 1)

Jogos sequenciais para dois jogadores – Estratégias Dominantes, Equilíbrio de Nash e Cooperação vs. Deserção

Fonte

A teoria dos jogos geralmente se refere ao estudo de modelos matemáticos que descrevem o comportamento de tomadores de decisão lógicos. É amplamente utilizado em muitos campos, como economia, ciência política, política e ciência da computação, e pode ser usado para modelar muitos cenários do mundo real. Geralmente, um jogo refere-se a uma situação envolvendo um conjunto de jogadores, cada um com um conjunto de escolhas possíveis, em que o resultado para qualquer jogador individual depende parcialmente das escolhas feitas por outros jogadores.

Jogos Simultâneos

Um dos principais tipos de jogos na teoria dos jogos é o jogo simultâneo , no qual ambos os jogadores fazem seus movimentos simultaneamente (ou, se não o fizerem, o último jogador não está ciente da ação anterior do jogador, tornando-o efetivamente simultâneo). Os jogos sequenciais são geralmente representados na forma normal , que, para um jogo com 2 jogadores e N movimentos possíveis para cada jogador, consiste em uma matriz N x N , onde cada entrada é uma tupla 2 contendo o pagamento para cada jogador.

Para ilustrar isso, considere o exemplo abaixo. Este é um tipo de jogo seqüencial chamado Dilema do Prisioneiro , no qual cada prisioneiro tem a opção de trair o outro prisioneiro por uma punição reduzida (Confessar), ou encobrir o outro prisioneiro e esperar que o outro prisioneiro faça o mesmo (Mentira). ). Em cada célula da matriz, o primeiro elemento da tupla representa a recompensa para o Prisioneiro 1, e o segundo elemento representa a recompensa para o Prisioneiro 2. Lê-se essa matriz de retorno identificando primeiro a escolha (Confessar ou Mentira) que cada jogador make e, em seguida, localizando a entrada de matriz que corresponde a essa linha e coluna. Por exemplo, se o Prisioneiro 1 escolher Confessar e o Prisioneiro 2 escolher Mentir, você lerá a entrada da matriz na 1ª linha e na 2ª coluna, dando ao Prisioneiro 1 um pagamento de 0 e o Prisioneiro 2 uma recompensa de -10.

Em um jogo simultâneo, cada jogador deve tomar decisões com base no que ele supõe que o outro jogador fará. Lembre-se de que, na teoria dos jogos, assumimos que os jogadores são tomadores de decisão racionais que querem maximizar seu retorno. Um método para prever o resultado do jogo é identificar estratégias dominantes para cada jogador. Uma estratégia dominante é aquela que é a melhor para um determinado jogador, independentemente da escolha do outro jogador – portanto, independentemente do que o Prisioneiro 2 fizer, uma estratégia dominante para o Prisioneiro 1 é a estratégia ideal para o Prisioneiro 1.

No jogo Dilema do Prisioneiro, podemos observar que a estratégia dominante para ambos os jogadores é Confessar. Primeiro, observe que essa matriz de payoff é simétrica , portanto, cada jogador tem o mesmo retorno para cada opção. Isso significa que, ao identificar estratégias dominantes, precisamos considerar apenas a estratégia dominante de um jogador, já que também será uma estratégia dominante para o outro jogador. Agora, para encontrar a estratégia dominante do Prisioneiro 1 (e do Prisioneiro 2), precisamos encontrar o lance de melhor escolha do Prisioneiro 1 para cada uma das possíveis escolhas do Prisioneiro 2. Se o Prisioneiro 2 escolher Confessar, o Prisioneiro 1 recebe um pagamento de -8 por Confessar e um pagamento de -10 por Mentir, então ele decidirá Confessar. Se o Prisioneiro 2 escolher Mentir, o Prisioneiro 1 recebe um pagamento de 0 por Confessar e um pagamento de -1 por Mentir, então ele novamente escolherá Confessar. Portanto, o Prisioneiro 1 tem uma estratégia dominante que é sempre Confessar, uma vez que, independentemente da escolha do Prisioneiro 2, Confessar é a melhor opção do Prisioneiro 1. Essa mesma análise se aplica à estratégia dominante do Prisioneiro 2. Portanto, no jogo Dilema do Prisioneiro, ambos os prisioneiros acabarão optando por Confessar.

A opção (Confessar, Confessar) é, portanto, um Equilíbrio de Nash . Um Equilíbrio de Nash é um conjunto de escolhas em que nenhum jogador tem nada a ganhar mudando apenas sua própria escolha. Desde que identificamos que Confess é a estratégia dominante para ambos os Prisioneiros, já sabemos que nenhum dos jogadores tem nada a ganhar trocando. Portanto, como cada jogador está jogando sua estratégia dominante, esse conjunto de escolhas é um Equilíbrio de Nash.

Jogo Dilema do Prisioneiro é um exemplo de situação em que duas decisores racionais vai optar por não cooperar (defeito) uns com os outros, apesar do fato de que a cooperação (ambos escolher Lie) resultaria em uma melhor recompensa para ambos os prisioneiros ((-8 , -8) vs. (-1, -1)). Em um jogo tão pouco cooperativo, ao escolher sua própria estratégia dominante individual, os dois prisioneiros não conseguem fazer a escolha que é realmente ideal. A estratégia racional do indivíduo entra em conflito com a estratégia ótima societal ou global. Em geral, jogos simultâneos como o Dilema do Prisioneiro nos fornecem métodos formalizados para estudar conflitos e cooperação. Esse cenário específico que resulta em falta de cooperação aparece em vários campos , como política, economia e biologia. Esses exemplos ilustram que, embora a opção “melhor” em muitas situações do mundo real seja cooperar, os jogadores racionais, pensando como indivíduos, escolherão não cooperar entre si, já que não podem confiar no outro jogador para cooperar.

Jogos offline