이 문제를 처음 떠올린 것은,가위바위보의 벨런스에 대해서 생각하고 있었을 때였습니다.
다들 아시다시피 가위바위보의 벨런스는 완벽합니다.
그렇다면, 가위바위보 외에 한가지 전략을 더 선택할 수 있는 4각 가위바위보의 경우는 어떻게 될까요?
다음은 제가 구상한 4각 가위바위보 각 전략간의 상성관계입니다.
이기는 전략은,점이 더 가까운 전략입니다.
예를들어 위와 같은 그림은 a와b가 붙으면 b가 이긴다는 뜻입니다.
각 전략의 가치를 계산해보고 싶으면 각 전략을 선택했을때 이기는 경우의 수를 세보면 됩니다.
a,b,c,d의 각 가치는 1,2,1,2 입니다.
그런데 제가 발견한 문제는 바로 이것입니다.
상대방도 각 전략이 어떤 가치를 가지고 있는지 알고 있으며,그래서
그 전략의 가치에 비례한 빈도로 전략을 선택한다고 칩시다.
그러면 다시 각 전략의 가치를 계산해볼 수 있습니다.
각 전략의 가치=이 전략이 이기는 다른 전략들의 가치(해당 전략들이 선택되는 빈도수)의 합.
으로 생각해서 말입니다.
그래서 한번 더 계산해 생각해본 a,b,c,d의 가치는 계산해본결과
a,b,c,d= a(c),b(a,c),c(d),d(a,b)=a(1),b(1+1),c(2),d(1+2)=1,2,2,3 이었습니다.
그런데 이러한 계산은 무한히 반복할 수 있을 것입니다.
위의 새로운 가치들을 바탕으로 다시한번 생각해서요.
그러면
위 계산을 계속할때 과연 우리는 최선의 전략을 발견할 수 있을까요?
아니면 최선의 전략은 수렴하지 않고 진동할까요?
(IP보기클릭)121.179.***.***