그래프: 속임수와 이를 알아내는 방법
병원 퀴즈
1974년 2명의 심리학자인 Daniel Kahneman과 Amos Tversky는 질문과 함께 다음 상황에 대한 실험 주제를 공개했습니다. 어떤 마을에 병원이 두 곳 있습니다. 큰 병원에서는 매일 약 45명의 아기가 태어나고 작은 병원에서는 매일 약 15명의 아기가 태어납니다.
아시다시피, 모든 아기의 약 50%는 남자입니다. 하지만 정확한 비율은 날마다 다릅니다. 50% 이상인 날도 있고, 그 이하인 날도 있습니다. 1년 동안 각 병원에서는 태어난 아기 중 남자가 60% 이상이었던 날을 기록했습니다. 그러한 날이 더 많았던 병원은 어디라고 생각하십니까?
큰 병원
작은 병원
거의 같음(서로 5% 이내)
이항식 이론에 따라 태어난 남자 아기 수가 여자 아기보다 적어도 4~6명 더 많았던 일 수는 작은 병원이 큰 병원에 비해 거의 3배 더 많을 것입니다. 이는 단순히 출생률의 변동성이 더 크기 때문입니다. 샘플이 클수록 50%에서 크게 벗어날 가능성이 줄어듭니다. 그럼에도 응답자의 22%만이 정답을 맞췄습니다.
휴리스틱이란 무엇일까요?
Kahneman과 Tversky는 이 오류를 간략하게 작은 수 법칙으로 설명했습니다. 더 일반적으로, 작은 샘플로 판단하면 더 많은 개체군을 대표하는 것처럼 부적절하게 인지되는 경우가 있습니다. 예를 들어, 임의로 분배된 것처럼 보이는 작은 샘플은 해당 샘플이 선택된 더 많은 개체군도 임의로 분배될 것이라는 생각을 강화할 수 있습니다.
병원 퀴즈: 샘플이 클수록 50%에서 크게 벗어날 가능성이 줄어듭니다. 그럼에도 응답자의 22%만이 정답을 맞췄습니다.
반대로, 명백하게 의미 있는 패턴을 보이는 작은 샘플(예: 동전을 10번 던져서 앞면이 9번 나온 경우)은 관찰자가 해당 개체군도 동일하게 의미 있는 패턴을 표시할 것이라고 믿게 만듭니다. 이 경우 동전이 편향된다고 가정합니다. 패턴을 무작위 또는 의미 없는 데이터로 인지하는 경험을 아포페니아라고 합니다.
작은 수 법칙에서의 믿음은 사람들이 불확실성 속에서 판단을 내릴 때 취하는 더 많은 정신적 지름길의 일부입니다. Kahneman과 Tversky는 이러한 지름길을 휴리스틱이라고 불렀습니다. 작은 샘플에서의 일반화는 대표성 휴리스틱의 예로, 사람들은 특정 사건에 대한 가능성을 오직 쉽게 떠오르는 비슷한 이전 사건의 일반화를 기반으로 판단합니다.
대표성 휴리스틱의 또 다른 예는 도박사의 오류 표현입니다. 사실, 그러한 편향은 작은 수 법칙의 믿음에서 나옵니다. Kahneman과 Tversky는 다음과 같이 말합니다.
도박사 오류의 핵심은 기회의 법칙에 대한 공정성을 오해하는 것입니다. 도박사는 동전의 공정성 덕분에 한 방향으로 발생한 편차가 다른 방향으로 발생한 해당 편차에 의해 곧 무효화될 것이라고 기대합니다. 실험 대상은 마치 무작위 순서의 모든 부분이 실제 비율을 반영해야 하는 것처럼 행동합니다. 만약 순서가 인구 비율을 벗어나면 다른 방향으로의 올바른 편향이 예상됩니다.
동일하지 않은 샘플 크기 그래프 분석
스포츠 베터는 작은 수 법칙에 대한 잘못된 믿음 때문에 패턴을 잘못 인식할 가능성이 특히 높습니다. 작은 베팅 샘플의 수익성을 임의성의 일탈 및 예측 기술의 증거로 잘못 해석할 경우 장기적으로 경제적 손해가 발생할 수 있습니다. 아래 NFL 포인트 스프레드에 있는 100개의 베팅에 대한 가상 수익성 차트를 고려합니다. 각 베팅은 1.95의 가격으로 시작합니다. 인상적이지 않습니까?
만약 제가 이 기록의 출처가 유명한 미국 스포츠 핸디캐퍼라고 말한다면 어떻게 될까요? 양호한 성장 추세와 15%의 수익이라면 저를 믿는 것도 무리가 아닐 것입니다. 물론, 거짓말입니다. 사실, 1,000개의 베팅에 대한 다음 차트는 더 큰 그림을 보여줍니다.
장기 수익을 얻을 가능성은 정말 전혀 없습니다. 이유는 이러한 경우가 개별 승리 기회가 50%이고 기대 수익이 -2.5%라고 가정한 난수 발생기에서는 거의 만들어지지 않기 때문입니다. 첫 번째 차트는 두 번째의 초기 100개의 베팅을 나타낼 뿐입니다.
두 번째의 시계열이 더 길다 하더라도 수백 번의 베팅 동안 안정적인 수익이 유지되었습니다. 게다가, 전체적으로 손실을 나타내더라도 시계열 패턴은 상당히 일관된 파도 모양의 패턴을 나타내므로 결코 무작위가 아닌 것처럼 보입니다.
하지만, Kahneman과 Tversky가 인식한 것처럼 배경에 근본적인 메커니즘이 없어도 비슷한 결과의 순서를 무작위가 아닌 것으로 인지할 가능성이 훨씬 더 높습니다. 아래 2개의 이진 순서 중에서 무작위로 보이는 것과 그렇지 않게 보이는 것은 무엇입니까?
0, 0, 0, 0 1, 1, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1
0, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1
대다수의 사람은 두 번째 순서를 선택할 것입니다. 사실, 첫 번째는 Excel에서 무작위로 생성한 것이고 두 번째는 제가 1과 0이 더 짧게 연속하도록 의도적으로 만든 것입니다. 이와 같은 무작위 순서를 만들어보라고 한다면 대부분은 1과 0 중 하나가 너무 자주 나온다고 느낄 경우 1을 0으로 또는 그 반대로 전환할 것입니다.
이제 다음 1,000개의 베팅 차트를 살펴보겠습니다. 모두 무작위로 생성되었습니다. 여러 가지 가능한 결과를 통해 명백하게 의미 있는 패턴에 얼마나 쉽게 속을 수 있는 지에 대한 느낌을 전달받을 수 있습니다.
100개의 베팅이 아니라 1,000개의 베팅 시리즈입니다. 중간을 살펴보겠습니다. 이는 전체 베팅 순서 동안, 5%의 수익과 견고한 수익 증가를 보이는 전문 팁스터 또는 베터의 특징을 가지고 있으므로 최고의 핸디캐퍼가 장기간 올릴 수 있는 성과 유형입니다. 그렇다 하더라도 단지 우연히 발생한 것입니다.
이항 분포를 사용하면 베팅 기간 후에 예상치가 -2.5%이더라도 아직 수익을 낼 가능성을 계산할 수 있습니다.
1,000번의 베팅 후 베팅이 무작위에 불과하더라도 수익을 낼 가능성은 여전히 1/5보다 높습니다. NFL 게임을 할 때마다 한 번의 핸디캡 베팅을 한다면, 거의 4번의 시즌이 걸릴 것입니다. 우리 편에 행운 말고 다른 것이 있다는 것을 믿기까지는 오랜 시간이 걸립니다.
얼마나 작아야 작은 것입니까?
작은 수 법칙은 사람들이 상대적으로 작은 수의 관찰이 일반 대중을 밀접하게 반영할 것이라고 믿는 경향을 보이는 인지적 편향입니다. 게다가, 이 연습 문제에서 나타나듯이 작다는 것이 때로는 꽤 큰 것일 수도 있습니다. 사람들은 의심보다는 확실함을, 무시보다는 설명을, 연계보다는 인과를, 무작위보다는 패턴을 그리고 기회보다는 기술(특히 자기 고양적 기술)을 선호하기 때문입니다. 스포츠 베팅에서는 의미를 정확히 파악하지 못하면 희생이 따를 수 있습니다.
Comments