¿Cuál es la explicación más simple y convincente de la solución al problema de Monty Hall?

Si alteras tu perspectiva, la respuesta se vuelve obvia.

Vamos a jugar un juego de cartas, lo llamaremos “Monty de 3 cartas”
El titular de la carta más alta al final del juego gana. El mazo consta de solo 3 cartas, un par de 2 y el Rey. Siempre te ofrezco una carta y yo 2. Después del trato, miro mis cartas y descarto las más bajas, boca arriba (tenga en cuenta que en realidad no importa si descarto boca arriba o abajo). No se le permite mirar su tarjeta, pero puede cambiar conmigo en este punto … debería ser bastante obvio que cambiar siempre es la mejor opción.

2: 3 del tiempo me trato con el Rey, y siempre lo tengo en mi mano si lo consigo, así que el cambio gana 2: 3 del tiempo.

EDITAR: Basado en algunos comentarios, decidí agregar un poco más de detalles sobre la lógica.

Los 2 no son intercambiables, son dos objetos distintos. Podemos aclarar esto etiquetándolos: 2 diamantes, 2 corazones
Monty puede dibujar una de tres manos posibles:
{K, 2d}
{K, 2h}
{2d, 2h}

El paso de descarte es una pista falsa. Debido a las reglas que hemos elegido no cambia las probabilidades en absoluto. Monty tendrá el K 2: 3 del tiempo antes de mostrar una tarjeta, y después . El truco para entender este rompecabezas es darse cuenta de que la revelación no crea un nuevo sorteo. Tomamos solo una vez, al principio, de un grupo de tres estados posibles, y las probabilidades para todo el juego deben calcularse desde ese punto y solo ese punto.

Hay dos técnicas de simplificación que he usado de manera efectiva para explicar la solución:

  1. Primero, vuelva a ejecutar la pregunta omitiendo la parte donde Hall abre una de las puertas que no ha elegido. En su lugar, preséntela como una opción entre la puerta elegida originalmente y * ambas * puertas restantes. Es mucho más obvio que debes cambiar en esta situación. Ahora puede examinar qué cambios se producen cuando Hall abre una puerta que no se ha elegido. La realización clave es que él * siempre * puede realizar esta acción, y por lo tanto, no le proporciona ninguna información nueva.
  2. Segundo, haz los números más grandes. Describa el experimento con un paquete de tarjetas de la siguiente manera: comience con un paquete estándar de 52 tarjetas. Elige una carta al azar. ¿Cuál es la probabilidad de que sea el as de espadas? Claramente 1/52. Entonces, ¿cuál es la probabilidad de que el As de espadas todavía esté en el paquete? Debe ser 51/52 – muy cerca de 1. Ahora, pídale a alguien que revise el paquete restante y tire 50 cartas que no sean el As de Picas. Eso siempre es posible, sin importar quién tenga la tarjeta. En este punto, pregunte cuál es la probabilidad de que la carta elegida original, que no ha cambiado y que todavía se encuentre ahí fuera para que todos la vean, sea el As de Espadas. Debe ser intuitivamente cierto que no ha pasado nada para cambiar la probabilidad de que sea el As. Entonces, ¿cuál es la probabilidad de que la carta que queda del paquete restante sea el As? * Tiene * que seguir siendo 51/52, y como eso es casi una cosa segura, la decisión de cambiar debería ser obvia.

Personalmente, encuentro que el segundo enfoque mencionado por Henry Robinson es el mejor para convencerme de que la respuesta correcta es cambiar (el caso de los grandes números).

Sin embargo, todavía no me satisface conceptualmente en términos causales. Para eso, el mejor enfoque para mí ha sido pensar en términos de la teoría de la información. Las probabilidades nunca cambian a menos que la información fluya de un agente de toma de decisiones a otro.

En este caso, al abrir una puerta, sabe que no es el premio, el maestro de juego está revelando cierta información. La información fluye, por lo que las probabilidades cambiarán y es posible que las decisiones deban cambiar.

Si, en lugar de abrir una puerta de cabra, simplemente había agregado algún dato irrelevante a la imagen (“Te daré una pista … el nombre de mi gato es Bigotes. ¿Quieres cambiar tu selección ahora?”), La respuesta sería diferente.

O para acercarlo a casa, si hubiera dicho “Voy a usar esta rueda de la ruleta y escogeré un número aleatorio, y abriré esa puerta, y usted puede decidir si cambiar”, entonces no está agregando información adicional. PERO podría haber terminado abriendo la puerta del premio real en ese caso (en cuyo caso, por supuesto, debe cambiar con el 100% de probabilidad de ganar el premio). La única forma en que puede evitar revelar la puerta del premio es revelar información real.

Aquí hay una manera de desarrollar alguna intuición para el problema.

Imagina que hay 100 puertas .

Usted elige una, y el anfitrión abre otras 98 puertas que no tienen el premio detrás de ellas. Eso deja una puerta que no elegiste y que aún no está cerrada. Sospechoso, si?

Ahora, de forma intuitiva, ¿qué puerta crees que tiene el premio, la que escogiste al principio o la puerta que ahora está cerrada?

Tienes que pensar en términos de probabilidad condicional para que la respuesta correcta sea más intuitiva. La respuesta de Desmond Foo hace que sea muy fácil visualizar el condicionamiento en la primera opción.

Originalmente tienes una probabilidad de 2/3 de elegir la puerta equivocada. Dada esa situación, el cambio aumenta su probabilidad de ganar la correcta, ya que elimina la otra cabra restante. El interruptor no ayuda si ya eligió el automóvil, pero elegir el automóvil en primer lugar es menos probable.

  • P (ganar | elección incorrecta) = P (perder | elección correcta)
  • PERO, P (opción incorrecta)> P (opción correcta) y eso es lo que está aprovechando, cuando los pone a ambos juntos.

Una vez me explicaron la solución al problema de Monty-Hall en lo que pensé que era una hermosa frase de una línea que hizo que la respuesta fuera inolvidable intuitiva.

Si su estrategia es cambiar, la única manera de perder es si eligió el auto en su primera estimación, de lo cual existe una posibilidad de 1/3.

Supongamos que hemos determinado la estrategia es cambiar. Una de las siguientes ocurrirá:

  • Si inicialmente escogiste la puerta con el auto, entonces te mostrarán una de las dos cabras y cambiarás a la otra cabra, perdiendo así. Hay una forma en la que inicialmente puede elegir un coche.
  • Si inicialmente escogiste una cabra, el anfitrión debe mostrarte la otra cabra para que solo puedas cambiar a una puerta con un auto, y así ganar. Hay dos formas en las que inicialmente puedes escoger una cabra.

Encontré esta publicación de blog que usa d3 para explicar y simular Monty Hall. Lo encontré bastante convincente y entretenido.


Fuente – Página en Blog

La gente asume que el anfitrión está tratando de meterse con nosotros. La descripción del problema de Monty Hall no deja totalmente claro que el anfitrión siempre abre la puerta, no solo cuando sabe que la puerta elegida podría estar escondiendo el premio.

Una vez que acepte la suposición de que el anfitrión siempre abre la puerta defectuosa, la segunda conclusión es que el anfitrión que abre la puerta no cambia las probabilidades iniciales del jugador; las probabilidades iniciales siguen siendo 1 en 3 y no 1 en 2. (Y para muestre esto, uno puede enumerar todas las opciones, como ha hecho Desmond Foo).

Entonces, cambiar a la puerta sin abrir cambiará las posibilidades de 1 en 3 a 2 en 3.

Algunas personas todavía creen en la suerte, y la respuesta de Daniel Lo podría influir en ellos. Además, es una gran estrategia para el anfitrión hacer que la gente crea que él siempre abre la puerta, especialmente si no se le exige que abra la puerta cuando las apuestas son demasiado altas.

Dado el conjunto de excelentes respuestas a esta pregunta, no repetiré su lógica, sino que compartiré mi evolución mental hacia la comprensión de este problema por primera vez hoy, con la esperanza de que ayude a alguien más con la confusión palpable que inspira este maravilloso rompecabezas.

La respuesta provista por Ayush Agrawal que leí en este hilo es la primera que encontré que realmente resalta el problema psicológico que la gente encuentra cuando piensa en este maravilloso rompecabezas (que me incluye a mí).

Primero, fue una explicación como la bien ilustrada dada por el usuario de Quora, pero al verla en la sección de comentarios en otro hilo en forma de texto, eso me indicó la dirección correcta. Sin embargo, mi mente todavía vacilaba entre la vista correcta y la vista de probabilidad 1/2.

Uno de los casos clásicos en los que se te enseña temprano cuando aprendes sobre probabilidad es este: si has lanzado una moneda 2 veces seguidas y las primeras dos veces ha caído en Heads, ¿cuál es la probabilidad ahora de que vuelva a aparecer Heads? ? La respuesta ingenua en este caso es 1/8 (1/2 * 1/2 * 1/2), la respuesta correcta es 1/2. Para la versión de prueba actual, sigue siendo 1/2 sin importar lo que sucedió en las pruebas anteriores.

Esa lección clásica anterior es lo que creo que realmente te mete en la cabeza cuando piensas en el problema de Monty Hall porque te preguntaste por qué no se aplica a la elección final en el problema de Monty Hall. Pero creo que los siguientes matices pueden ayudar, al menos eso espero. Es una elaboración y derivación de la respuesta dada por Ayush Agrawal a continuación. Aquí va.

En el momento en que eligió la primera puerta, las probabilidades de tomar la decisión correcta, según la información disponible en ese momento , son de 1/3, ya que todas las puertas están cerradas. Pero como el anfitrión se ve obligado a elegir la única puerta restante que no es el auto y no su puerta, la única forma de aprovechar el conocimiento del anfitrión es cambiar las puertas.

La ilusión que sigue siendo una probabilidad 1/2 se crea porque su mente actualiza erróneamente la probabilidad de que elija entre 1/3 y 1/2 porque ahora hay una puerta menos oculta. Pero aquí está la distinción que aclara esa ilusión, al menos para mí.

Esa ilusión es falsa porque su elección se hizo sobre la información antigua en el momento en que se cerraron todas las puertas. Esa elección no se beneficia de manera retroactiva con la nueva información proporcionada por la elección del anfitrión (a menos que usted cambie de puerta). Esto está en contraste directo con el escenario de lanzamiento de moneda porque en el momento en que intenta la última prueba del lanzamiento de la moneda, no tiene absolutamente ninguna información nueva que lo beneficie en cuanto a si el próximo lanzamiento de la moneda será Heads o Tails.

Por lo tanto, la estimación mental de la probabilidad dada por el contexto del lanzamiento de la moneda contrasta directamente con el problema de Monty Hall y no es apropiada para la elección final. Esto hace de este enigma uno que te obliga ingeniosamente a pensar sobre el efecto que tiene la nueva información en una elección anterior . Puede sentir que está a punto de hacer una nueva elección desde solo dos puertas manteniendo su antigua elección o no, pero en realidad, esa elección original aún tiene la probabilidad de 1/3 anterior que estaba vigente cuando hizo esa elección. Absolutamente no toma en cuenta la nueva información proporcionada por los anfitriones, revelando una cabra, una opción que se beneficia directamente de su conocimiento de qué puerta tiene el automóvil y, lo que es más importante, cómo el anfitrión se ve obligado a elegir la única puerta disponible en el caso de que su elección original apunte a una cabra. Si su elección original tiene una cabra, entonces como él no puede mostrarle la puerta con el premio, solo tiene una puerta para elegir.   Esa última restricción es la que inclina las probabilidades a tu favor si cambias de puerta.

Las pruebas matemáticas y los enfoques lógicos descritos aquí son todos correctos y útiles, pero el bloqueo intuitivo aquí creo que es un poco más simple:

Cuando Monty abre la puerta, no solo te da información sobre la puerta que eligió; él te da información sobre la puerta que no escogió.

Que comparativamente aumenta las probabilidades de que el coche esté detrás de su puerta no seleccionada. Una vez que convenzas a la gente de que las probabilidades no son en realidad 50/50, digo que declaras la victoria.

He estado siguiendo esta pregunta durante tanto tiempo, leyendo tantas respuestas buenas e interesantes, cuando finalmente me di cuenta de una explicación simple que podía agregar.

Aquí va:

1. Independientemente de lo que elija inicialmente, sabe que es más probable que sea una cabra que un automóvil (2/3 de probabilidad).
2. Cuando una de las otras puertas se abre y revela una cabra, se le dejan dos puertas, que sabe que contienen una cabra y un automóvil. Simplemente no sabes cuál.
3. Pero el hecho de que su puerta es más probable que tenga una cabra permanece. Una de las puertas tiene el auto, pero es más probable que el tuyo tenga una cabra. ¡CAMBIAR!

La explicación más simple que he encontrado es la siguiente:

  1. Si elige inicialmente la puerta ganadora y cambia, está garantizado que perderá. Eso sucede 1/3 del tiempo = 33.3%.
  2. Si elige inicialmente una puerta perdedora y cambia, tiene la garantía de ganar. Esto sucede el resto del tiempo, o el 66.7%.

Por lo tanto, el cambio te permite ganar el 66.7% del tiempo.

Desarrollar una intuición. Para la solución, imagínate empezando por 100 puertas. Monty te muestra una puerta, luego cambias, luego Monty te muestra otra puerta, etc. Si continúas, llegarás a 2 puertas y las probabilidades de ganar están claramente mejor que cuando empezaste. Esto demuestra intuitivamente que el cambio mejora sus probabilidades .

Todos han enumerado formas maravillosas de explicar la prueba formal del problema de Monty Hall.

Sin embargo, explicar la prueba y convencer a alguien de que es verdad son dos cosas diferentes. Yo diría que la mejor manera es mostrarles que funciona es en realidad probándolo. Comprendí la prueba de la respuesta mucho antes de que finalmente la aceptara como realmente “verdadera”. Lo acepté como cierto solo cuando vi este video:

Además, el problema también tiene una interpretación mecánica cuántica. La mayoría de la gente acepta la mecánica cuántica en estos días, y después de mostrarles la prueba, se puede decir que “la mecánica cuántica es la razón por la que funciona en la vida real”.

Edición: 4 años después, volviendo a las antiguas respuestas de Quora, me doy cuenta de que el párrafo anterior sobre QM está completo y completo. BS

Esta es una variación del problema de Monty Hall.
Debes cambiar tu decisión para maximizar tu probabilidad de ganar. Intuitivamente, un jugador que cambia pierde si inicialmente hubiera elegido el auto, que tiene una probabilidad de 1/3. Así, en el otro evento, el jugador que cambió las ganancias tendrá una probabilidad de 2/3. Esto indica que el cambio aumenta la probabilidad de ganar.

(Supuesto: el anfitrión del programa de juegos le ha mostrado el hecho de que la tercera puerta no oculta ningún premio después de su selección, que es la primera puerta)

Voy a explicar el problema de Monty Hall de la manera más sencilla posible … (la palabra “más simple” se basa únicamente en mi punto de vista)

Al principio tenemos que calcular la probabilidad inicial de sus ganancias.

Calculo inicial

Probabilidad del gran premio detrás de la 1ª puerta = 1/3.

Probabilidad de que su gran premio NO esté detrás de la primera puerta = 1– 1/3 = 2/3 = Probabilidad del gran premio detrás de la segunda o tercera puerta.

Vayamos ahora al cálculo final. Se tiene en cuenta el hecho de que usted es consciente de la situación de que el gran premio de 5 millones de dólares no está detrás de la tercera puerta.

Cálculo final

Probabilidad del gran premio detrás de la 1ª puerta = 1/3.

Probabilidad de que su gran premio NO esté detrás de la 1ª puerta = 2/3 = Probabilidad del gran premio detrás de la 2ª puerta.

Quizás estés buscando ese cambio ahora. Si realmente puedes encontrar eso, obtendrás nuestro punto. Pero si no lo haces, estás pensando que esta discusión no tiene sentido. Mire detenidamente el segundo cálculo, es decir, la parte de cálculo final . La probabilidad con respecto a la 1ª puerta sigue siendo la misma. ¿Qué pasa con el segundo? La probabilidad con respecto a la 2ª puerta ha AUMENTADO. La razón detrás de esto es simplemente la eliminación de la tercera puerta, ya que sabes el hecho de que la tercera puerta no oculta ningún premio . Matemáticamente podemos decir esto como

Probabilidad de la segunda puerta + probabilidad de la tercera puerta = 2/3.

2ª probabilidad de puerta + 0 = 2/3

Probabilidad de la segunda puerta = 2/3.

Resultado y Conclusión

Probabilidad de 1a puerta = 1/3.

Probabilidad de la segunda puerta = 2/3.

Probabilidad de la tercera puerta = 0.

Por lo tanto, verá que probablemente tenga más posibilidades de ganar su premio si cambia su elección a la 2ª puerta únicamente desde el punto de vista de las matemáticas.

La pregunta hizo la respuesta que es más simple y convincente, pero esas son diferentes.

La respuesta más simple es que, dado que elige una puerta al azar, la probabilidad de que la puerta sea correcta es de 1/3. Por lo tanto, la probabilidad de que la otra puerta sea correcta es de 2/3.

El argumento más convincente es el que surja por su cuenta después de pensar en el problema. Si no puedes convencer a alguien lógicamente, eso es bueno. Puedes convencerlos de cuál es la respuesta jugando realmente el juego. Después de 1000 iteraciones, se vuelve imposible para una persona sensata seguir pensando que la respuesta es 50-50.

Entonces, cualquier persona curiosa continuará pensando en ello hasta que lo haya comprendido por sí misma. Estar confundido, trabajar en ello y, por fin, llegar a una epifanía es la mejor manera de convencerse de algo.

Para la intuición, me gusta pensar en la probabilidad como una especie de “masa” en este tipo de problemas, algo así como las funciones de onda en la mecánica cuántica. En esencia, el auto tiene una masa de 1/3 en cada una de las 3 puertas (ya que es igualmente probable que esté detrás de todas). Tan pronto como selecciona una puerta como su conjetura, determina la masa de probabilidad del automóvil detrás de esa puerta (en este caso, la ha fijado a 1/3). Ahora, la masa restante de 2/3 se distribuye uniformemente entre las otras dos puertas, por lo que cada una recibe 1/3. Tan pronto como el huésped abre una de las puertas, ha establecido que la probabilidad de que haya un 0 es como hacer una observación en física y colapsar la función de onda de una partícula. Pero esa masa de probabilidad tuvo que haberse ido a alguna parte, ya que la masa total debe ser 1. Ya ha fijado la masa a 1/3 en su propia puerta, por lo que los 2/3 restantes deben estar todos en la puerta sin abrir.

En el ejemplo número 2 de Henry Robinson, cuando eliges una carta que supones que es el As de espadas, calculaste que la masa de probabilidad de esa carta es 1/52. A medida que la otra persona retira sucesivamente cartas que no son As de picas del resto de la baraja, la masa de probabilidad 51/52 se redistribuye continuamente entre las cartas restantes. Al verlo de esta manera, debería ser muy fácil ver que, incluso si la persona extrajo una sola tarjeta, es mejor cambiarla, ya que antes de la extracción todas las tarjetas tenían una masa de 1/52, pero tan pronto como se extrae una, el 51 / La masa 52 se redistribuye a las otras cartas que no elegiste, por lo que cada una obtendrá una pequeña porción de masa, golpeando la masa por encima de 1/52.

Creo que la forma más sencilla es simplemente pedirle a la gente que ignore todo y solo piense de qué cuadro empiezan; céntrese en eso en lugar de cualquier otra cosa, entonces comienza a tener sentido; Eso es lo único que me ayudó.

Entonces, si comienzas con una cabra y cambias, ganas y tienes dos tercios de posibilidades de comenzar con una cabra; Debido a que las probabilidades son mejores que comenzaste con una cabra y no con el auto, las probabilidades son mejores que ganarías al cambiar. Pensar de esa manera elimina la cosa 50/50 que nos atrapa. 🙂

El problema de Monty Hall

Como señalaron varias personas en este hilo y en otras buenas respuestas en Quora, el punto básico es que la respuesta 50/50 y la respuesta 66/33 son correctas, dependiendo de si Monty Hall actúa como un agente inteligente o al azar. Cuando un agente inteligente actúa de manera inteligente, genera información, en este caso, esa información se puede usar para ayudarlo a ganar un auto 🙂

Pero solo para que alguien que quiera una computadora ayude a convencerlos, rápidamente escribí este código de Ruby para convencer a alguien recientemente. Simplemente cargue el enlace a continuación y presione “Ejecutar” para ejecutarlo y verá los resultados de las simulaciones en el panel de la parte inferior.

http://www.tutorialspoint.com/vi

Si desea explorar, simplemente ajuste las 3 configuraciones en la parte superior. Aquí hay algunas cosas realmente interesantes para probar:

  • Cambie “switch_choice = true” por “switch_choice = false” para detener el cambio de la puerta del jugador, pero mantenga la puerta inicial. Esto demostrará tus posibilidades de ganar una caída de 1/3 en lugar de 2/3 si cambias.
  • Cambie “monty_is_random = false” por “monty_is_random = true” para hacer de Monty un agente aleatorio en lugar de saber de manera inteligente qué puertas tiene el auto y abrir la otra. Notará que 1/3 del tiempo Monty arruina el juego y que el jugador gana 1/3 del tiempo o la mitad de los juegos válidos que no se arruinaron. Este 1/2 de los juegos válidos es el 50/50 que es intuitivo para la mayoría de las personas que escuchan el problema . Es una respuesta perfectamente buena, a menos que intuyas que Monty tiene un programa de televisión para correr y que nunca cometería un error al abrir la puerta con el auto detrás (o la pregunta lo dice explícitamente).
  • Cambia “number_of_doors = 3” a “number_of_doors = 100” para aumentar el número de puertas en el juego. Intente esto con las variaciones en los dos parámetros anteriores y tendrá una gran ilustración de la realidad de la gran diferencia que hace la suposición de selección aleatoria.

1. Como dijo Henry, considera los números más grandes. Si hay 1000 puertas y Monty abre 998 puertas, seguramente el premio está detrás de la única puerta que Monty dejó cerrada, ¿verdad?

2. Considere un juego ligeramente diferente donde Monty no sabe dónde está el premio y abre puertas al azar. En esta versión, si Monty revela accidentalmente el premio, el juego termina y vuelve a empezar. En esta versión modificada del juego, no importa qué puerta elijas, a diferencia de la versión original. Al pensar en la diferencia entre los dos juegos, llegarás a comprender mejor la situación en su totalidad.