[MUSIC] ¿Qué es, por qué es importante y cómo se modela la incertidumbre? [MUSIC] En esta clase se describirá el concepto de incertidumbre. Además de esto, se explicará su importancia en el análisis de los datos y cómo modelarla. Analizar y comprender la información disponible para tomar decisiones. Tiene por fin eliminar o reducir el riesgo de obtener malos resultados al implementar esas decisiones. Por ejemplo, la información sobre la llegada de pacientes a un hospital nos permite obtener estadísticos descriptivos. Como promedio, desviaciones, máximos, mínimos, medianas y otros. Sin embargo, y a pesar de contar con todos esos estadísitcos descriptivos. No sabemos con certeza cuántos pacientes efectivamente llegarán un día cualquiera en el futuro a la red. Evidentemente, esto dificulta tomar algunas decisiones. Como, por ejemplo, determinar cuántas camas se deben instalar en la red para atender al 98% de los pacientes. Que llegan a la misma en una semana tipo. Dicho lo anterior en esta clase revisaremos dos temas. Tema 1, concepto de incertidumbre. Tema 2, cómo modelar la incertidumbre. Tema 1, concepto de incertidumbre. Hay problemas de decisión para los que no se cuenta con información certera en un momento de tomar estas decisiones. Lo anterior se conoce como incertidumbre y se define como la falta de certeza. O la imposibilidad de describir de manera exacta un determinado fenómeno. En pocas palabras, no sabemos con exactitud que va a suceder. Podemos tener una intuición o espectativa, pero nunca la seguridad de que sucederá lo que esperamos. Es importante destacar que la variabilidad en los valores observados para un mismo fenómeno. Es lo que hace exista incertidumbre en las realizaciones futuras de ese fenómeno. Por ejemplo, la llegada futura de pacientes a un hospital es incierta. Incluso si tenemos información pasada de cuantos pacientes han llegado cada día. También se manifiesta incertidumbre en los días de estadía que estará un paciente en un hospital. El equipo médico puede tener una estimación basada en su experiencia. Sobre la cantidad de días que permanecerá hospitalizado un paciente. Pero no puede garantizar a la familia que efectivamente esa cantidad de días durara la estadía de ese paciente. Por otro lado, el costo de resolución en una clínica privada. O la cantidad de camas existentes, corresponden a información certera. Basta con preguntarlo y tendremos la información certera para hoy. Es importante destacar que la variabilidad de los valores observados para un mismo fenómeno. Es lo que hace que exista incertidumbre en las realizaciones futuras de ese fenómeno. Tal como mencionamos en el ejemplo, la llegada de pacientes es incierta, por lo tanto, posee incertidumbre. También se manifiesta incertidumbre los días de estadía que estará un paciente hospitalizado. Por otro lado, los costos como el de resolución por la cantidad de camas existentes de un hospital o la red. Corresponden a información certera. Hay decisiones que se deben tomar con valores que se desprenden del análisis de datos. Pero que no se conocen con certeza, es decir poseen incertidumbre debido a su invariabilidad. Entonces, es importante dejar muy claro que la incertidumbre produce riesgo en los resultados de las decisiones que se deben tomar. Entendiendo riesgo como la posibilidad de que estos resultados no sean los esperados o no sean satisfactorios. Esto obliga a tomar en cuenta esta falta de certeza. Incorporando esta incertidumbre y variabilidad a los cálculos y valores obtenidos. Para tratar de acercarnos lo más posible a algo que pueda suceder. Al realizar esto, las decisiones se toman con más y mejor información. Y pueden dar una mejor respuesta o tener un mejor desempeño en el futuro. Le invitamos a responder la siguiente pregunta. Recuerde que para responder debe trabajar con la base de datos disponible en el curso y con Python. Tema 2, ¿cómo modelar la incertidumbre? Debido a la importancia que tiene la incertidumbre para tomar decisiones. Se debe encontrar una forma que permita modelarla adecuadamente. Para esto, lo primero es reconocer cuándo los datos presentan variabilidad e incertidumbre. Así, teniendo claro cuando existe incertidumbre. Debemos tratar de estimar los distíntos valores que puede tomar el fenómeno o variable estudiada. Estimar la probabilidad de ocurrencia de cada valor que puede tomar esa variable. Y estimar el impacto que genera esa incertidumbre en los resultados esperados. Estos pasos se ilustran y se explican en el ejemplo que se mostrará a continuación. Observemos la serie de datos de la tabla. En esta tabla se muestra la cantidad de pacientes que llegaron a un hospital en los últimos 10 días. Si quisiéramos saber cuántos pacientes llegarán al hospital el día 11. Tenemos que entender cómo han llegado los pacientes históricamente. En este caso, en esos 10 días. Comencemos graficando los datos para ver la frecuencia de llegadas. Tal como se muestra en el histograma de la lámina. Del gráfico, podemos observar que la frecuencia es diferente para distintos valores. Quizás es mejor calcular de manera simple la proporción del total de valores observados que corresponda a cada posible valor. Esta proporción se observa en la tabla de la lámina. Vemos que el 60% de los días llegan 5 pacientes, esto no hace pensar que, de repetir la historia. Es más probable que mañana lleguen 5 pacientes que lleguen 2 o 6 por ejemplo. Entonces, de la tabla anterior, conocemos que el 60% de las veces han llegado 5 pacientes. Así, y dado que poseemos solamente esa información. Podríamos decir que la probabilidad de que lleguen 5 pacientes el día 11 será, basado en la evidencia de los datos analizados, de 60%. Imaginemos basados en esta probabilidad del 60%, que para el día 11 se preparan 5 camas. ¿Qué pasaría si llegan 6 pacientes, cuya probabilidad calculada de la misma manera es de 10%? En este caso no tedríamos camas para atender a uno de estos pacientes. Bajo un análisis similar, si llegan 2 pacientes, habrá 4 camas desocupadas. ¿Cuál de estas dos decisiones es mejor? ¿Preparar 2 camas o 5 camas? La respuesta no es clara, you que se debe evaluar el impacto de no evaluar al paciente que se queda sin cama. Frente al impacto de tener 4 camas desocupadas. Le invitamos a responder la siguiente pregunta. En esta clase se presentó el concepto de incertidumbre. El cual es la falta de certeza debido a la variabilidad y aleatoriedad de los datos. También se dio a concer su importancia y cómo modelarla. Por último, se realizó un pequeño ejemplo en donde existe incertidumbre. Y se recalca el por qué es importante tenerla en cuenta al momento de tomar decisiones. Para describir y modelar la incertidumbre se requiere un adecuado análisis de la información. Lo que se puede analizar mediante analítica descriptiva. Y modelarla correctamente, lo que corresponde a analítica predictiva. [MUSIC]