Muestra para Datos Continuos

Descripción

Este es el segundo video de la miniserie relacionada al plan de recolección de datos. Aquí aprovechamos a repasar qué es un dato continuo y luego pasamos a entender cómo podemos calcular la muestra mínima considerando su respectiva frecuencia y sus posibles estratificaciones.

PDUs Gratis

Minutos: 20:15 | PDUs Máximo: 0.25

  • Ways of Working: 0.25
  • Power Skills: 0.00
  • Business Acumen: 0.00
Ways of Working
Power Skills
Business Acumen
0.25
0.00
0.00

Descargas Asociadas

Descargar archivo Excel “Hoja de Ayuda de Cálculo de Muestra”

Transcripción

Bienvenidos al video número 27 de nuestra serie, completando juntos nuestro proyecto de mejora continua y a nuestro segundo video de la miniserie. Respecto al plan de recolección de datos. El día de hoy vamos a entender qué es lo que nosotros necesitamos hacer para recolectar una muestra confiable. Cuando nuestro tipo de datos de nuestra métrica es de tipo continuo y así podremos llenar con tranquilidad nuestro plan de recolección de datos que vimos en el video anterior. Pero sin mayor preámbulo pasamos a la intro y continuamos. Bienvenidos de nuevo amigos y amigas. No quisiera empezar este video sin crear un contexto para aquellas personas que tal vez no tuvieron la oportunidad de ver el video anterior. Como mencionamos en la introducción, este es el segundo video de la miniserie relacionada al plan de recolección de datos. En ese primer video, nosotros nos enfocamos específicamente en ver la plantilla del plan de recolección de datos para ver de una vez que información es la que nosotros vamos a ir llenando. Ahora en este segundo video nosotros vamos a entender un par de preguntas que quedarnos relacionados a esa plantilla, cuando el tipo de dato que nosotros vamos a recolectar es de tipo continuo, ¿verdad? Vamos a resolver preguntas como: ¿De qué tamaño es la muestra que necesitamos recolectar? ¿Con qué frecuencia deberíamos de recolectarlo? y ¿si le aplica algún tipo de estratificación a la información que deberíamos de recolectar? Quisiera agregar que el mundo de la estadística es muy completo, mucho más completo de lo que yo se los voy a estar presentando en este video. La intención en este video es presentarles una versión simplificada, pero práctica, de lo que ustedes necesitan para poder completar esta etapa del plan de recolección de datos. Y ese contexto creo que nos obliga también a repasar. la teoría de que es un dato continuo ¿verdad? Entonces vamos a ver sus características. En primer lugar, un dato continuo se refiere a que el valor que surge de un proceso de medición en un rango continuo. Eso quiere decir que normalmente yo estoy empezando en cero y avanzó 1…2…3. Puedo llegar al infinito, ¿verdad? O hasta que yo termine esa respectiva medición La segunda característica es que es divisible y puede expresarse en puntos decimales, ¿verdad? No necesariamente yo tengo un uno o un 2 exactos, yo puedo terminar en 1.75, 1.888 y así en distintas medidas decimales para la exactitud. Y, la tercera característica es que ese mismo valor puede ser expresado en diferentes tipos de medida. Entonces, si yo logré completar una medida en metros, yo puedo expresar esa medida en centímetros o en kilómetros. Un ejemplo, digamos que yo quisiera medir la altura del piso al techo de mi casa, entonces yo agarro el metro y empiezo a medir 0…1…2 y se determina que la altura son 3 m por decir un número. Esos 3 m. Podrían haber sido 2.59 2.89, ¿verdad? Habría existido un punto decimal y esos metros yo los puedo expresar en otras medidas, como en centímetros o en kilómetros de ser necesario. Podemos pensar en otros tipos de datos continuos, ¿verdad? Casi que todas las medidas de peso, de distancia, de tiempo, de temperatura, por mencionar algunos conocidos, ¿verdad? Sólo hay 2 tipos de datos que yo quisiera mencionar que se pueden prestar a la confusión de ser datos continuos y que no lo son. Uno de ellos es el porcentaje, ¿verdad? En porcentajes, nosotros tal vez podemos ver 98.5%, pero esa es una medida de proporción que normalmente se refiere al números enteros, ¿verdad? No necesariamente tendríamos que ver los valores que alcanza. Ese porcentaje para ver si es continuo o discreto y el otro tipo son conteos muy grandes de unidad, ¿verdad? Por ejemplo, si nosotros. Habláramos de 7000 millones. 500000000 son números muy muy grandes que tal vez pueden darlo en la interpretación de que son continuos por el número tan grande que es. De nuevo tendríamos que ver si cumple las otras características, ¿verdad? Si estamos hablando de personas, por ejemplo 500000000, realmente no podemos hablar de medias personas, no podemos hablar de puntos decimales y ese tipo de temas alrededor de del dato continuo. Pero bueno, yo creo que con esto, con este contexto nosotros ya podemos pasar al corazón de este vídeo que es a entender cómo vamos a calcular. Nuestra muestra, nuestra frecuencia y nuestra estratificación para estos tipos de datos continuo. Pasemos a eso. Muy bien, amigos y amigas, aquí les comparto la plantilla que con gusto les dejo el link en la descripción para que ustedes la puedan descargar y. El día de hoy vamos a estar concentrados en esta primera pestaña en la pestaña de los datos continuos y en cada una de las pestañas vamos a estar viendo principalmente las cuatro secciones que lo componen. Vamos a empezar por una muestra mínima inicial, vamos a avanzar a una muestra ideal. Ya vamos a entender también el tema de la frecuencia y el tema de la estratificación, empezando entonces con la primera sección, que es la muestra mínima inicial. El propósito de esta sección es poder brindar una herramienta donde nosotros con pocos datos podamos alcanzar ya una muestra lo suficientemente confiable como para poder empezar a generar el dato y la información que estamos buscando. Eso aplica para escenarios, por ejemplo, donde nosotros llegamos a un proceso en donde no necesariamente hay mucha reportería, muchos reportes o donde tampoco hay un experto que nos pueda dar ciertos datos con respecto al proceso y que con eso podamos calcular la muestra ideal, ¿verdad? En este caso, nosotros vamos a depender de unos pocos datos y con eso vamos a generar la primera muestra. El primer dato es que nosotros necesitamos determinar el nivel de precisión o el error de muestreo se puede conocer de ambas formas y lo que estamos tratando de mencionar aquí es qué tan exacto nosotros queremos ser al momento de recibir la información, si nosotros queremos, queremos ser muy exactos. Nuestra muestra va a ser más grande si nosotros somos no tan exactos, nuestra muestra va a ser más pequeña. Por darles el ejemplo de la medición del techo. Si yo me pusiera a medir y yo dijera, yo estoy bien con una exactitud de 10 cm, eso quiere decir que cuando yo mida el valor que yo obtenga puede estar o 10 cm más o 10 cm menos de lo que realmente es el valor. Entonces yo les decía Ah, mide 3 m, pero como es una muestra el valor correcto. Final podría estar entre los 3 m 10 o los 2 m 90, ¿verdad? El siguiente valor es la desviación estándar, aquí nos atrevemos a hacer un poco, digamos, flexibles en cómo obtenemos esa información. Nosotros lo podemos ingresar de forma manual, es decir, si logramos obtener el valor y entonces Lo estamos ingresando, pero otra forma de calcular esa desviación estándar es asumir de que el rango de la información que nosotros tenemos se comporta de una de una forma normal en una curva en forma de campana. Entonces, lo que nosotros conocemos de esa forma es que. ¿La desviación es estándar cabe 6 veces dentro de esa distribución, qué es lo que estamos tratando de decir? Es que si yo tengo yo logro recopilar 56 datos y entonces yo digo, Ah, el menor de los datos que me salió es 10. Y, el mayor de los datos que me salió de 160. Entonces, si toda la población se encuentra entre esos 2 datos y esos 2 datos tienen 6 divisiones estándar dentro de Del. Yo puedo básicamente calcular la diferencia y dividirlo dentro de 6. Para determinar esa desviación estándar estamos asumiendo muchas cosas para alcanzar ese valor, pero de nuevo ese es el propósito de esta sección, permitirnos todavía esa libertad de asumir ciertos datos para poder alcanzar la muestra. Ya sea que nosotros lo hayamos ingresado o que. Lo calculamos a través del rango, pues con el nivel de precisión y la desviación estándar nosotros ya podemos hacer los cálculos intermedios que por el momento no me voy a meter a ellos. Para alcanzar el tamaño de la muestra que esta muestra mínima inicial nos da como resultado. Vamos a pasar ya a la muestra ideal. Esto ya es más exacto de lo que nosotros tuvimos en la muestra inicial. Aquí nosotros estamos asumiendo de que ya esa muestra inicial ya se completó y que esos datos que recopilamos ya nos dan una idea más exacta para determinar si la muestra que tomamos era la mejor. O no, además que le agrega otra variable u otra característica que nos permite también. Modificar un poco el tamaño de la muestra con el fin de pues hacerlo más viable sí. No lo fue con el valor anterior. En este caso continuamos con el nivel de precisión. ¿Eso realmente es algo que se mantiene? También continuamos con el desviación estándar, es algo que se mantiene, aunque en este caso estamos asumiendo de que ya no existe ese cálculo de 6 desviaciones estándar dentro del rango, ¿verdad? Ya estamos asumiendo de que esa primera aproximación nos devolvió un valor que podemos utilizar en este caso, pues es el mismo ¿verdad? Lo dejé solo como ejemplo. Él la variable que se nos agrega es el nivel de confianza en base al nivel de confianza, nosotros podemos determinar. El tamaño de la muestra también. El valor más común es el 95%, pero cualquier valor arriba del 90% tiende a ser un valor relativamente bueno. Depende mucho de la evolución del proceso. ¿Eh? En mi en mi caso yo utilizo el 95 comúnmente, pero me atrevo a bajar hasta el 90% para aquellos procesos que ya manejan cierta estabilidad. Y que simplemente ya son ya va a alcanzar un nivel de madurez en donde yo ya puedo disminuir un poco la muestra y tener la confianza de que el valor que me esté mostrando es un valor verdadero. De nuevo con esta muestra, ya con estos 3 valores, tenemos la oportunidad de hacer los cálculos intermedios de la de la fórmula que ya está para el cálculo de muestra y nos devuelve ya un tamaño de muestra que podemos utilizar con mayor confianza. Muy bien pasemos a entender entonces la siguiente sección, que es la sección de la frecuencia. La frecuencia es dividir la muestra dentro del periodo de tiempo que esa medición haga sentido. Por ejemplo, si la medida que yo estoy haciendo es productividad diaria, quiere decir que yo necesito dividir estos 97 casos dentro de mi día laboral, ahora si la misma métrica, o mejor dicho, una métrica diferente, fuera semanal o mensual, yo dividiría esta muestra dentro de cada semana o dentro de cada mes. Eso es lo que determina la frecuencia. Ustedes en este caso, en la guía que yo les dejo aquí para calcular su muestra. Tienen distintos periodos de tiempo, pueden seleccionar anual semestral trimestral mensual en el ejemplo yo lo voy a dejar semanal. Eso significa que nosotros estamos dividiendo estos 97 casos dentro de 44 horas laborales, que es lo normal en el país donde yo vivo. Llenamos ese caso, nosotros decimos, bueno, yo el tamaño de la muestra mínima que me pidió son 97. Es importante mencionar que por temas prácticos, a veces 97 no es un número que podamos dividir correctamente. El objetivo es manejar este número que nos sabe aquí como un número mínimo, es decir que yo no debo de bajar de los 97 casos en este en este en este ejemplo. Pero si yo llego a recopilar 98, 99 a 100, 110 está bien porque ya estoy superando la muestra mínima y con eso, pues incluso estoy aumentando el nivel de confianza del valor que me devuelva. ¿Entonces, qué pasa? Qué pasa cuando yo divido 97 dentro de 44 horas laborales, lo que me devuelve es que yo debería estar recolectando 2.20 muestras por cada hora. Sí, en cada hora que yo esté en el proceso, yo debería haber recolectado 2.20. Pero esa fracción, ese punto 20 realmente a veces es difícil de comprenderlo ¿verdad? Aquí nosotros diríamos, bueno. Si yo tengo si yo estoy calificando llamadas telefónicas. Cómo vaya a calificar yo punto 20 y además es muy difícil traducir esas fracciones dentro del proceso en sí o como voy a calificar yo solo punto 20 calidad de una prenda es muy complicado. ¿Es ahí donde nosotros se aplica eso que yo les menciono, que lo que debemos respetar es el 97, siendo el mínimo en este caso lo que yo les propongo de dentro de esta guía de ayuda es que ustedes deberían de calcular 3 unidades por hora, verdad? Hace más sentido capturar más que capturar menos y en ese caso estaríamos aumentando nuestra muestra de la 97 mínimas que nos había. A 132 unidades dentro de esta muestra que estaríamos capturando de forma semanal y por último, la sección que tenemos que cubrir es el tema de la estratificación. Básicamente cuando hablamos de la estratificación, lo que estamos hablando es de que queremos asegurarnos de que ciertas grupos, ciertas características. Sean medidas y no dejarlo al hecho de que puedan llegar a salir o puedan que no. Por ejemplo, si yo estuviera haciendo una encuesta en un colegio. Aunque la proporción de hombres y mujeres pueda llegar a ser 50/50, yo me voy a asegurar de crear una estratificación en donde la mitad de la muestra sean hombres y la mitad de la muestra sean mujeres para asegurarme, tener representatividad y que no por alguna casualidad se dé que sólo sean hombres o que solo sean mujeres, ¿verdad? Tal vez hubo un feriado especial para uno de los 2 géneros y consecuentemente ese día se hizo la encuesta y capturé 100 hombres. Entonces, la estratificación es lo que nos permite asegurarnos de que esos grupos que nosotros queremos cubrir estén representados dentro de la muestra. Aquí estamos de nuevo heredando los 132 de la muestra y como parte del ejemplo yo lo que les estoy poniendo son los primeros 2 niveles de estratificación, yo les coloqué 10, pero aquí pueden tener ustedes todos los niveles de estratificación que ustedes necesiten. En el primer nivel de estratificación. Yo lo que quiero velar es de que todos los días de la semana laboral, es decir, de lunes a viernes, estén representados dentro de la muestra. Yo no quiero que de repente uno de los días no esté que yo capturé información de lunes, miércoles, jueves y viernes y martes se quedó por fuera. No, yo quiero que los 5 días de la semana aparezca. También quiero tener información de cada uno de los turnos que existen dentro de mi proceso. No quiero que de repente mi muestra salga con que tengo datos del turno uno turno 2, pero no tengo datos del turno 3. Yo quiero que los 3 turnos estén ejemplificados. El tener estas 2 estratificaciones ya me genera distintos niveles, yo me tengo que asegurar que tenga la información del lunes del turno uno, lunes, turno 2, lunes, turno 3 y tengo que tener todas esas combinaciones. En total, solo esas 2 estratificaciones, solo estos 2 niveles me dan 15 distintos tipos de combinaciones que yo necesito asegurar que estén representadas dentro de la muestra. Y, lo que yo estoy haciendo básicamente es decir, bueno, cuánto dividido yo mi tamaño de la muestra dentro de los distintos niveles de estratificación? Yo me tengo que asegurar de tener 9 unidades de muestra por cada combinación de los niveles de estratificación que tenemos. Ahora, consecuentemente para yo tener los 9 exactos yo voy a estar aumentando mi muestra de 132 unidades a 135. Con eso me aseguro de que yo cubrí no solo una frecuencia adecuada. Aquí puedo volver a regresar a revisar la frecuencia, pero también una estratificación de los grupos que yo necesito que estén representados dentro de mi muestra. Con esto cubrimos las cuatro secciones de la hoja de ayuda que les dejé. Los cubrí a grande modo más que todo, explicándoles la información que ustedes van a encontrar o van a recibir como respuesta de los datos que ustedes ingresen. Espero poder ayudarles a través de los comentarios. Si ustedes tienen alguna duda de las fórmulas o tienen alguna ayuda alguna duda, perdón. De estas distintas funcionalidades. Muy bien, amigos y amigas. Muchas gracias por quedarse hasta el final el día de hoy en forma de resumen, lo que vimos fue el segundo video de la miniserie respecto al plan de recolección de datos, cubriendo la información de cómo es que debemos llenar la plantilla con las preguntas del tamaño de la muestra, la frecuencia y la estratificación para aquellos datos que son de tipo continuo. También aprovechamos a repasar qué es un tipo de valor continuo para que todos estemos en la misma página. Espero, les haya gustado el video, siempre los invito a que se suscriban al canal que dejen sus likes, sus dislikes, sus comentarios y pues nos vemos en el próximo vídeo hasta pronto.

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll to Top