martes, 23 de mayo de 2017
miércoles, 17 de mayo de 2017
REGRESIÓN Y CORRELACIÓN LINEAL
REGRESIÓN LINEAL
Para que sirve?
¿VALOR DE LA ACCIÓN DE APPLE EN 2020?
AÑO PERIODO VALOR DLLS.
2007 1 100
2008 2 180
2009 3 90
2010 4 180
2011 5 300
2012 6 400
2017 11 153.80
Para que sirve?
¿VALOR DE LA ACCIÓN DE APPLE EN 2020?
AÑO PERIODO VALOR DLLS.
2007 1 100
2008 2 180
2009 3 90
2010 4 180
2011 5 300
2012 6 400
2017 11 153.80
jueves, 11 de mayo de 2017
PRUEBA DE HIPÓTESIS
Es
un procedimiento estadístico que permite aceptar o rechazar una afirmación
hecha con respecto a un fenómeno o suceso.
Se les denomina así a los supuestos (hipótesis) realizados con respecto a un parámetro o estadístico (media, proporción, entre otros).
PASO 1
En este paso se definen dos tipos de hipótesis:
· Ho: Hipótesis nula
· H1: Hipótesis alternativa (de la cual se sospecha pudiera ser cierta, es planteada por el investigador)
Los valores que se permiten poner en Ho: podrán llevar como operadores >=, <=, =
Los valores que se permiten poner en H1 podrán llevar como operadores <, >,

PASO 2.
El nivel de significancia, Valor Crítico (o error , también conocido como alfa ) es el complemento a la confianza
Se buscará en la tabla de Normal, si n es mayor o igual a 30
Se buscará en la taba de t-student si n es menor a 30
Si en las hipótesis se coloca Ho con igual , el valor crítico se encuentra dividiendo el nivel de confianza en decimales, entre 2. y buscando en el centro de la tabla normal. el valor del renglón y la columna será el valor crítico
Si en las hipótesis se coloca Ho con mayor o igual , o bien con menor o igual, el valor crítico se encuentra buscando 0.5 - alfa en el centro de la tabla normal. el valor del renglón y la columna será el valor crítico
Paso 3 El estadístico de Prueba

Paso 4, Para formular la regla de decisión se debe identicar en que tipo de caso se encuentra

Ejercicios de Clase
1. Se tiene una muestra de 50 elementos, cuya
media es de 9.46 y su desviación estándar de 2. Con un nivel de significación
de 0.05, pruebe si la media poblacional es menor a 10.
2. Una
muestra de 40 elementos produce una media de 16.5 y una desviación estándar de
7, con un nivel de confianza de 98%. Pruebe si la media poblacional es mayor a
15.
3. Una empresa de mercadotecnia, indica que
tiene un tiempo promedio para contestar una encuesta de 15 min, si se tarda más
la encuesta se aplica una tarifa adicional. Se toma una muestra de 35 llamadas,
y se obtiene una media de 17 minutos con una desviación estándar de 4 minutos.
Se justifica una tarifa adicional?. Con un nivel de significancia de 0.01.
4. Se pesa el contenido de 16 cajas de Corn
Flakes y se obtiene un peso de 198.93 gms. en promedio, con una desviación
estándar de 5 gms. Las cajas aseguran que contienen 200 gms. de cereal . Con un
nivel de significación de 10%.¿Se puede asegurar que las diferencias en el peso
promedio se deben al azar? (Hint: utiliza t-student)
5. Seducido por los comerciales, usted ha
sido persuadido para comprar un nuevo automóvil. Usted piensa que
tendrá que pagar $25,000 dólares por el auto que desea. Como
comprador cuidadoso, averigua el precio de 40 automóviles y
encuentra un costo promedio de $27,312 dólares, con una desviación
estándar de $8,012 dólares. Pruebe la hipótesis de que el precio
promedio es $25,000 dólares con un nivel de significancia del 10%. ¿cuál
es su conclusión?
6. El supermercado local gastó remodelando
miles de dólares durante muchas semanas. Antes de remodelar, los
recibos de la tienda promediaban $32,533 dólares por semana. Ahora
que se ha terminado la remodelación el gerente toma una muestra de 28 semanas
para ver si la construcción afectó de alguna manera el negocio. Se
reportó una media de $34,166 dólares y una desviación estándar de $12,955
dólares. ¿qué puede decidir el gerente a un nivel de significancia
del 1%?
7. Como gerente de compras para una gran
empresa de seguros usted debe decidir si actualizar o no las computadoras de la
oficina. A usted se le ha dicho que el costo promedio de las
computadoras es menor a $2,100 dólares. Una muestra de 64 minoristas
revela un precio promedio de $2,050 dólares con una desviación de $812
dólares. ¿a un nivel de significancia del 5% parece que la
información es correcta?
TAMAÑO DE MUESTRA
Una variable importante cuando se trabaja con intervalos de confianza, es el tamaño de muestra.
La decisión sobre el tamaño de muestra es muy importante para que el resultado obtenido de la muestra sea representativo de la población.
Esta decisión se basa en tres variables:
1. El margen de error que tolerará el investigador ( ε )
2. El nivel de confianza deseado (Zc)
3. La variabilidad o dispersión de la población que se estudia (σ)
Un margen de error pequeño, requiere de una muestra grande y de más tiempo y dinero para recolectarla. Un margen de error más grande, permitirá tener una muestra más pequeña y un intervalo de confianza más amplio.
Ejemplo:
Un estudiante de Administración, desea estimar la cantidad media que ganan al mes, los miembros de consejeros ciudadanos de las grandes ciudades. El error al calcular la media debe ser inferior a $100. ¿Cuál es el tamaño de muestra que se requiere?
a) Con un nivel de confianza de 95%.
b) Con un nivel de confianza de 99%
Ejercicios de Clase
2.
Al medir el tiempo de reacción en un grupo de individuos, un psicólogo estima que la desviación estándar es 0.05 segundos. ¿De qué tamaño ha de tomarse una muestra de medidas para tener una confianza del (a) 95 % y (b) 99 % de que el error no supera los 0.01 segundos?
3.
La empresa Harris Polls, Inc., se dedica a investigar amas de casa. De encuestas anteriores, se sabe que la desviación estándar del número de horas por semana que un ama de casa dedica a ver televisión es de 1.1 horas.
A Harris Polls le gustaría determinar el número promedio de horas por semana dedicadas a ver televisión por ama de casa en el país.
La precisión es importante y, en consecuencia, a Harris Polls le gustaria tener una certeza de 90% de que el número de muestra promedio de horas caerá dentro de una precisión de ± 0.3 horas del promedio nacional. Conservadoramente,?qué tamaño mínimo de muestra deberá utilizar Harris Polls?.
4.
La decisión sobre el tamaño de muestra es muy importante para que el resultado obtenido de la muestra sea representativo de la población.
Esta decisión se basa en tres variables:
1. El margen de error que tolerará el investigador ( ε )
2. El nivel de confianza deseado (Zc)
3. La variabilidad o dispersión de la población que se estudia (σ)
Un margen de error pequeño, requiere de una muestra grande y de más tiempo y dinero para recolectarla. Un margen de error más grande, permitirá tener una muestra más pequeña y un intervalo de confianza más amplio.
Ejemplo:
Un estudiante de Administración, desea estimar la cantidad media que ganan al mes, los miembros de consejeros ciudadanos de las grandes ciudades. El error al calcular la media debe ser inferior a $100. ¿Cuál es el tamaño de muestra que se requiere?
a) Con un nivel de confianza de 95%.
Ejercicios de Clase
1. Una empresa eléctrica fabrica focos que
tienen una duración aproximadamente normal con una desviación estándar de 40
horas.
a) ¿De qué tamaño se necesita una muestra si se
desea tener 90% de confianza que la media real esté dentro de un margen de 10 horas de la media real?
b) ¿Qué pasaría
si en lugar de tener un error de estimación de 10 horas sólo se requiere un
error de 5 horas?
2.
Al medir el tiempo de reacción en un grupo de individuos, un psicólogo estima que la desviación estándar es 0.05 segundos. ¿De qué tamaño ha de tomarse una muestra de medidas para tener una confianza del (a) 95 % y (b) 99 % de que el error no supera los 0.01 segundos?
3.
La empresa Harris Polls, Inc., se dedica a investigar amas de casa. De encuestas anteriores, se sabe que la desviación estándar del número de horas por semana que un ama de casa dedica a ver televisión es de 1.1 horas.
A Harris Polls le gustaría determinar el número promedio de horas por semana dedicadas a ver televisión por ama de casa en el país.
La precisión es importante y, en consecuencia, a Harris Polls le gustaria tener una certeza de 90% de que el número de muestra promedio de horas caerá dentro de una precisión de ± 0.3 horas del promedio nacional. Conservadoramente,?qué tamaño mínimo de muestra deberá utilizar Harris Polls?.
4.
El tiempo de conexión a internet de los alumnos de cierta universidad sigue una distribución normal con desviación típica de 15 minutos. Para estimar la media del tiempo de conexión, se quiere calcular un intervalo de confianza que tenga una amplitud menor o igual a 6 minutos, con un nivel de confianza del 90 %. Determina cuál es el tamaño mínimo de la muestra que es necesario observar.
5.Se va a realizar una encuesta entre la población española mayor de edad. Si se admite un margen de error del 2 %, ¿a cuántas personas habrá que entrevistar con un nivel de confianza del 95 %?
6.
Se sabe que la desviación típica del peso de los individuos de una población es 6 kg. Calcula el tamaño de la muestra que se ha de considerar para, con un nivel de confianza del 99%, estimar el peso medio de los individuos de la población con un error inferior a 1 kg.
miércoles, 10 de mayo de 2017
TEOREMA DEL LÍMITE CENTRAL E INTERVALOS DE CONFIANZA
Si una población tiene media μ y desviación σ, y tomamos muestras de tamaño n (n > 30, ó cualquier tamaño si la población es "normal"), las medias de estas muestras siguen aproximadamente la distribución Normal
Consecuencias
2.Permite calcular la probabilidad de que la suma de los elementos de una muestra esté, a priori, en un cierto intervalo.
Tema:Intervalo de Confianza
Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que posiblemente incluya el valor de un parámetro de población desconocido. La probabilidad específica recibe el nombre de Nivel de confianza
Fórmula
Se calcula mediante un estimador puntual y un margen de error
NIVEL DE CONFIANZA ZC
Nivel de confianza
|
Zc
|
80%
|
1.28
|
90%
|
1.65
|
94%
|
1.88
|
95%
|
1.96
|
96%
|
2.05
|
99%
|
2.58
|
Ejercicios:
2. Se toma una muestra de 81 observaciones de una población normal, con una desviación estándar de 5. La media de la muestra es 40. Determine el intervalo de confianza de 95% para la media poblacional
3. La industria estadounidense de lácteos desea calcular el consumo promedio de leche por año. Una muestra de 16 personas revela que el consumo promedio anual es 60 galones, con una desviación estándar de 20 galones. Obtenga el intervalo de confianza de 90%
4. El señor Ramírez planea comprar una flota de nuevos taxis para sus operaciones en la ciudad. La decisión depende de si el rendimiento del auto en consideración es por lo menos de 27.5 millas por galón de gasolina. Los 36 carros que prueba su compañía reportan una media de 25.6 millas por galón (mpg), con una desviación estándar de 3.5 mpg. A un nivel de confianza del 99%. ¿Qué le aconsejaría al sr. Ramírez que hiciera?
5.Cien latas de 16 onzas de salsa de tomate jake´s mom´s tienen un promedio de 15.2 onzas. La desviación estándar poblacional en peso es de 0.96 onzas. ¿a un nivel de confianza del 95% las latas parecen estar llenas con un promedio de 16 onzas? Explique
6. El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una ley normal con media desconocida y desviación de 0.5 minutos. Para una muestra aleatoria de 25 clientes se obtuvo un tiempo medio de 5.2 minutos. Calcula el intervalo de confianza al nivel del 95% para el tiempo medio que se tarda en cobrar a los clientes.
DISTRIBUCIÓN DE MUESTREO
Distribución
de muestreo
Razones
para muestrear
Cuando se estudian las
características de una población, existen diversas razones prácticas por las
cuales deben seleccionarse muestras de una población para observar y medir. He
aquí algunas razones para muestrear:
Establecer contacto con la población
requeriría mucho tiempo. Por ejemplo, si un candidato para un
puesto federal desea determinar las posibilidades que tiene de resultar electo
y utiliza una encuesta de muestreo tardaría uno o dos días, pero si desea
ponerse en contacto con toda la población en edad de votar requeriría muchos
años.
El costo de estudiar todos los elementos
de una población resultaría prohibitivo.
Es imposible verificar de manera física
todos los elementos de la población. Algunas poblaciones son
infinitas. Sería imposible verificar toda el agua de un lago en lo que se
refiere a niveles de bacterias, así que se eligen muestras en diversos lugares.
Algunas pruebas son de naturaleza
destructiva. Si
los catadores de vino en California, se bebieran todo el vino para evaluar la
vendimia acabarían con la cosecha y no quedaría nada disponible para la venta.
Los
resultados de la muestra son adecuados. Por
ejemplo, si el gobierno federal utiliza una muestra de tiendas comestibles
distribuidas en Estados Unidos para determinar el índice mensual de precios de
alimentos como pan, frijol y leche.
Resulta poco probable que la inclusión de todas las tiendas de
comestibles de Estados Unidos influya significativamente en el índice.
DISTRIBUCIÓN MUESTRAL
En las poblaciones es necesario estar seguro que las
muestras son representativas y que realmente indicaran el comportamiento de la
población.
Ejemplo:
No
confundamos
N=
es el tamaño de la población = 4
n=
es el tamaño de la muestra =2
k=
es el número de muestras posibles = 4C2= 6
Las distribuciones muestrales también tienen varianza
La varianza mide la dispersión de las observaciones individuales (medias
muestrales) alrededor de su media (gran media)
Ejercicio
Las ventas en miles de
dólares para East Coast Manufacturing(ECM), durante los últimos 5 meses fueron:
68, 73, 65, 80 y 72
a)
Si
se toma una muestra de n=3, ¿cuántas opciones diferentes se pueden tener? 10
b)
¿Cuáles
son las posibles muestras?
c)
Calcula
la media de cada muestra, el error de de muestreo
d)
Calcula
la media de las medias muestrales (gran media)
e)
Calcula
la media poblacional y compara la media de las medias muestrales (gran media)
con la media poblacional. Concluye.
f)
Elabora
la distribución muestral de medias en tabla y Gráfica.
g)
Calcula
la desviación estándar poblacional y el desviación estándar muestral y compara
estas medidas.
EJERCICIO DE CLASE
Una
población de las producciones semanales de una fábrica en miles de toneladas
es de 100, 200, 400, 600 y 800
|
a. Si se toma una muestra de n=2, ¿de
cuántas maneras se puede seleccionar?
b. ¿Cuáles son las posibles muestras?
c. Calcula la media de cada muestra y
el error de muestreo.
d. Calcula la media de las medias
muestrales (gran media)
e. Calcula la media poblacional y
compara la media de las medias muestrales con la media poblacional. Concluye.
f. Elabora la distribución muestral de
medias en tabla y Gráfica.
g. Calcula la desviación estándar
poblacional y el error estándar y compara estas medidas.
TAREA
Se considera una población al
número de faltas al semestre de un grupo remedial que consta de N=5 alumnos.
3, 2, 1, 4 y 0
|
Realice una
distribución muestral con n=2 y después con n=3
a) ¿de cuántas maneras se puede
seleccionar una muestra?
b) ¿Cuáles son las posibles muestras?
c) Calcula la media de cada muestra y
el error de muestreo.
d) Calcula la media de las medias
muestrales (gran media)
e) Calcula la media poblacional y compara
la media de las medias muestrales con la media poblacional. Concluye.
f) Elabora la distribución muestral de
medias en tabla y Gráfica.
g) Calcula la desviación estándar
poblacional y el error estándar y compara estas medidas.
Suscribirse a:
Entradas (Atom)