miércoles, 17 de mayo de 2017

REGRESIÓN Y CORRELACIÓN LINEAL

REGRESIÓN LINEAL

Para que sirve?

¿VALOR DE LA ACCIÓN DE APPLE EN 2020?
               AÑO   PERIODO    VALOR DLLS. 
              2007           1                 100
              2008           2                 180
              2009           3                   90
              2010           4                 180
              2011           5                 300
              2012           6                 400
              2017         11                 153.80









jueves, 11 de mayo de 2017

PRUEBA DE HIPÓTESIS



Es un procedimiento estadístico que permite aceptar o rechazar una afirmación hecha con respecto a un fenómeno o suceso.
Se les denomina así a los supuestos (hipótesis) realizados con respecto a un parámetro o estadístico (media, proporción, entre otros).

PASO 1
En este paso se definen dos tipos de hipótesis:
·         Ho: Hipótesis nula
·         H1: Hipótesis alternativa (de la cual se sospecha pudiera ser cierta, es planteada por el investigador)

Los valores que se permiten poner en  Ho: podrán llevar como operadores >=, <=, =
Los valores que se permiten poner en H1 podrán llevar  como operadores <, >, 


PASO 2. 
El nivel de significancia, Valor Crítico  (o error , también conocido como  alfa  ) es el complemento a la confianza

Se buscará en la tabla de Normal, si n es mayor o igual a 30
Se buscará en la taba de t-student  si n es menor a 30

Si en las hipótesis se coloca Ho con igual , el valor crítico se encuentra dividiendo  el nivel de confianza en decimales, entre 2. y buscando en el centro de la tabla normal. el valor del renglón y la columna será el valor crítico


Si en las hipótesis se coloca Ho con mayor o igual ,  o bien con menor o igual, el valor crítico se encuentra buscando 0.5 - alfa en el centro de la tabla normal. el valor del renglón y la columna será el valor crítico


Paso 3 El estadístico de Prueba



Paso 4, Para formular la regla de decisión se debe identicar en que tipo de caso se encuentra





Paso 5. Tomar una decisión sobre Ho
Ejercicios de Clase 


1. Se tiene una muestra de 50 elementos, cuya media es de 9.46 y su desviación estándar de 2. Con un nivel de significación de 0.05, pruebe si la media poblacional es menor a 10.

2.  Una muestra de 40 elementos produce una media de 16.5 y una desviación estándar de 7, con un nivel de confianza de 98%. Pruebe si la media poblacional es mayor a 15.

3. Una empresa de mercadotecnia, indica que tiene un tiempo promedio para contestar una encuesta de 15 min, si se tarda más la encuesta se aplica una tarifa adicional. Se toma una muestra de 35 llamadas, y se obtiene una media de 17 minutos con una desviación estándar de 4 minutos. Se justifica una tarifa adicional?. Con un nivel de significancia de 0.01.

4. Se pesa el contenido de 16 cajas de Corn Flakes y se obtiene un peso de 198.93 gms. en promedio, con una desviación estándar de 5 gms. Las cajas aseguran que contienen 200 gms. de cereal . Con un nivel de significación de 10%.¿Se puede asegurar que las diferencias en el peso promedio se deben al azar? (Hint: utiliza t-student)



5. Seducido por los comerciales,  usted ha sido persuadido para comprar un nuevo automóvil.  Usted piensa que tendrá que pagar $25,000 dólares por el auto que desea.  Como comprador cuidadoso,  averigua el precio de 40 automóviles y encuentra un costo promedio de $27,312 dólares,  con una desviación estándar de $8,012 dólares.  Pruebe la hipótesis de que el precio promedio es $25,000 dólares con un nivel de significancia del 10%.  ¿cuál es su conclusión?

6. El supermercado local gastó remodelando miles de dólares durante muchas semanas.  Antes de remodelar,  los recibos de la tienda promediaban $32,533 dólares por semana.  Ahora que se ha terminado la remodelación el gerente toma una muestra de 28 semanas para ver si la construcción afectó de alguna manera el negocio.  Se reportó una media de $34,166 dólares y una desviación estándar de $12,955 dólares.  ¿qué puede decidir el gerente a un nivel de significancia del 1%?

7. Como gerente de compras para una gran empresa de seguros usted debe decidir si actualizar o no las computadoras de la oficina.  A usted se le ha dicho que el costo promedio de las computadoras es menor a $2,100 dólares.  Una muestra de 64 minoristas revela un precio promedio de $2,050 dólares con una desviación de $812 dólares.  ¿a un nivel de significancia del 5% parece que la información es correcta?

TAMAÑO DE MUESTRA

Una variable importante cuando se trabaja con intervalos de confianza, es el tamaño de muestra.

La decisión sobre el tamaño de muestra es muy importante para que el resultado obtenido de la muestra sea representativo de la población.

Esta decisión se basa en tres variables:
1. El margen de error que tolerará el investigador ( ε )
2. El nivel de confianza deseado (Zc)
3. La variabilidad o dispersión de la población que se estudia (σ)

Un margen de error pequeño, requiere de una muestra grande y de más tiempo y dinero para recolectarla. Un margen de error más grande, permitirá tener una muestra más pequeña y un intervalo de confianza más amplio.




Ejemplo:

Un estudiante de Administración, desea estimar la cantidad media que ganan al mes, los miembros de consejeros ciudadanos de las grandes ciudades. El error al calcular la media debe ser inferior a $100.  ¿Cuál es el tamaño de muestra que se requiere?
a) Con un nivel de confianza de 95%.


b) Con un nivel de confianza de 99%

Ejercicios de Clase


1.  Una empresa eléctrica fabrica focos que tienen una duración aproximadamente normal con una desviación estándar de 40 horas.
a) ¿De qué tamaño se necesita una muestra si se desea tener 90% de confianza que la media real esté dentro de un  margen de 10 horas de la media real?
b) ¿Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo se requiere un error de 5 horas?




2. 
Al medir el tiempo de reacción en un grupo de individuos, un psicólogo estima que la desviación estándar es 0.05 segundos. ¿De qué tamaño ha de tomarse una muestra de medidas para tener una confianza del (a) 95 % y (b) 99 % de que el error no supera los 0.01 segundos? 


3.  
La empresa Harris Polls, Inc., se dedica a investigar amas de casa. De encuestas anteriores, se sabe que la desviación estándar del número de horas por semana que un ama de casa dedica a ver televisión es de 1.1 horas. 
A Harris Polls le gustaría determinar el número promedio de horas por semana dedicadas a ver televisión por ama de casa en el país.
La precisión es importante y, en consecuencia, a Harris Polls le gustaria tener una certeza de 90% de que el número de muestra promedio de horas caerá dentro de una precisión de ± 0.3 horas del promedio nacional. Conservadoramente,?qué tamaño mínimo de muestra deberá utilizar Harris Polls?.

4. 

El tiempo de conexión a internet de los alumnos de cierta universidad sigue una distribución normal con desviación típica de 15 minutos. Para estimar la media del tiempo de conexión, se quiere calcular un intervalo de confianza que tenga una amplitud menor o igual a 6 minutos, con un nivel de confianza del 90 %. Determina cuál es el tamaño mínimo de la muestra que es necesario observar.

5. 

Se va a realizar una encuesta entre la población española mayor de edad. Si se admite un margen de error del 2 %, ¿a cuántas personas habrá que entrevistar con un nivel de confianza del 95 %?


6. 

Se sabe que la desviación típica del peso de los individuos de una población es  6 kg.  Calcula el tamaño de la muestra que se ha de considerar para, con un nivel de confianza del  99%,  estimar el peso medio de los individuos de la población con un error inferior a  1 kg. 


miércoles, 10 de mayo de 2017

TEOREMA DEL LÍMITE CENTRAL E INTERVALOS DE CONFIANZA


Si una población tiene media μ y desviación σ, y tomamos muestras de tamaño n (n > 30, ó cualquier tamaño si la población es "normal"), las medias de estas muestras siguen aproximadamente la distribución Normal

Consecuencias

1.Permite averiguar la probabilidad de que la media de una muestra concreta esté en un cierto intervalo.
2.Permite calcular la probabilidad de que la suma de los elementos de una muestra esté, a priori, en un cierto intervalo.
  3.Inferir la media de la población a partir de una muestra.

Tema:Intervalo de Confianza

Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la muestra, que posiblemente incluya el valor de un parámetro de población desconocido.  La probabilidad específica recibe el nombre de Nivel de confianza



Fórmula
Se calcula mediante un estimador puntual y un margen de error

NIVEL DE CONFIANZA ZC
Nivel de confianza
Zc
80%
1.28
90%
1.65
94%
1.88
95%
1.96
96%
2.05
99%
2.58




Ejercicios:

1. Se toma una muestra de 49 observaciones de una población normal con una desviación estándar de 10. La media de la muestra es de 55. Determine el intervalo de confianza del 99% para la media poblacional.

2. Se toma una muestra de 81 observaciones de una población normal, con una desviación estándar de 5. La media de la muestra es 40. Determine el intervalo de confianza de 95% para la media poblacional

3. La industria estadounidense de lácteos desea calcular el consumo promedio de leche por año. Una muestra de 16 personas revela que el consumo promedio anual es 60 galones, con una desviación estándar de 20 galones. Obtenga el intervalo de confianza de 90%

4. El señor Ramírez planea comprar una flota de nuevos taxis para sus operaciones en la ciudad.  La decisión depende de si el rendimiento del auto en consideración es por lo menos de 27.5 millas por galón de gasolina.  Los 36 carros que prueba su compañía reportan una media de 25.6 millas por galón (mpg),  con una desviación estándar de 3.5 mpg.  A un nivel de confianza del 99%.  ¿Qué le aconsejaría  al sr. Ramírez que hiciera?

5.Cien latas de 16 onzas de salsa de tomate jake´s mom´s tienen un promedio de 15.2 onzas.  La desviación estándar poblacional en peso es de 0.96 onzas.  ¿a un nivel de confianza del 95% las latas parecen estar llenas con un promedio de 16 onzas? Explique

6. El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una ley normal con media desconocida y desviación de 0.5 minutos. Para una muestra aleatoria de 25 clientes se obtuvo un tiempo medio de 5.2 minutos. Calcula el intervalo de confianza al nivel del 95% para el tiempo medio que se tarda en cobrar a los clientes.




DISTRIBUCIÓN DE MUESTREO


Distribución de muestreo


Razones para muestrear
Cuando se estudian las características de una población, existen diversas razones prácticas por las cuales deben seleccionarse muestras de una población para observar y medir. He aquí algunas razones para muestrear:
   Establecer contacto con la población requeriría mucho tiempo. Por ejemplo, si un candidato para un puesto federal desea determinar las posibilidades que tiene de resultar electo y utiliza una encuesta de muestreo tardaría uno o dos días, pero si desea ponerse en contacto con toda la población en edad de votar requeriría muchos años.
     El costo de estudiar todos los elementos de una población resultaría prohibitivo.
    Es imposible verificar de manera física todos los elementos de la población. Algunas poblaciones son infinitas. Sería imposible verificar toda el agua de un lago en lo que se refiere a niveles de bacterias, así que se eligen muestras en diversos lugares.
       Algunas pruebas son de naturaleza destructiva.  Si los catadores de vino en California, se bebieran todo el vino para evaluar la vendimia acabarían con la cosecha y no quedaría nada disponible para la venta.
        Los resultados de la muestra son adecuados.  Por ejemplo, si el gobierno federal utiliza una muestra de tiendas comestibles distribuidas en Estados Unidos para determinar el índice mensual de precios de alimentos como pan, frijol y leche.  Resulta poco probable que la inclusión de todas las tiendas de comestibles de Estados Unidos influya significativamente en el índice.

DISTRIBUCIÓN MUESTRAL
En las poblaciones es necesario estar seguro que las muestras son representativas y que realmente indicaran el comportamiento de la población.


Ejemplo:






No confundamos
N= es el tamaño de la población = 4
n= es el tamaño de la muestra =2
k= es el número de muestras posibles = 4C2= 6

Las distribuciones muestrales también tienen varianza
La varianza mide la dispersión de las observaciones individuales (medias muestrales) alrededor de su media (gran media)

Ejercicio
Las ventas en miles de dólares para East Coast Manufacturing(ECM), durante los últimos 5 meses fueron: 68, 73, 65, 80 y 72
a)     Si se toma una muestra de n=3, ¿cuántas opciones diferentes se pueden tener? 10
b)     ¿Cuáles son las posibles muestras?
c)     Calcula la media de cada muestra, el error de de muestreo
d)     Calcula la media de las medias muestrales (gran media)
e)     Calcula la media poblacional y compara la media de las medias muestrales (gran media) con la media poblacional.  Concluye.
f)      Elabora la distribución muestral de medias en tabla y Gráfica.
g)     Calcula la desviación estándar poblacional y el desviación estándar muestral y compara estas medidas.

EJERCICIO DE CLASE
Una población de las producciones semanales de una fábrica en miles de toneladas es de 100, 200, 400, 600 y 800
Realice una distribución muestral con n=2

a.    Si se toma una muestra de n=2, ¿de cuántas maneras se puede seleccionar?
b.    ¿Cuáles son las posibles muestras?
c.    Calcula la media de cada muestra y el error de muestreo.
d.   Calcula la media de las medias muestrales (gran media)
e.    Calcula la media poblacional y compara la media de las medias muestrales con la media poblacional.  Concluye.
f.     Elabora la distribución muestral de medias en tabla y Gráfica.
g.   Calcula la desviación estándar poblacional y el error estándar y compara estas medidas.



TAREA
Se considera una población al número de faltas al semestre de un grupo remedial que consta de N=5 alumnos.

3, 2, 1, 4 y 0



Realice una distribución muestral con n=2 y después con n=3
a)   ¿de cuántas maneras se puede seleccionar una muestra?
b)   ¿Cuáles son las posibles muestras?
c)   Calcula la media de cada muestra y el error de muestreo.
d)   Calcula la media de las medias muestrales (gran media)
e)   Calcula la media poblacional y compara la media de las medias muestrales con la media poblacional.  Concluye.
f)    Elabora la distribución muestral de medias en tabla y Gráfica.
g)   Calcula la desviación estándar poblacional y el error estándar y compara estas medidas.