100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Apuntes completos DISEÑOS de investigación y análisis de datos $7.07   Add to cart

Class notes

Apuntes completos DISEÑOS de investigación y análisis de datos

1 review
 206 views  7 purchases
  • Course
  • Institution
  • Book

Libro completo cubierto. He quitado muchos ejemplos (reseñando la página en el libro) porque a mi parecer es mucho más cómodo tener por una parte la teoría y por otro trabajar la práctica. Yo en mi caso prefiero ver a profesores y no utilizo los ejemplos del libro para nada. Si recomiendo bus...

[Show more]

Preview 4 out of 42  pages

  • December 7, 2022
  • 42
  • 2022/2023
  • Class notes
  • -
  • All classes

1  review

review-writer-avatar

By: arianareyees • 1 year ago

avatar-seller
🧠
🧠
🧠
DiSEÑOS DE INVESTIGACIÓN Y AD
UNED, 2º CURSO, 1C




🧠 🧠
🧠

, Diseños Raquel Lamuño 1 de 41




ÍNDiCE
T1: ESTIMACIÓN DE PARÁMETROS Y CONTRASTE DE HIPÓTESI 2
Distribuciones muestrales 2
La estadística inferencial 4
T2: CONTRASTE DE HIPÓTESIS EN LOS DISEÑOS DE UNA MUESTR 11
1. Contraste sobre la media poblacional 11
Conocida la varianza poblacional 11
Desconocida la varianza poblacional 11
2. Contraste sobre la proporción poblacional 12
3. Contraste sobre la varianza poblacional 12
4. Cálculo de la potencia del contraste 13
5. Nivel crítico p y errores en los contrastes 13
6. Resumen 14
T3: ANÁLISIS DE DATOS PARA DISEÑOS DE DOS GRUPOS. MUESTRAS INDEP 15
1. Muestras indep. o relacionadas 15
3. Contrastes de hipótesis sobre dos medias en muestras indep. 15
4. Contraste de hipótesis sobre dos varianzas en muestras indep. p108, solo ejemplo 16
5. Contrastes de hipótesis sobre dos proporciones en muestras indep. 16
6. Tamaño del efecto 16
7. Resumen 16
T4: ANÁLISIS DE DATOS PARA DISEÑOS DE DOS GRUPOS. MUESTRAS RELACIONADA 19
1. Contraste de hipótesis sobre dos medias en muestras relacionadas 19
2. Resumen 20
T5: DISEÑOS DE +2 GRUPOS INDEP 22
1. Conceptos básicos del análisis de varianza 22
2. Fundamentos del análisis de varianza 22
3. Análisis de varianza de un factor 23
Modelo de Efectos jos 23
Modelo de Efectos aleatorios 25
Cálculo del ANOVA mediante el método clásico 25
Cálculo del ANOVA mediante las razones básicas 25
4. Comparaciones múltiples 25
Comparaciones plani cadas o apriori 25
Comparaciones no plani cadas, a posteriorio post hoc / simplemente múltiples para algunos autores 25
5. Supuestos del análisis de varianza 26
T6: DISEÑOS DE +2 GRUPOS CON MUESTRAS RELACIONADA 27
1. Diseños de un factor intra-sujetos 27
Análisis de datos mediante razones básicas 29
T7: DISEÑOS DE +2 GRUPOS INDEP. ANÁLISIS DE LA VARIANZA DE 2 FACTORE 31
1. ¿Qué inf. proporciona un diseño factorial? 31
2. Reglas para el cálculo de los efectos principales y del efecto de interacción 32
Diseño y notación 32
Variabilidad del sistema 32
Proceso de cálculo del ANOVA de dos factores 33
Desarrollo del ANOVA de 2 factores con un ejemplo numérico 33
3. El modelo estadístico 34
4. Análisis de la interacción 34
¿Cómo se actúa cuando no es signi cativo el efecto de la interacción? 35
5. Resumen 35
T8: ANÁLISIS DE REGRESIÓ 36
1. Análisis de Regresión Simple 36
Coe cientes de la regresión lineal simple 36
Bondad de Ajuste de la Recta de Regresión 36
Inferencias sobre correlación y regresión 37
2. Análisis de Regresión Múltiple 38
Regresión con dos VI 38
Ajuste del modelo. Medidas de asociación 39
Correlación Semiparcial y Parcial 39




fi fi fi fi fi N . S S A . S S

, Diseños Raquel Lamuño 2 de 41


T1: ESTIMACIÓN DE PARÁMETROS Y CONTRASTE DE HIPÓTESIS
En la asignatura de 1º se han estudiado procedimientos para organizar, representar y describir un conjunto de datos:
• Mediante creación de tablas, grá cos, calculando medidas q nos informan de su tendencia central, variabilidad, forma… =
conocimiento e caz de las carac. de la muestra.
• Vamos a dar un paso adelante para utilizar esta inf. para q, mediante la inferencia y el contraste de hipótesis, podamos hacer
generalizaciones referidas a la población a partir del análisis descriptivo de una, dos, o más muestras. Este conocimiento siempre
será aprox. o, inferencias probabilísticas.

En este 1er capítulo abordamos los fundamentos de la inferencia estadística, rama de la Estadística q permite realizar a rmaciones
sobre una población a partir de datos en alguna de sus muestras. Hay q seguir unas pautas para q las a rmaciones y decisiones q
tomemos, sean lo + racionales posibles: extracción de la muestra > medición de la(s) carac. de interés > cálculo del estadístico
apropiado en la muestra para inferir el parámetro de la población > evaluación probabilística del error q podemos cometer.

Distribuciones muestrales
La inferencia estadística es una forma de razonamiento q va de lo concreto a lo general. El investigador, para con rmar o refutar las
hipótesis teóricas q maneja, extrae una muestra representativa de la población objeto y sobre ella realiza las mediciones de las carac.
relevantes para él. Para cada cara. se obtiene 1/+ valores numéricos, estadísticos = cualquiera (medidas de tendencia central, de posición,
de variabilidad, de asimetría, de relación, de regresión, etc.). Y es a partir de ellos, obtenidos en la muestra (lo concreto) q tiene q realizar
a rmaciones sobre los valores de los parámetros de la población (lo general). Pero ¿cómo se realiza ese saltσ? Hay q situarse en un
plano hipotético en el q pudiéramos trabajar con todas las posibles muestras del mismo tamaño, n, q se pueden extraer de una
población de tamaño N (siendo, obviamente, N >n).

Razonando en el q pudiéramos extraer todas las muestras de la población, en cada una se realizaría la medición de la o las V y se
obtendría un estadístico (media, proporción, varianza, correlación…) cuyo valor será dif. (o igual) al obtenido en cualquiera de las otras
posibles muestras ya q, depende de los datos q la componen. Es decir, el estadístico en cada muestra se comporta como una V
aleatoria, y sus dif. valores forman una distribución de probabilidad = distribución muestral. Como en toda distribución de probabili-
dad, tb de la distribución muestral de uno de estos estadísticos obtenido para todas las muestras posibles, podemos obtener su
media y desviación típica. Esta última, al estar referida a la distribución muestral de un estadístico = error típico del estadístico.

De modo q el concepto de distribución muestral hay q distinguirlo de otros tipos de distribuciones;
- Poblacional: se re ere a la distribución de los datos indiv. en la población,
- En la muestra: distribución de los datos indiv. q constituyen la muestra.

Vamos a abordar cómo son las distribuciones muestrales de 3 estadísticos muy utilizados en la investigación social: recordando q las
2 primeras ya fueron tratadas. Veremos cómo la forma q adopta la distribución muestral depende de la forma q adopte la distribución
poblacional.

Distribución muestral de la media
Consideremos una población formada por todos los estudiantes universitarios de
una det. comunidad de los q podemos conocer, a partir de sus datos de la
matrícula, su edad. A partir de estos datos podemos calcular su edad media y la
varianza de esta misma V (edad), valores q representamos por μ y σ2,
respectivamente (si dispusiéramos de +1 V, sería recomendable indicar, mediante
subíndices, a qué V se corresponde cada media y varianza; μedad y σ2edad). De esta
población podemos extraer una muestra de, 100 estudiantes y calcular su media
(Y) y desviación típica (Sy) si representamos la V con la letra Y. Pero esta muestra
no es la única posible. Se pueden extraer muchas otras dif., todas del mismo
tamaño (n = 100), y en cada una calcular su media y desviación típica q pueden
variar = q con las puntuaciones de todas las medias se origina otra distribución =
distribución muestral de la media. Con el mismo procedimiento se obtendría la
distribución muestral de la desviación típica o de cualquier otro estadístico, como
la proporción, correlación de Pearson… y corresponde a la distribución de
probabilidad de un estadístico q se obtiene al calcularlo en todas las posibles
muestras del mismo tipo y tamaño, n, extraídas de una población N.
Proceso de construcción de la distribución muestral para el
estadístico media. A la izq; representación de una V en una
población N. Esta es normal con media 100 y Sy=15. A la Podemos suponer q la distribución muestral de la media es normal, o se aproxima
derecha; distribución muestral teórica del estadístico Media su cientemente a la normalidad, cuando se cumple al menos 1 de las siguientes
calculado en todas las muestras posibles de n. Ambas tienen la
condiciones:
misma media pero la distribución muestral tiene una variabili-
dad muy inferior a la variabilidad de la distribución poblacional. • La V en la población se distribuye normalmente.
• El tamaño de la muestra es =/> a 30 observaciones. En este caso, la forma de
la distribución, puede ser normal o de otro tipo (Teorema Central del Límite).

Si se desconoce la forma de la distribución poblacional de la V, la forma de la distribución muestral de la media depende del tamaño
de la muestra. El Teorema Central del Límite (TCL) establece q sin importar la forma de la distribución poblacional, la distribución
muestral de la media se aproximará a la normal a medida q ↑ el tamaño de la muestra. Y el tamaño q debe tener la muestra para q la
distribución muestral se considere normal depende de la forma q tenga la distribución poblacional. Cuanto + se aleje ésta de la
distribución normal mayor tendrá q ser el tamaño de la muestra. Por otro lado, si asumimos q la mayoría de las V q se utilizan en
CCSS no se alejan en exceso de la distribución normal, vamos a considerar q una muestra es grande a partir de n > 30.




fifi fi fi fi fi fi fi

, Diseños Raquel Lamuño 3 de 41

Cuando realizamos inferencia estadística sobre la media aritmética, siempre ha de cumplirse al menos 1 de las 2 condiciones, pero
procederemos de forma dif. en función de si la varianza poblacional es conocida o desconocida.
1. Si conocemos la desviación típica poblacional o, y podemos asumir q la v en la población se distribuye normalmente, o bien
n > 30, entonces consideramos q la distribución muestral del estadístico media es tb normal, cuya media y desviación típica
(o error típico de la media) son, respectivamente:




Para diferenciar los parámetros poblacionales (μy y σy ) de los de la distribución muestral de la media (μy y σy) hemos incluido
en esta última un subíndice q señala el estadístico sobre el q se ha calculado la distribución muestral.
Obviamente, si tipi camos el valor del estadístico media Y q se distribuye normalmente, obtenemos la V Z:




cuya distribución será normal, N(0,1) = conocer mediante las tablas de la curva normal la probabilidad asociada a cada valor
del estadístico Y en la distribución muestral, o la distancia, en términos probabilísticos, desde la media de una muestra
concreta, Y, a la media de la población μ (q coincide con la media de la distribución muestral, μy).

2. Si, como es habitual en la práctica, se desconoce la varianza de la V en la población, pero podemos asumir q la distribución
poblacional es normal o bien n > 30, los estudios por W.S. Gosset al nal del sXIX demostraron q en estas circunstancias la
distribución muestral de la media es una distribución dif. de la normal, distribución t de Student. La V sigue el modelo t de
Student con n—1 grados de libertad, donde Sn-1 y 5, son, respectivamente, la cuasidesviación típica y la desviación típica de
la muestra.




Recuerde q en Introducción al AD, se describían las carac. de las distribuciones Z y t, indicando q la distribución normal estándar es simétrica con media
0 y varianza 1 mientras q la distribución t de Student es tb simétrica con media 0 pero varianza igual a n/(n-2). A medida q ↑ el valor de n, la varianza de
la distribución t se va aproximando a 1 = t se irá aproximando a la normal Z. Podemos consultar valores para distribuciones t hasta 100 grados de
libertad; para dichos grados los valores q nos ofrece la tabla son muy parecidos a los de la curva normal tipi cados, por lo q, cuando los grados de
libertad sean ↑ a 100, podemos utilizar los valores de la tabla de curva normal.
*Ej P9 y 10 del manual :)

Distribución muestral de la proporción
En las CCSS es habitual dirigir nuestra atención a situaciones en las q no estamos interesados en la media de la muestra sino q
queremos investigar la proporción de personas q votarán a un det. partido político, q presentan un det. síntoma… q cumplen una det.
condición a la q genéricamente llamaremos «éxito» = tenemos q apoyarnos en la distribución muestral de la proporción, la cual se
genera con la misma lógica q la distribución muestral de la media, con la única diferencia de q al extraer todas las posibles muestras
n, el estadístico q se calcula en cada una es la proporción p = x/n (x = nº de datos de la muestra q cumplen la condición designada como
«éxito» y n= tamaño de la muestra).
Entonces, si llamamos π a la proporción de casos q cumplen una determinada condición en una población de tamaño N y extraemos
todas las posibles muestras aleatorias n, en la q de nimos la V p = «Proporción de aciertos», la distribución muestral de la
proporción es la distribución de probabilidad del conjunto de todas las proporciones, p, en todas las muestras posibles n, extraídas de
una población N. La V aleatoria p, sigue el modelo de probabilidad binomial, cuya media y desviación típica son, respectivamente:




Como sabemos, las probabilidades asociadas a cada valor de p se pueden buscar en las tablas de distribución binomial con
parámetros n y π.
Por otra parte, la distribución binomial —igual q χ², la t de Student o F de Snedecor-Fischer— se aproxima a la normal a medida q ↑ el
tamaño de la muestra, y por tanto se puede generar una nueva V cuya distribución es la normal tipi cada:


*Ej P12 y 13 del manual :)

Distribución muestral de la varianza
La varianza es una medida de dispersión q permite determinar la variabilidad
q presentan los datos para la V objeto de estudio.

No obstante, el proceso de construcción de una distribución muestral de
varianzas no es tan inmediato como el de la media o el de la proporción. Nos
limitaremos a describir cuál es la V aleatoria, su distribución de probabilidad,
sus medias —o valor esperado— así como su varianza y desviación típica.





fi fi fi fi fi

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller raquelschau. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $7.07. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

75759 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$7.07  7x  sold
  • (1)
  Add to cart