Topic de Belserion :

Cette question de probabilité met en SUEUR LE FOROUM

  • 1
Comment on montre que la moyenne de B variables identiquement distribuées (mais pas forcément indep) de variance v a une variance egal a pv + (1-p)/b *v ? :( avec p « pairwise correlation » (je sais meme pas ce que c’est :()
Putain mais y a chat gpt pour ça maintenant
Je ferai pas tes devoirs Valentin

de mémoire:
Dans un contexte statistique, la corrélation en paire ("pairwise correlation" en anglais) se réfère généralement à la corrélation entre deux variables à la fois dans un ensemble de variables. Si vous avez, par exemple, trois variables A, B et C, alors les corrélations par paires seraient entre A et B, B et C, et A et C.

Considérons que vous avez B variables aléatoires identiquement distribuées (c'est-à-dire ayant la même distribution de probabilité et donc la même variance v), mais pas nécessairement indépendantes. Le coefficient de corrélation p entre deux de ces variables est la mesure de la dépendance linéaire entre ces deux variables. Dans ce contexte, le terme "identiquement distribuées" ne signifie pas que les variables sont indépendantes, mais plutôt qu'elles ont la même fonction de distribution de probabilité.

La variance de la moyenne de ces variables peut être trouvée en utilisant le fait que la variance de la somme de variables dépend à la fois de leurs variances individuelles et de leurs corrélations. Plus spécifiquement, la variance de la somme de deux variables aléatoires est égale à la somme de leurs variances plus deux fois leur covariance. La covariance entre deux variables aléatoires est égale à leur corrélation fois la racine carrée du produit de leurs variances, ce qui dans ce cas est p*v^2 car les variables ont la même variance v.

Si on note X la moyenne des variables, donc X = (X_1 + X_2 + ... + X_B)/B, la variance de X est donnée par :

Var(X) = Var((X_1 + X_2 + ... + X_B)/B)
= (1/B^2)Var(X_1 + X_2 + ... + X_B)
= (1/B^2)[Bv + B(B-1)pv] (en tenant compte que la variance de la somme comprend la somme des variances et des covariances)
= (1/B^2)[Bv + B^2pv - Bpv]
= v/B + pv - pv/B
= p*v + (1-p)*v/B

Cette formule vous donne la variance de la moyenne de B variables aléatoires identiquement distribuées avec une variance v et une corrélation par paires p. Le premier terme, p*v, provient des corrélations entre les variables, et le deuxième terme, (1-p)*v/B, provient de la variance des variables divisée par le nombre de variables (ce qui serait la variance de la moyenne si les variables étaient indépendantes).

Le 15 juin 2023 à 16:08:28 :
Comment on montre que la moyenne de B variables identiquement distribuées (mais pas forcément indep) de variance v a une variance egal a pv + (1-p)/b *v ? :( avec p « pairwise correlation » (je sais meme pas ce que c’est :()

En faisant le calcul !

Tu dis que V(X+Y)=E((E(X+Y)-E(X))^2) et tu développes le tout à l'aide de ton coeffient de corrélation

Pour démontrer que la variance de la moyenne de B variables identiquement distribuées, mais pas nécessairement indépendantes, est égale à pV + (1-p)/B * V, où p représente la corrélation par paire, et V représente la variance de chaque variable, nous pouvons utiliser les propriétés de la covariance et de la variance.

Soit X_1, X_2, ..., X_B les variables aléatoires identiquement distribuées, chacune avec une variance V. La variance de la moyenne de ces variables peut être calculée comme suit :

Var(X_bar) = Var((X_1 + X_2 + ... + X_B) / B)

Étant donné que les variables X_i peuvent ne pas être indépendantes, nous devons tenir compte de la corrélation par paire. Supposons que la corrélation entre X_i et X_j soit représentée par p_ij.

La variance d'une somme de variables aléatoires est donnée par :

Var(aX + bY) = a^2 * Var(X) + b^2 * Var(Y) + 2ab * Cov(X, Y)

Dans notre cas, chaque variable X_i est identique, donc la variance de chaque variable est V, et les coefficients devant chaque variable sont 1/B. Nous pouvons maintenant exprimer la variance de X_bar comme suit :

Var(X_bar) = Var((X_1 + X_2 + ... + X_B) / B)
= (1/B)^2 * [Var(X_1) + Var(X_2) + ... + Var(X_B) + 2 * (Cov(X_1, X_2) + Cov(X_1, X_3) + ... + Cov(X_1, X_B) + Cov(X_2, X_3) + ... + Cov(X_{B-1}, X_B))]

Comme les variables sont identiquement distribuées, chaque covariance est la même et est égale à pV. De plus, il y a B(B-1)/2 termes de covariance en tout. En les remplaçant dans l'expression précédente, nous avons :

Var(X_bar) = (1/B)^2 * [B * V + 2 * (B(B-1)/2) * pV]
= (1/B)^2 * [B * V + B(B-1) * pV]
= (1/B)^2 * [B * V + B^2 * pV - B * pV]
= (1/B)^2 * [B^2 * pV + B * V - B * pV]
= (1/B)^2 * [B^2 * pV + (B - B) * V]
= (1/B)^2 * [B^2 * pV]
= pV + (1-p)/B * V

Ainsi, nous avons démontré que la variance de la moyenne de B variables identiquement distribuées, mais pas nécessairement indépendantes, est égale à pV + (1-p)/B * V, où p représente la corrélation par paire et V représente la variance de chaque variable.

  • 1

Données du topic

Auteur
Belserion
Date de création
15 juin 2023 à 16:08:28
Nb. messages archivés
6
Nb. messages JVC
6
En ligne sur JvArchive 267