Sistema Galileu de Educação Estatística
Tópico: [Distribuição qui-quadrado]

A distribuição qui-quadrado é uma distribuição contínua de grande importância para a inferência estatística. É uma distribuição que surge no contexto de somas de quadrados de variáveis aleatórias com distribuição normal.

Uma variável qui-quadrado aparece em numerosas situações da inferência estatística:

A distribuição qui-quadrado foi inicialmente proposta por Abbé em `1863` e,posteriormente, tratada por Karl Pearson em `1900`. A denominação qui-quadrado (chi-squared) deve-se a Pearson.

Variável aleatoria

Uma variável qui-quadrado é a soma de variáveis aleatórias independentes com distribuição normal padrão. Assim, a função densidade de probabilidade da distribuição qui-quadrado pode ser obtida considerando-se a distribuição de `q=z^2`, quando `z~N(0,1)`, ou seja, quando `z` tem distribuição normal padrão. Posteriormente, pode-se considerar a distribuição de

`q=z_1^2+z_2^2`

quando

`z_j stackrel(iid)(~) N(0,1), quad j in 1:2`

e, finalmente, quando

`q=sum_j quad z_j^2`

sendo

`z_j stackrel(iid)(~) N(0,1), quad j in 1:nu`

Nesse caso, diz-se que `q` tem distribuição qui-quadrado com `nu` graus de liberdade e representa-se como:

`q~chi^2(nu)`

Resumo

Elementos Forma em q
Variável aleatória `q`, com valor `w`
Parâmetros `nu>0`, parâmetro de formato, denominado graus de liberdade
Amplitude `w in S_q = [0,oo)`
Notação `q ~chi^2(nu)`
Função densidade de probabilidade `f_q(w)=(w^(nu/2-1) e^(-w/2))/(Gamma(nu/2)2^(nu/2))I_([0,oo))(w)`
Função distribuição acumulada `F_q(w)=P(nu/2,w/2)=(gamma(nu/2,w/2))/(Gamma(nu/2))I_([0,oo))(w)`
Média `E(q)=mu_q=nu`
Variância `V(q)=sigma_q^2=2 nu`
Mediana `xi_(.5)~~nu- 2/3`, para `nu` grande
Moda `f_q` é função monótona decrescente para `nu le 2` e com máximo `nu-2` para `nu > 2`
Coeficiente de assimetria `gamma_1=sqrt(8/nu)`
Coeficiente de curtose `gamma_2=12/nu`
Função geradora de momentos `m_q(t) = 1/((1-2t)^(nu/2)), quad t lt 1/2`
Função geradora de cumulantes `K_q(t)=ln (m_y(t))=- nu/2 ln(1-2t)`, `quad t < 1/2`
Função característica `O/_q(t)=1/((1-2 i t)^(nu/2))` com `i^2=-1`

Propriedades e relações com outras distribuições

  1. Se `q~chi^2(nu)` e `y~"Gama"(2,nu/2)`, sendo `2` o parâmetro de dispersão e `nu/2` o parâmetro de formato, então `q~y`. Ou seja, a distribuição `chi^2` é um caso particular da distribuição gama padrão, quando o parâmetro de dispersão é igual a `2` e o de formato igual a `nu/2`.

  2. Se `q~chi^2(nu)` e `y~"Gama"(1,nu/2)` então `q~2y`.

  3. Se `q~chi^2(2)` e `y~"Exp"(1/2)` então `q~y`. Ou seja, a distribuição `chi^2(2)` é a distribuição exponencial com parâmetro de taxa `lambda=1/2`.

  4. Se `q_j stackrel(i)(~) chi^2(nu_j), quad j in 1:2` então
    `f=((q_1)/(nu_1))/((q_2)/(nu_2))~F(nu_1,nu_2)`
    ou seja, a razão de variáveis qui-quadrado independentes tem distribuição F, cujos parâmetros são os graus de liberdade do numerador e graus de liberdade do denominador.

  5. Se `q~chi^2(nu)` e `z~N(0,1)` são variáveis aleatórias independentes então
    `t=z/(sqrt(q/nu))~t(nu)`
    ou seja, se existe independência então a razão entre uma variável normal padrão e a raiz quadrada de uma qui-quadrado tem distribuição t de Student.

  6. As variáveis `q~chi^2(nu)` e `y~"Poisson"(w/2)` (distribuição Poisson) são relacionadas por meio de
    `P(q>w)=P(y le nu/2-1)`
    De modo equivalente, isso pode ser escrito em termos da função distribuição acumulada e da função quantil:
    `1-F_q(w) = F_y(nu/2-1)`
    e
    `G_q(1-alpha)=w quad iff quad G_y(alpha) = nu/2-1`
    sendo `w >= 0`, `nu/2` um inteiro positivo e `0 lt alpha lt 1` uma probabilidade.

  7. Se

    `qquad y_j stackrel(i)(~) N(mu_j,sigma_j), quad j in 1:nu`

    e

    `qquad q=sum_(j in 1:nu) ((y_j-mu_j)/(sigma_j))^2`

    então

    `qquad q~chi^2(nu)`.

  8. Se

    `qquad q_j \ stackrel(i)(~) \ chi^2(nu_j), quad j in 1:n`

    então

    `qquad q_+=sum_(j in 1:n) quad q_j~chi^2(nu_+)`

    ou seja, a soma de variáveis qui-quadrado independentes também tem distribuição qui-quadrado cujo parâmetro é a soma dos correspondentes graus de liberdade.

  9. Sejam
    `y_j stackrel(iid)(~) N(mu_y,sigma_y), quad j in 1:n`
    e
    `bar y = (y_+)/n quad` e `quad s^2 = 1/(n-1) sum_(j in 1:n) (y_j - bar y)^2`
    então
    `(n-1) (s^2)/(sigma^2)~chi^2(n-1)`
  10. Sejam
    `y_j stackrel(iid)(~) N(mu_y,sigma_y), quad j in 1:n`
    sendo que `r_A` dessas variáveis estão no grupo `A` e `r_B = n - r_A` estão no grupo `B`. Ademais, se
    `bar y_A = 1/(r_A) sum_(j in A) y_j = (y_(A+))/(r_A)`, `quad s_A^2 = 1/(r_A-1) sum_(j in A) (y_j - bar y_A)^2`

    `y_B = 1/(r_B) sum_(j in B) y_j = (y_(B+))/(r_B)`, `quad s_B^2 = 1/(r_B-1) sum_(j in B) (y_j - bar y_B)^2`
    são as médias e variânciasdos grupos `A` e `B` então
    `1/(sigma_y^2)((r_A-1) s_A^2+(r_B-1) s_B^2)~chi^2(r_A+r_B-2)`
  11.  Como `q~chi^2(nu)` é a soma de `nu` variáveis aleatórias indepedentes então, pelo teorema central do limite, a distribuição de
    `(q-nu)/(sqrt(2 nu))`
    tende para a distribuição normal padrão à medida que `nu` cresce. Entretanto, como se pode ver pelo coeficiente de assimetria `gamma_1= 2 sqrt(2/nu)` e coeficiente de curtose `gamma_2=12/nu`, a convergência é lenta.

  12. Variáveis qui-quadrado podem ser aproximadas por funções de variáveis normais padronizadas `z~N(0,1)`:
    `q~~1/2(sqrt(2 nu -1)+z)^2`
    devida a Fisher, e
    `q~~ nu(1- 2/(9 nu)+sqrt(2/(9 nu)) quad z)^3`
    devida a Wilson-Hilferty, que se comporta melhor que a de Fisher.

  13. Sejam `y_j, quad j in 1:k`, com `y_+ = n`, frequências na classe `j` e `mu_j` a frequência esperadanessa classe. Então
    `sum_(j in 1:k) ((y_j - mu_j)^2)/(mu_j)`
    tende, sob determinadas condições, para uma variável qui-quadrado. O número de graus de liberdade dependerá do contexto.



Exemplos: Distribuição qui-quadrado (Função den ...) | Distribuição qui-quadrado (Momentos ...) | Distribuição qui-quadrado (Quantis e ...)

Applets: DProb: Quantil e probabilidade em distribuições | Simulação: Amostras de distribuições

Referências: [Wolfram MathWorld/2014]   [Wikipedia/2014]   [Johnson_Kotz_Bal/1994]   [Evans/1993]   [Press/1992]