Sistema Galileu de Educação Estatística
Tópico: [Estatística descritiva]

O método científico, quando aplicado para solução de um problema científico, frequentemente gera dados em grande quantidade e de grande complexidade. Desse modo, a análise da massa de dados individuais na maioria das vezes não revela a informação subjacente, gerando a necessidade de algum tipo de condensação ou resumo dos dados.

Estatística descritiva é a parte da estatística que desenvolve e disponibiliza métodos para resumo e apresentação de dados estatísticos por meio de medidas descritivas, tabelas, gráficos, diagramas ou distribuições de frequência, com o objetivo de facilitar a compreensão e a utilização da informação ali contida.

Em resumo, a estatística descritiva tem por finalidade a utilização de tabelas, gráficos, diagramas e medidas descritivas para:

É, portanto, patente a importância do conceito de distribuição na metodologia estatística. Nenhum método poderá ser adequadamente compreendido se a idéia de distribuição não ficar absolutamente clara.

Evidentemente, a validade do resumo está intimamente ligada à quantidade de informação disponível e à qualidade de obtenção dos dados. Pode-se pensar que todo método descritivo possui uma entrada, os dados, e uma saída, que pode ser uma medida descritiva, um gráfico ou uma tabela. Se a entrada é deficiente a saída também será de má qualidade. Uma expressão em lingua inglesa utilizada na computação resume a situação: garbage in, garbage out ou se entra lixo, sai lixo.

Medidas descritivas

O resumo da informação contida nos dados é na maioria das vezes feito por resumos numéricos dos valores de uma ou mais variáveis, denominadas medidas descritivas ou estatísticas descritivas. Alguns exemplos do dia a dia (qualquer órgão de divulgação de notícias oferece todos os dias dezenas de outros exemplos) são:

  1. Depois de uma rodada de um campeonato de futebol envolvendo um grande número de clubes, se fosse apresentado, para dar uma idéia da quantidade de gols na rodada, o conjunto de todos os gols acontecidos em cada partida a compreensão geralmente fica prejudicada. A idéia é frequentemente passada por meio de uma média de gols (por partida), com destaques sobre eventuais goleadas ou de partidas sem gols.

  2. Quando órgãos governamentais medem a inflação de preços, são pesquisados muitos preços de produtos e serviços. Ao invés da informação sobre cada produto ou serviço é calculado um índice de inflação que resume toda informação, eventualmente destacando-se algo que tenha influenciado em demasia a composição do índice.

  3. Numa pesquisa médica, as vezes envolvendo milhares de indivíduos, uma simples percentagem de indivíduos que reagiram ou não ao tratamento informa muito mais do que milhares de indicações individuais se houve controle ou não.

  4. Uma pesquisa eleitoral informa somente o percentual de eleitores consultados que prefere cada candidato e não a opinião individual de cada eleitor.

Os principais grupos de medidas descritivas são:

  • Medidas de localização. Medidas de localização, também denominadas medidas de tendência central ou medidas de posição, são medidas que indicam um ponto central onde, em muitas situações importantes, está localizada a maioria das observações. Assim, nesses casos, podem ser considerados valores típicos ou representativos do conjunto.

  • Medidas de variação. Os dados estatísticos obtidos numa pesquisa qualquer são usualmente diferentes entre si. Uma informação altamente relevante é o quanto eles são diferentes. As medidas de variação tem por objetivo informar sobre a variabilidade dos das dados.

  • Medidas de formato. Uma questão importante é a informação sobre o modo como os valores se distribuem, indicando se a maior proporção de valores está no centro ou nas extremidades, como as frequências de dados crescem ou decrescem, se existe um pico ou mais do que um na amplitude dos dados, etc. Alguns desses resumos são fornecidos por medidas de formato. A distribuição de frequências é importante não só para fornecer uma idéia do formato da distribuição mas também para a compreensão de outras medidas.

  • Medidas de associação. Quando se tem mais de uma variável medida na mesma unidade de observação, uma questão de grande importância é o modo como essas variáveis se relacionam, indicando, por exemplo, se o crescimento de uma está associado ao crescimento de outra ou outras variáveis.

  • Medidas separatrizes: Medidas separatrizes são medidas intuitivas, fáceis de entender e que também podem ser utilizadas para construir medidas de dispersão. Indicam limites para proporções de observações em um conjunto.

Existe uma enorme variedade de medidas descritivas, muitas delas competidoras entre si. Um guia geral para escolha da medida mais adequada pode ser visto a seguir:

  • com que objetivo a medida está sendo obtida?

  • é fácil de interpretar? é intuitiva?

  • existem valores atípicos que podem afetá-la exageradamente?

  • o propósito da análise é meramente descritivo ou planeja-se fazer inferências?

Medida descritiva e escala de medida

Algumas medidas descritivas exigem uma escala de medida mínima para serem obtidas. A tabela relaciona a escala necessária para algumas medidas.

Medida Escala mínima
Moda Escala nominal
Percentis Escala ordinal
Média aritmética Escala intervalar
Média geométrica e harmônica Escala de razão

Relações entre as medidas de localização

Existem algumas relações entre algumas medidas de localização. Assim, para um conjunto de observações de uma variável numérica y:``

A tabela que segue relaciona algumas formas de resumir a informação e técnicas relacionadas.

Tipo Técnica ou medida
Localização Média, mediana, moda, média geométrica, média harmônica.
Dispersão Variância, desvio padrão, desvio médio, amplitude interquartílica, amplitude total.
Formato Distribuição de frequências, coeficiente de assimetria, coeficiente de curtose, moda.
Associação Covariância, coeficiente de correlação.
Sepatrizes
Mediana, quartis, percentis.
Gráfico
Gráfico de função, histograma, gráfico estatístico, estimação por kernel

Gráficos

Gráfico é uma forma de representação visual da informação por meio de sinais, desenhos, figuras ou qualquer outro meio. De especial interesse para a estatística são os gráficos de função e os gráficos estatísticos.

O uso dos gráficos é de fundamental importância na metodologia estatística. Como se poderá ver, praticamente toda análise estatística usualmente envolverá pelo menos um tipo de gráfico.