Vida

Graus de liberdade em estatística e matemática

Graus de liberdade em estatística e matemática

Nas estatísticas, os graus de liberdade são usados ​​para definir o número de quantidades independentes que podem ser atribuídas a uma distribuição estatística. Esse número normalmente se refere a um número inteiro positivo que indica a falta de restrições à capacidade de uma pessoa calcular fatores ausentes de problemas estatísticos.

Graus de liberdade agem como variáveis ​​no cálculo final de uma estatística e são usados ​​para determinar o resultado de diferentes cenários em um sistema e, em graus matemáticos de liberdade, definem o número de dimensões em um domínio necessário para determinar o vetor completo.

Para ilustrar o conceito de um grau de liberdade, examinaremos um cálculo básico referente à média da amostra e, para encontrar a média de uma lista de dados, adicionamos todos os dados e dividimos pelo número total de valores.

Uma ilustração com uma amostra média

Por um momento, suponha que sabemos que a média de um conjunto de dados é 25 e que os valores nesse conjunto são 20, 10, 50 e um número desconhecido. A fórmula para uma média amostral nos dá a equação (20 + 10 + 50 + x) / 4 = 25, Onde x denota o desconhecido, usando uma álgebra básica, pode-se determinar que o número ausente,x, é igual a 20.

Vamos alterar um pouco esse cenário. Novamente, supomos que sabemos que a média de um conjunto de dados é 25. No entanto, desta vez os valores no conjunto de dados são 20, 10 e dois valores desconhecidos. Como essas incógnitas podem ser diferentes, usamos duas variáveis ​​diferentes, xe ypara denotar isso. A equação resultante é (20 + 10 + x + y) / 4 = 25. Com alguma álgebra, obtemos y = 70- x. A fórmula está escrita neste formulário para mostrar que, quando escolhemos um valor para x, o valor para y é completamente determinado. Temos uma escolha a fazer, e isso mostra que há um grau de liberdade.

Agora veremos um tamanho de amostra de cem. Se sabemos que a média desses dados da amostra é 20, mas não sabemos os valores de nenhum dos dados, então existem 99 graus de liberdade. Todos os valores devem somar um total de 20 x 100 = 2000. Quando tivermos os valores de 99 elementos no conjunto de dados, o último será determinado.

Escore t do aluno e distribuição do qui-quadrado

Graus de liberdade desempenham um papel importante ao usar o Aluno ttabela de pontuação. Na verdade, existem vários escore t distribuições. Diferenciamos essas distribuições pelo uso de graus de liberdade.

Aqui, a distribuição de probabilidade que usamos depende do tamanho da nossa amostra. Se o nosso tamanho da amostra é n, então o número de graus de liberdade é n-1. Por exemplo, um tamanho de amostra 22 exigiria que usássemos a linha do ttabela de pontuação com 21 graus de liberdade.

O uso de uma distribuição qui-quadrado também requer o uso de graus de liberdade. Aqui, de maneira idêntica à da escore tdistribuição, o tamanho da amostra determina qual distribuição usar. Se o tamanho da amostra for n, então há n-1 graus de liberdade.

Desvio padrão e técnicas avançadas

Outro lugar onde os graus de liberdade aparecem é a fórmula do desvio padrão. Essa ocorrência não é tão evidente, mas podemos ver se sabemos para onde olhar. Para encontrar um desvio padrão, estamos procurando o desvio "médio" da média. No entanto, depois de subtrair a média de cada valor de dados e calcular as diferenças, acabamos dividindo por n-1 ao invés de n como poderíamos esperar.

A presença do n-1 vem do número de graus de liberdade. Desde o n valores de dados e a média da amostra estão sendo usados ​​na fórmula, existem n-1 graus de liberdade.

Técnicas estatísticas mais avançadas usam maneiras mais complicadas de contar os graus de liberdade. Ao calcular a estatística do teste para duas médias, com amostras independentes de n1 e n2 elementos, o número de graus de liberdade tem uma fórmula bastante complicada. Pode ser estimado usando o menor de n1-1 e n2-1

Outro exemplo de uma maneira diferente de contar os graus de liberdade vem com um F teste. Ao conduzir um F teste que temos k amostras de cada tamanho n-os graus de liberdade no numerador são k-1 e no denominador é k(n-1).