As expressões para os cálculos dos parâmetros da amostragem casual estratificada seguem como descrito por COCHRAN (1977).
Este processo é utilizado quando é necessário dividir uma população heterogênea em sub-populações ou estratos homogêneos, de tal modo que os valores da variável de interesse variem pouco de uma amostra para outra, possibilitando se obter uma estimativa precisa da média de um estrato qualquer, por meio de uma pequena amostra desse estrato.
Notação Utilizada:
L = número de estratos;
= número potencial de unidades do estrato (h);
= número total potencial de unidades de amostra da população;
= número de unidades amostradas no estrato (h);
= número total de unidades amostradas na população;
Wh = Nh / N = Ah / A = proporção do estrato (h) na população;
Wh = nh / n = proporção do estrato (h) na amostra total;
Ah = área do estrato (h);
= Área total da população;
fh = nh / Nh = fração amostral do estrato (h);
f = n/N = fração amostral da população;
X ih = variável de interesse.
Média por Estrato: Corresponde à média aritmética da variável amostrada para cada estrato.
Média Estratificada: Corresponde à média ponderada pelos L estratos da variável amostrada X ih.
Variância por Estrato: Corresponde à variância da variável amostrada X no estrato h.
Em que:
= variância da variável amostrada no estrato h;
n = número de amostras.
Desvio Padrão por Estrato: Corresponde à raiz da variância da variável amostrada.
Em que:
= Desvio padrão da variável amostrada no estrato h;
= variância da variável amostrada no estrato h.
Coeficiente de Variação por Estrato: Estima a variação relativa da variável amostrada em torno da sua média no estrato h.
Em que:
CV% = coeficiente de variação da variável amostrada;
= Desvio padrão da variável amostrada;
= média da variável amostrada.
Variância Estratificada: Corresponde à variância ponderada pelos L estratos da variável X ih.
Variância da Média Estratificada: O Mata Nativa Web utiliza fórmulas específicas tanto para o método de Alocação Proporcional quanto para o método de Alocação Ótima de Neyman, diferenciando a fórmula a ser usada conforme a população, ou seja, se é População Finita ou População Infinita. A referência bibliográfica foi descrita por F. Loetsch e K. E. Haller (1964).
Portanto, se o tipo de alocação escolhida for Alocação Proporcional, as fórmulas utilizadas são as seguintes:
para uma população finita;
para uma população infinita.
Já se o tipo de alocação escolhida for Alocação Ótima de Neyman, as fórmulas utilizadas são as seguintes:
para uma população finita;
para uma população infinita.
A SABER: Nas versões anteriores do software Mata Nativa (versões 1, 2, 3 e 4), usava-se uma fórmula geral para qualquer tipo de alocação, distinguindo apenas segundo a sua população, ou seja:
para população finita;
para população infinita, sendo que neste tipo de população, considera-se o (nh /Nh = fh) desprezível em todos os estratos.
⚠️Portanto, ao continuar usando uma das versões antigas do software Mata Nativa, você poderá estar entregando resultados não condizentes com as práticas e literatura atual, quando se trata de inventário por Amostragem Casual Estratificada.
Erro padrão: O erro padrão da média expressa a precisão da média amostral na forma linear e na mesma unidade de medida. É obtido de acordo com a expressão a seguir:
Erro de Amostragem: O erro devido ao processo de amostragem pode ser estimado para um nível de probabilidade (1 – a), como se segue:
Erro absoluto:
Erro relativo:
Em que:
= erro de amostragem absoluto;
= Erro de amostragem relativo;
= erro padrão da média da variável amostrada;
t = valor tabelado de t para um nível de significância a ser definido pelo usuário na janela de cálculo.
Intervalo de Confiança Para a Média: Determina os limites inferior e superior, dentro do qual espera-se encontrar, probabilisticamente, o valor paramétrico da variável estimada. Este intervalo é baseado na distribuição (t) de Student.
Em que:
IC = intervalo de confiança;
= média estratificada da variável amostrada;
= erro padrão da média da variável amostrada;
t = valor tabelado de t para um nível de significância a ser definido pelo usuário na janela de cálculo;
m = média paramétrica ou verdadeira;
P = probabilidade de ocorrência do intervalo.
Volume Estimado: Corresponde à estimativa de produção para o total da população ou para a área total.
a) Volume Estimado por Estrato:
em que:
= produção total estimada no estrato (h);
Nh = número potencial de unidades amostrais no estrato (h);
= média da variável amostrada no estrato (h).
b) Volume Estimado Geral:
Em que:
= produção total estimada;
N = número total potencial de unidades amostrais da população;
= média estratificada da variável amostrada.
Intervalo de Confiança Para a Média: No intervalo de confiança para o total, a média e o erro padrão são expandidos para toda a população, multiplicando-se por (N).
Em que:
IC = Intervalo de Confiança;
= produção total estimada;
N = número total potencial de unidades amostrais da população;
t = valor tabelado de t para um nível de significância a ser definido pelo usuário na janela de cálculo;
= erro padrão da média da variável amostrada;
P = probabilidade de ocorrência do intervalo.
Estimativa Mínima de Confiança: A estimativa mínima de confiança é similar ao limite inferior do intervalo de confiança, no entanto, por ser assimétrica, o valor de t deve ser tomado para o dobro do erro de probabilidade.
Este valor multiplicado por N, informa a produção mínima esperada para a população avaliada.
Cálculo do Número de Graus de Liberdade: As fórmulas dos intervalos de confiança pressupõem que a média estratificada () seja normalmente distribuída e o erro padrão da média estratificada () seja bem determinado, de modo que o coeficiente (t) possa ser encontrado nas tabelas de distribuição normal.
Assim, o número de graus de liberdade que determina o valor de (t) está situado entre o menor valor dos valores (nh – 1) e o somatório dos (nh). Um método para o cálculo do número efetivo de graus de liberdade, foi desenvolvido por Satterthwaite (1946) citado por COCHRAN (1977), como se segue:
em que:
Intensidade de Amostragem: Corresponde à intensidade amostral (n) para cada estrato, de acordo com o método de alocação escolhido (Alocação Proporcional ou Alocação Ótima de Neyman) para que o erro definido pelo usuário seja alcançado. Esta intensidade de amostragem pode ser definida para populações finitas e infinitas. Para população infinita, considera-se que (nh / Nh = fh) seja desprezível em todos os estratos. Assim, tem-se:
(1 – f) ≥ 0,98 a população é considerada infinita;
(1 – fh) < 0,98 a população é considerada finita.
A intensidade amostral é calculada em função do tipo de alocação das unidades amostrais nos estratos, ou seja: alocação proporcional ou ótima.
a) Alocação Proporcional:
Nesse tipo de alocação, a intensidade de amostragem calculada é distribuída proporcionalmente a área de cada estrato, como se segue:
A intensidade de amostragem é obtida da mesma maneira que na amostragem aleatória simples, apenas com a particularidade da estimativa da variância que, neste caso, é a variância ponderada dos estratos, como mostram as fórmulas a seguir:
a1) População Finita:
a2) População Infinita:
Em que:
n = intensidade amostral ideal;
t = valor tabelado de t para um nível de significância a ser definido pelo usuário na janela de cálculo.
Amostragem:
= variância ponderada dos estratos;
N = número de amostras cabíveis na população = A/a, conforme já definido.
O usuário não deverá se preocupar em saber se a população é finita ou infinita. Esta decisão é tomada pelo próprio programa, a partir do cálculo de (1 – fh).
b) Alocação Ótima de NEYMAN:
Nesse tipo de alocação, a intensidade de amostragem calculada é distribuída proporcionalmente à variância da área de cada estrato, como se segue:
A intensidade de amostragem é obtida da mesma maneira que na amostragem aleatória simples, apenas com a particularidade da estimativa da variância que, neste caso, é a variância ponderada dos estratos, como mostram as fórmulas a seguir:
b1) População Finita:
b2) População Infinita:
em que:
n = intensidade amostral ideal;
t = valor tabelado de t para um nível de significância a ser definido pelo usuário na janela de cálculo.