O índice de similaridade, também chamado de coeficiente de similaridade, pode ser entendido como uma medida que busca apresentar de maneira objetiva o nível de semelhança entre duas ou mais comunidades. Em contraposição também existe o índice de dissimilaridade, que traduz a distância (não semelhança) entre duas ou mais comunidades. Ambos os índices estão relacionados à diversidade beta de uma dada área e são largamente utilizados na ecologia.
Para entender o índice de similaridade é preciso comentar antes o que seria a tal diversidade beta, descrita de forma detalhada por Whittaker, em 1972, num artigo intitulado Evolution and Measurement of Species Diversity [1]. O autor nos explica que a diversidade beta, também chamada de diversidade entre habitats, está relacionado ao nível de diferenciação entre comunidades ao longo de um gradiente ambiental. Isto com base na premissa de que cada espécie demanda do ambiente características específicas para se estabelecer e desenvolver, coexistindo, deste modo, num espaço complexo composto pela associação de diferentes habitats.
Uma referência interessante sobre os índices de similaridade é o Ecological Methodology, do Charles J. Krebs (não confundir com Hans Adolf Krebs, do Ciclo dos Ácidos Tricarboxílicos). Neste trabalho, Charles Krebs explica que os coeficientes de similaridade podem ser de dois tipos: binários ou quantitativos, cujas características detalhadas pelo autor são explanadas a seguir.
Os índices de similaridade binários são simples, pois consideram apenas dados de presença e ausência de espécies em seu cálculo, cujo resultado deve estar entre 0 (nenhuma similaridade) e 1 (similaridade completa, se é que isso existe, como comenta Whittaker). Ente os mais famosos índices binários, então o de Jaccard e Sorensen, que apresentam o mesmo princípio do cálculo: primeiramente toma-se como variáveis o número de espécies compartilhadas entre duas amostras 1 e 2 (variável a), em seguida o número de espécies que existem em 1, mas não em 2 (variável b) e o número de espécies que existem em 2, mas não em 1 (variável c). Diferente de Jaccard, Sorensen confere mais peso para os dados de presença em detrimento dos dados de ausência (multiplicando a variável a pelo n.º 2) e por isso pode ser mais útil quando há várias espécies presentes numa comunidade, mas ausentes numa amostra desta comunidade, de modo que esta ausência não diminua significativamente a exatidão do valor obtido no cálculo do índice.
Alguns índices, como o Simple Matching Coefficient e o índice de Baroni-Urbani e Buser, utilizam ainda uma variável d, que diz respeito ao número de espécies que não aparecem em nenhuma das amostras, 1 ou 2. Todavia, para sua aplicação, é necessário haver uma caracterização prévia do ambiente amostrado de modo a entender quais espécies seriam faltantes. É como se fosse a lista de chamada numa sala de aula: você sabe que na turma estão Thiago, Monique, Juliana e Bruno, mas no dia da aula em questão Thiago não apareceu. De cara nota-se a dificuldade em considerar tal variável. Assim, os índices binários mais aplicados consideram somente as três variáveis comentadas anteriormente (a, b e c).
Com a evolução dos estudos sobre este tema, notou-se que a aplicação dos índices binários não traduzia bem a realidade, uma vez que todas as espécies, independente da sua abundância inerente, tinham o mesmo valor nesse cálculo. Ou seja, uma espécie rara, que obviamente vai aparecer em menor número numa comunidade, tinha o mesmo valor de uma espécie comum, que naturalmente apareceria em maior número absoluto. Aprimorou-se então o cálculo – piorando a vida de quem odeia matemática e afins – e passou-se a considerar a abundância relativa[2] das espécies para chegar num índice de similaridade mais fiel. Foi nesse ponto que surgiram os índices de Bray-Curtis, Morisita-Horn, Coeficiente de Correlação de Pearson, os coeficientes de Sorensen e Jaccard ajustados, entre outros. Este cálculo considera, além das variáveis utilizadas nos coeficientes binários, a abundância relativa das espécies comuns a ambas amostras na amostra 1 e esta abundância relativa na amostra 2.
Pois bem, com esta curta explicação é possível termos uma ideia geral do conceito, mas vejamos um exemplo para ilustrar. Tomando duas amostras, 1 e 2, é simples visualizar; compara-se 1 com 2 e chega-se a uma matriz simétrica de duas linhas e colunas (matriz 2×2). Já para comparação entre várias amostras, a matriz fica enorme e serão encontrados diversos índices de similaridade, tornando difícil chegar-se a uma conclusão. Para resolver este problema, utilizam-se técnicas de agrupamento, que permitem construir um dendrograma de similaridade. Várias são as técnicas de agrupamento, cujos métodos aplicados podem ser classificados em hierárquicos ou não-hierárquicos, divisivos ou aglomerativos, monotéticos ou politéticos e de dados quantitativos (não binários) ou qualitativos (binários), entre outros.
Vamos tomar o método hierárquico aglomerativo politético como base, por ser um método usualmente aplicado na ecologia. Dentro deste método podemos citar a metodologia de linkagem simples (vizinho mis próximo), linkagem completa (vizinho mais distante) e linkagem média.
Na linkagem simples são escolhidas duas amostras com maior índice de similaridade entre elas, que serão agrupadas em um cluster (grupo); repete-se a operação para encontrar um segundo par mais similar, que pode ser tanto entre duas amostras ou entre uma amostra e o cluster recém-formado; a operação é repetida até que se tenha formado um único grupo. Já a linkagem completa é o oposto, ou seja, são unidos primeiro os grupos ou amostras menos similares e segue o baile, como na simples. Por fim, na linkagem média, mais utilizada por evitar o trabalho excessivo de cálculo das linkagens simples e completa, o cluster é formado de acordo com a similaridade média entre amostras e grupos, sendo a matriz atualizada a cada nova média calculado para o grupo recém-formado até que se chegue a um grande cluster. A média utilizada pode ser aritmética ou baseada no centroide. Na linkagem média, pode-se considerar ainda uma ponderação. Os resultados destes métodos, apresentados no dendrograma, são similares a uma árvore genealógica.
Depois de ler tudo isso, a cabeça gira! Por isso comento que este tema é bastante complexo e extenso, sendo necessária uma boa leitura, de livros e periódicos, para um melhor e mais completo entendimento.
Passada essa fase de exatas, vamos para a de humanas: o que o índice de similaridade tem a ver com a Lei da Mata Atlântica? Bom, quando, para a instalação de um empreendimento ou atividade, for necessária a supressão de Mata Atlântica, especialmente em formações primárias (não antropizadas) ou em estágio médio e avançado de regeneração, é mandatório observar os preceitos da Lei n.º 11.428/06. Em seu artigo 17, esta norma traz a obrigatoriedade de compensar a área de Mata Atlântica suprimida, nos níveis de conservação citados, a partir da destinação para conservação de área equivalente à extensão da área desmatada, na mesma microbacia (melhor dizer sub-bacia) ou bacia e com as mesmas características ecológicas. Isto é, as mesmas características abióticas (solo, relevo e clima) e bióticas (fauna e flora).
Veja também: O inventário florestal e a conservação dos recursos naturais
Para realizar a compensação, primeiro busca-se área em regiões com mesmo clima, relevo e solo. Dentro deste universo, busca-se um fragmento com as mesmas características bióticas. Eu acredito que não há duas comunidades com as mesmíssimas características bióticas ou, pelo menos, é muito raro haver. Então, para comprovar o cumprimento da lei, aplica-se o critério de semelhança, através do uso da agora conhecida ferramenta, o índice de similaridade! Aplicando-o para comparação florística entre fragmentos florestais. Aí pode surgir a pergunta: quão similar é suficientemente similar? Eu não saberia responder. Minha opinião pessoal é que mais de 50% similar é o suficiente. Isto por que, uma área que tenha mais da metade de suas características ecológicas às de outra, cumpre o papel de manutenção da biodiversidade do bioma mais degradado do Brasil e, portanto, atinge o objetivo da lei.
[1] Acesse o trabalho e leia mais em: https://max2.ese.u-psud.fr/epc/conservation/PDFs/HIPE/Whittaker1972.pdf
[2] Abundância relativa é dada pelo número de indivíduos da mesma espécie numa amostra pelo número de indivíduos totais desta amostra.
Veja também:
- Manejo florestal sustentável e a sua importância
- Guia para se tornar um expert em inventário florestal
- Planejamento da produção florestal
__________ xxx __________