Erros na apresentação de dados em pesquisa fitopatológica: acidentais ou intencionais?
Esses dias me deparei com um gráfico em uma postagem que mostrava uma aparente superioridade de um determinado tratamento com ação fungicida em relação aos demais avaliados. No entanto, numa análise menos apressada foi possível notar diversos erros tanto de desenho experimental como de apresentação dos dados.
É fato que erros de apresentação de dados e estatísticas sempre existiram em qualquer área do conhecimento. O que chama atenção é que, com o advento das redes sociais, esses problemas parecem se disseminar de forma ainda mais rápida e atingir um público maior, na maioria das vezes sem o devido filtro crítico.
Na fitopatologia, tanto acadêmica quanto aplicada (comercial), a apresentação de dados sobre a performance de produtos destinados ao controle de doenças é fundamental para embasar decisões e recomendações sobre as melhores opções de manejo. Para isso, a escolha de recursos gráficos adequados desempenha um papel central, garantindo que as informações sejam transmitidas de forma precisa, clara e de fácil interpretação. A escolha inadequada de procedimentos gráficos pode ser devida não somente à falta de conhecimento técnico, mas, infelizmente, em alguns casos, pode ser uma tentativa de influenciar a percepção do público, seja para promover um produto, uma tecnologia ou um manejo específico.
Tenho observado com certa frequência alguns problemas, os quais podem ser agrupados em três categorias principais:
- Falhas no desenho ou delineamento experimental;
- Escolha inadequada das variáveis a serem apresentadas; e
- Uso equivocado de procedimentos gráficos.
No desenho experimental, um erro básico é a ausência de controles adequados, tal como o tratamento testemunha sem aplicação do produto em avaliação. A ausência de uma referência confiável compromete a capacidade de interpretar os resultados, já que não é possível distinguir se os efeitos observados são devido aos tratamentos (fungicidas químico ou biológico) ou a fatores externos como variações naturais.
Além disso, outro problema nesse contexto é testar combinações de produtos sem avaliar seus componentes de forma isolada e as possíveis interações. Ao omitir uma determinada combinação, efeitos sinérgicos ou antagônicos podem não ser totalmente explorados. Por exemplo, ao testar três produtos em combinação tripla (A, B e C), seria necessário incluir, no mínimo, os tratamentos A, B, C, A+B, A+C, B+C e A+B+C, além da testemunha sem tratamento, totalizando oito tratamentos. Sem essa avaliação isolada, fica difícil compreender quais componentes realmente contribuem para o resultado observado e em que magnitude, comprometendo a interpretação dos dados e a aplicação prática das conclusões.
Em relação às variáveis de doença, é fundamental apresentar a variável originalmente avaliada, como a incidência ou a severidade, em todos os tratamentos. Omiti-las ou substituir essas variáveis totalmente por medidas relativas, como somente a eficácia (% de controle), pode distorcer a interpretação dos resultados ao mascarar o impacto real do tratamento. Um exemplo é a redução de 6% para 2%, que representa 66 % de eficácia, mas tem um impacto prático muito diferente de uma redução de 60% para 20%, que tem o mesmo valor de eficácia. A eficácia é sim uma variável importante, mas ela é adicional pois facilita a interpretação e comparação entre o conjunto de tratamentos, especialmente por representar uma medida de tamanho do efeito (effect-size).
Da mesma forma, a área abaixo da curva de progresso da doença (AUDPC) é uma variável muito útil e com capacidade de discriminar bem tratamentos quando comparado, por exemplo, à severidade ao final do ciclo. No entanto, deve ser sempre complementada com a apresentação das curvas de progresso originais, já que diferentes padrões temporais podem gerar a mesma AUDPC, dificultando a interpretação isolada dessa métrica - além do fato de que seu uso isolado não permite inferir sobre a real intensidade da doença nas variáveis originais, uma vez que é uma variável derivada de outra.
Na apresentação gráfica, erros frequentes incluem o uso de gráficos de barras sem medidas de dispersão e escalas que não começam do zero (o que é mandatório para o gráfico de barras). Essas práticas podem amplificar diferenças que, na realidade, são muito mais sutis, induzindo o público a interpretações equivocadas por uma falsa ilusão. Mostrar os dados originais das repetições dos tratamentos (gráfico de pontos) bem como medidas de tendência central e dispersão, são essenciais para comunicar a variabilidade dos dados que pode ficar escondida em um gráfico de barras. A escolha do gráfico e seus elementos deve priorizar a clareza, a precisão e a fidelidade às informações reais do experimento.
Além disso, seja em gráficos ou tabelas, é imprescindível apresentar evidências de análise estatística inferencial, como testes de contrastes ou comparações múltiplas de médias usando letras ou cores, por exemplo, ou o próprio valor de probabilidade (valor P) quando se contrasta tratamentos. É preciso ter cuidado para não cair na tentação do P-hacking, prática em que diferentes testes estatísticos são realizados, e apenas aquele que gera o resultado desejado é selecionado. Além disso, testes de comparação múltipla como o Duncan tendem a apresentar uma maior taxa de erro tipo I (falsos positivos, ou encontrar diferenças onde elas não existem).
Se a ideia é fornecer subsídio para uma inferência visual, o intervalo de confiança é uma estatística importante. A ausência dessas informações reduz a confiabilidade dos resultados, pois não permite avaliar se as diferenças observadas têm suporte na estatística inferencial.
Para evitar esses problemas, é essencial que pesquisadores e profissionais da área de fitopatologia priorizem a transparência e o rigor metodológico, garantindo que dados sejam apresentados de forma honesta e confiável, especialmente em plataformas públicas. A integridade na comunicação científica não é apenas uma questão técnica, mas uma responsabilidade ética com a ciência e com a sociedade. Na ausência de uma análise estatística apropriada ou na apresentação seletiva de resultados, é possível criar narrativas que favoreçam certos produtos ou conclusões, mascarando a variabilidade, a falta de significância ou mesmo a inconsistência dos dados.
Por fim, e não menos importante, outro problema que vale mencionar é a avaliação de resultados e conclusões baseadas exclusivamente no uso de fotografias e vídeos. Embora imagens possam valer mais que palavras em alguns contextos, sua representatividade da situação real muitas vezes é questionável. Fotografias devem ser utilizadas como complemento à apresentação de dados numéricos e análises estatísticas, e nunca como única evidência para sustentar conclusões.
E você, já viu problemas desse tipo? Ou outros problemas que eu não abordei neste texto?
Agradecimentos: Aos colegas Tiago Olivoto e Franklin Machado pelos comentários construtivos.
Texto publicado no LinkedIn. Faça login para discutir!
Back to top