Os programas de inteligência artificial mais avançados são hoje capazes de acelerar consideravelmente a pesquisa farmacêutica modelando as interações moleculares. Uma equipa da Universidade de Basileia descobriu, no entanto, que estas ferramentas dependem mais da memorização do que de uma verdadeira compreensão dos mecanismos físicos subjacentes.
Na área médica, as proteínas representam alvos privilegiados para os medicamentos. Estas macromoléculas biológicas, constituídas por cadeias de aminoácidos, adotam estruturas tridimensionais que determinam a sua função. A decifração destas arquiteturas moleculares constitui uma etapa fundamental para conceber tratamentos inovadores. Desde há alguns anos, o aparecimento de algoritmos como o AlphaFold revolucionou esta abordagem ao permitir prever a forma das proteínas a partir da sua sequência genética.
As versões mais recentes destes modelos vão ainda mais longe ao simular como as proteínas interagem com diferentes moléculas, nomeadamente os princípios ativos farmacêuticos. O professor Markus Lill e a sua equipa notaram, no entanto, que as taxas de sucesso anunciadas pareciam anormalmente elevadas. Esta observação levou-os a suspeitar que as inteligências artificiais poderiam funcionar por reconhecimento de padrões em vez de por análise física aprofundada das interações moleculares.
Para verificar esta hipótese, os cientistas modificaram artificialmente centenas de proteínas alterando especificamente os seus locais de ligação. Criaram sequências de aminoácidos apresentando distribuições de carga elétrica radicalmente diferentes, ou até bloquearam completamente as zonas de interação. Apesar destas transformações significativas, os modelos de IA continuaram a prever as mesmas estruturas, como se as modificações não existissem. Testes semelhantes nos ligandos confirmaram esta tendência.
Os investigadores constataram que em mais de metade dos casos, as previsões permaneciam inalteradas apesar das alterações introduzidas. Esta rigidez cognitiva torna-se particularmente problemática quando as proteínas estudadas apresentam pouca similaridade com as utilizadas para o treino dos algoritmos. Ora, são precisamente estas estruturas originais que poderiam abrir caminho a medicamentos verdadeiramente inovadores, de acordo com a equipa de pesquisa.
Perante estas limitações, os cientistas recomendam uma abordagem prudente integrando sistematicamente validações experimentais. Preconizam também o desenvolvimento de novas gerações de algoritmos incorporando explicitamente as leis da química e da física. Tais modelos híbridos poderiam oferecer previsões mais fiáveis para as estruturas proteicas ainda mal compreendidas, potencialmente portadoras de novas abordagens terapêuticas.
Fonte: Nature Communications