Plateforme EvryRNA, une panoplie d’outils pour accélérer les découvertes sur les ARN non-codants
Source(s): Genopole
EvryRNA est une plateforme logicielle génopolitaine qui met à disposition de la communauté scientifique des outils pour l’analyse des acides ribonucléiques (ARN) non codants. Ces molécules ont révélé ces dernières décennies leur rôle majeur dans les mécanismes biologiques et dans diverses maladies dont les cancers. Source Genopole La plateforme EvryRNA, dirigée par le Pr Fariza […]
EvryRNA est une plateforme logicielle génopolitaine qui met à disposition de la communauté scientifique des outils pour l’analyse des acides ribonucléiques (ARN) non codants. Ces molécules ont révélé ces dernières décennies leur rôle majeur dans les mécanismes biologiques et dans diverses maladies dont les cancers.
Source Genopole
La plateforme EvryRNA, dirigée par le Pr Fariza TAHI, est hébergée au sein du laboratoire IBISC (Informatique, Bio-informatique et Systèmes Complexes – Université d’Évry Paris-Saclay). Elle fait partie des 24 plateformes et plateaux techniques mutualisés sur le biocluster Genopole.
L’équipe Bioinformatique des ARN dirigée par Fariza Tahi développe des algorithmes et des méthodes computationnelles dédiés à l’analyse des ARN. Il s’agit là d’identifier les ARN dans les séquences génomiques, de déterminer leur caractère codant ou non-codant, ou encore de prédire leurs conformations dans l’espace, déterminantes pour leur fonction. Les ARN ont en effet la propriété de se replier grâce aux liaisons des acides ribonucléiques qui les constituent.
Les ARN non codants ouvrent un large champ scientifique
Les deux dernières décennies ont été le théâtre de la découverte d’une multitude d’ARN non codants, issus des régions de notre génome qui ne codent pas de protéines et que l’on a longtemps pensé inutiles. Les biologistes connaissaient bien la fonction des ARN ribosomiques et des ARN de transfert pour traduire le message des gènes en protéines. Mais récemment, ils ont révélé le rôle biologique essentiel de nombreux autres ARN (micro-ARN, petits ARN interférents, longs ARN non-codants…).
Ces ARN non-codants agissent comme des régulateurs de l’expression des gènes, donc comme des acteurs du développement des organismes, de l’adaptation aux changements environnementaux, etc. Ils interviennent dans les processus biologiques, mais aussi dans les maladies, notamment les cancers et les maladies neuro-dégénératives. Mieux connaître les ARN non-codants pourra notamment contribuer à mieux comprendre ces pathologies, mais aussi à envisager de nouvelles approches thérapeutiques.
Plateforme EvryRNA : Une vingtaine d’outils interactifs, librement accessibles
Pour s’inscrire dans cette dynamique scientifique et répondre aux besoins des biologistes, le laboratoire IBISC a conçu une panoplie d’outils bio-informatiques librement accessibles sur la plateforme EvryRNA. Ils reposent pour les plus récents sur des technologies et approches algorithmiques comme l’optimisation multi-objectif, les cartes auto-organisatrices (SOM pour Self Organizing Map), les réseaux de neurones profonds.
En plus de la performance, les chercheurs d’IBISC ont cherché à rendre l’utilisation de ces logiciels aisée et interactive. La plupart présentent ainsi de nombreux atouts :
- Une interface web intuitive
- Une représentation graphique des résultats facilement interprétable
- La possibilité pour le biologiste utilisateur d’agir sur les paramètres puis réexécuter le modèle pour améliorer sa performance
- La possibilité d’inclure les jeux de données ou les connaissances du biologiste dans le modèle
Les principaux logiciels à disposition sur la plateforme EvryRNA
L’ensemble des ses outils sont ouverts à la communauté scientifique. Rendez-vous sur les pages dédiées et vous aurez accès à toutes les informations pour les utiliser :
- RANdvisor : Permet l’utilisation de manière intégrée et holistique des métriques d’évaluation des prédictions de structures 3D d’ARN.
- DivideFold : Prédit la structure secondaire de longs ARN non-codants. Il découpe grâce à une méthode basée sur l’apprentissage profond la séquence initiale en sous-séquences de plus petites tailles sur lesquelles est réalisée la prédiction de structure secondaire.
- RCPred : Prédit la structure secondaire de complexes d’ARN formés de plusieurs ARN interagissant entre eux. Il prédit la structure de chacun des ARN puis recherche la conformation qui minimise l’énergie libre du complexe.
- C-RCPred : Optimise la prédiction de la structure secondaire de complexes d’ARN en intégrant à RCPred des données de probing (données expérimentales sur l’appariement de certains nucléotides) et des connaissances utilisateurs.
- IRSOM : Distingue dans un ensemble d’ARN les ARN non-codants des ARN codant pour la synthèse d’une protéine.
- IRSOM2 : Exploite la propriété d’IRSOM de rejet des cas ambigus pour aider à l’identification des ARN bi-fonctionnels, c’est-à-dire cumulant une activité biologique propre non codante et la capacité à être traduits en protéines fonctionnelles.
- RNANet : Pipeline permettant de générer un dataset intégré avec des données sur les ARN, allant de la séquence à la structure 3D, en passant par les familles et les structures secondaires, ainsi qu’un grand nombre de statistiques.
- Biorseo : Prédit les structures secondaires (structure 2D révélant les repliements et les liaisons dans la molécule) des ARN en intégrant des motifs 3D.
- BioKoP : Prédit les structures secondaires des ARN en incluant les pseudonoeuds (repliements caractéristiques des ARN).
- miRNAFold : Recherche des précurseurs de microARN (pré-miARN) à grande échelle dans les génomes.
- miRBoost : Classifie des candidats pré-miARN en vrais et faux pré-miARN, grâce à une méthode de machine learning (SVM).
- IpiRId : Prédit les piARN (piwi ARN) grâce à une approche holistique, combinant un grand nombre de fonctionnalités dans une méthode de machine learning.