Élucidation des mécanismes moléculaires impliqués dans la sporulation
Aspergillus tubingensis est un champignon filamenteux appartenant à la famille des black Aspergilli, un groupe de microorganismes caractérisés par la production de spores noires ou brun foncé. Ces champignons sont omniprésents dans l'environnement et jouent un rôle important dans la décomposition de la matière organique.
Au-delà de leur importance écologique, certaines espèces du genre Aspergillus présentent un intérêt industriel en raison de leur capacité à produire des métabolites secondaires intéressants sur le plan biotechnologique.
Des observations préliminaires suggèrent que la production des NGPs est étroitement liée à la sporulation du champignon. En conditions de culture statique, la souche sauvage sporule et produit ces métabolites, tandis qu'en conditions agitées (envisagées pour une montée en échelle en bioréacteur), la sporulation est absente, ce qui empêche la production de NGPs.
Afin de tester l'hypothèse d'un lien direct entre sporulation et production de NGPs, une souche mutante ΔbrlA, déficiente pour le gène brlA (facteur clé en amont de la cascade de sporulation), a été générée. Cette souche est incapable de sporuler et ne produit pas de NGPs.
Figure 1 : Mise en contexte de l'obtention du jeu de données RNA-seq. Comparaison entre souche sauvage (sporulante, productrice de NGPs) et souche mutante ΔbrlA (non sporulante, non productrice).
L'analyse RNA-seq vise à répondre à plusieurs objectifs complémentaires :
Déterminer quels sont les gènes spécifiquement associés à la sporulation chez A. tubingensis
Identifier les gènes affectés par la mutation et évaluer les effets indirects sur la croissance métabolique globale
Mettre en évidence les voies biologiques potentiellement impliquées dans la biosynthèse des NGPs
Explorer le lien potentiel entre les voies de biosynthèse de la mélanine (DHN-mélanine) et la production de NGPs
L'étude compare 2 souches d'Aspergillus tubingensis : la souche sauvage (WT) sporulante et produisant des NGPs, et la souche mutante (ΔbrlA), non sporulante et non productrice de NGPs. Ces deux souches ont été mises en culture dans des conditions statiques identiques.
Séquençage paired-end (2×50 pb) générant des fichiers FastQ
FastQC suivi d'un nettoyage (trimming des adaptateurs et bases de mauvaise qualité)
Alignement sur le génome de référence avec STAR
Table de comptage résumée par gène
Méthode TMM (edgeR) pour corriger les différences de taille de librairie
Modèles linéaires généralisés (QL-GLM) avec edgeR
Les données ont été normalisées en Counts Per Million (CPM) pour corriger les différences de profondeur de séquençage :
Les valeurs de CPM ont ensuite été transformées en logarithme base 2 (log₂CPM) pour stabiliser la variance et rendre les données appropriées aux analyses statistiques multivariées.
Le Fold Change mesure le rapport des niveaux d'expression moyens entre les deux conditions :
Transformation en log₂FC pour obtenir une distribution symétrique :
Les p-values ont été ajustées par la méthode de Benjamini-Hochberg pour contrôler le False Discovery Rate (FDR). Le FDR correspond à la proportion attendue de faux positifs parmi les gènes déclarés significatifs.
FDR < 0,05 : Ce seuil équilibre le contrôle des faux positifs et la capacité de détection. Un seuil plus strict (FDR < 0,01) réduirait les faux positifs mais pourrait exclure des gènes biologiquement importants avec des variations modérées. Dans cette étude exploratoire visant à identifier un large ensemble de gènes candidats, ce seuil est approprié.
|Log₂FC| > 1 : Ce critère garantit que les différences identifiées sont biologiquement pertinentes (variation d'au moins un facteur 2), pas seulement statistiquement significatives. Il permet d'écarter les fluctuations de faible amplitude dues au bruit technique ou à la variabilité biologique résiduelle.
L'ensemble des contrôles qualité réalisés par le workflow nf-score/rnaseq et le rapport MultiQC confirment l'absence de biais techniques majeurs dans le jeu de données fourni.
L'ACP a été réalisée sur les données log₂CPM pour visualiser la structure globale des données et détecter d'éventuels outliers ou effets batch.
Figure 2 : Histogramme des valeurs propres. Les deux premières composantes principales expliquent 60% de la variance totale, ce qui est suffisant pour résumer de façon pertinente les variations entre individus.
Figure 3 : Projection des 12 échantillons sur les axes PC1 (48,18%) et PC2 (11,8%). ● Souche sauvage (WT) | ● Souche mutante (ΔbrlA)
| Métrique | Valeur |
|---|---|
| Moyenne des Log₂FC | -0,188 |
| Médiane des Log₂FC | 0,0323 |
| Log₂FC minimum | -16,2 (gène AtWU_03937) |
| Log₂FC maximum | +14,1 (gène AtWU_03812) |
Les volcano plots permettent de visualiser simultanément la significativité statistique (FDR) et l'amplitude de variation (Log₂FC) pour l'ensemble des gènes testés.
Figure 4 : Volcano plot des gènes différentiellement exprimés (FDR < 0,05, |Log₂FC| > 1). ● Gènes sous-exprimés | ● Gènes surexprimés | ● Variation non significative
Figure 5 : Heatmap des similarités entre échantillons. Les réplicats d'une même condition se regroupent fortement, confirmant la cohérence biologique et l'absence d'effets batch.
L'annotation fonctionnelle des gènes a été réalisée par Marie-Françoise Jardinaud en utilisant deux référentiels complémentaires :
Figure 6 : Composants cellulaires enrichis parmi les DEGs. Les composants les plus affectés sont la membrane plasmique, le milieu extracellulaire et le noyau.
Interprétations :
Figure 7 : Processus biologiques enrichis. Les processus métaboliques des glucides, le métabolisme secondaire et les réponses aux substances toxiques sont fortement représentés.
Figure 8 : Fonctions moléculaires enrichies. Prédominance des activités oxydoréductases, hydrolases et transporteurs transmembranaires.
Section en cours de développement - heatmaps sur des gènes d'intérêt spécifiques
Section en cours de rédaction
Analyse en cours
Investigation en cours
Analyse en cours
Le gène BrlA étant impliqué dans la croissance métabolique globale au-delà de la sporulation, une part des 1 903 DEGs identifiés pourrait refléter des effets indirects de la mutation. La distinction entre effets directs (sporulation) et indirects (métabolisme général) nécessite une analyse plus approfondie.
Seuls 37% des gènes du génome sont annotés, limitant l'interprétation fonctionnelle de 1 509 DEGs (79,3% des DEGs totaux)
L'utilisation de FDR < 0,05 favorise la sensibilité au détriment de la spécificité. Des validations expérimentales seront nécessaires
L'analyse compare uniquement des conditions statiques. L'étude en conditions agitées serait nécessaire pour valider les hypothèses
Section en cours de rédaction
Cette analyse RNA-seq comparative entre souche sauvage et mutante ΔbrlA d'Aspergillus tubingensis a permis d'identifier 1 903 gènes différentiellement exprimés avec une qualité de données exceptionnelle confirmée par l'ACP. La prédominance de gènes sous-exprimés dans la souche mutante conforte le rôle d'activateur transcriptionnel du facteur BrlA dans la cascade de sporulation.
L'analyse fonctionnelle en cours révèle des altérations majeures dans les processus métaboliques, particulièrement au niveau de la membrane plasmique, du milieu extracellulaire et du noyau. Les 394 gènes annotés constituent une base solide pour approfondir l'étude du lien entre sporulation et production de NGPs.
Les résultats obtenus ouvrent la voie à des investigations plus poussées sur les voies de biosynthèse du métabolisme secondaire et sur le potentiel développement d'un bioprocédé optimisé pour la production de naphto-γ-pyrones en conditions industrielles.