L'encyclopédie des Sciences
  Le concept de génome minimal bactérien
 
Le concept de génome minimal bactérien

La complexité des génomes simplifiés amène de nouvelles questions en biologie. Par Guillaume Calu
Publié le mercredi 17 mai 2006. Dernière modification le mardi 16 mai 2006. 
Avec le séquençage des génomes procaryotes, le concept de génome minimal est devenu un champ d’investigation en génétique bactérienne. Cet article en résume les concepts et décrit les éléments de comparaison entre bactéries dotées des plus petits génomes, avant d’aborder les différentes méthodes d’investigation mise en avant dans l’élaboration de génomes minimaux.

 

Origines du concept

Définir la Vie reste une question philosophique majeure en sciences, à laquelle des générations de biologistes ont essayé de répondre depuis l’Antiquité. Cependant, l’émergence de la biologie moléculaire et du courant réductionniste (la vie étant considérée uniquement au travers de son matériel génétique) ont amené de nouvelles hypothèses et controverses en biologie : l’ADN, support de l’information génétique, est rapidement devenue le centre d’investigation et de réflexion des biologistes. Son étude a tout de suite montré la grande diversité de taille des génomes, entre super-règnes du Vivant comme au sein même des procaryotes.

Le concept de génome minimal est apparu lors des premiers séquençages de génomes. Celui de Mycoplasma genitalium, un mycoplasme présent dans le tractus uro-génital, a ainsi été étudié par séquençage et par PFGE (Pulsed-Field Gel Electrophoresis) (Colman et al., 1990 ; in Peterson & Fraser, 2001). Les données révélèrent que son génome compte 580 kpb pour 517 gènes (480 gènes codant pour des protéines et 37 gènes codant pour des ARN) (Hutchison et al., 1999). Ce génome est actuellement le plus petit génome bactérien connu. Son évolution à partir d’un ancêtre Gram+ l’a conduit à adopter une vie parasitaire ; il apparaît que certains gènes, codant pour des fonctions nécessaires à sa survie hors de son hôte, ont été délétés. M. genitalium tire de son hôte gîte et nutriments. Les gènes nécessaires à la biosynthèse des 20 acides aminés essentiels, à la synthèse de la paroi, ceux codant pour les enzymes du cycle de Krebs et bon nombre d’autres gènes d’enzymes impliquées dans des voies de biosynthèse ont été délétés. Cette réduction vers un génome minimal serait donc liée à l’évolution de M. genitalium dans son hôte. Cependant, les pressions sélectives et leurs mécanismes aboutissant à cette réduction ne sont pas clairement connus. Par la suite, le génome de M. pneumoniaeet al., 1996 ; in Peterson & Fraser, 2001), montrant la présence de 733 gènes (dont 689 codant pour des protéines) et une taille de 816 kpb (PubMed, 2006). Ce mycoplasme présente les mêmes délétions que M. genitalium. Cette découverte pose de nouvelles questions : pourquoi ce génome minimal est-il plus gros que celui de M. genitalium ? Et peut-on descendre plus bas le nombre de gènes minimaux ? (mycoplasme parasite humain) fut séquencé et analysé (Himmelreich

La théorie du génome minimal unique mise à mal par la Nature

Des expériences de saturation de mutation ou de ‘gene silencing’ ont ainsi été menées chez M. genitalium. La manipulation consiste à réaliser une série de cycles de mutagenèses, jusqu’à ce que les bactéries ne puissent plus se développer. Mais rapidement, les chercheurs remarquèrent que la santé physiologique (ou fitness) des mutants viables décroissait au fur et à mesure des cycles de mutation. Cette faiblesse physiologique peut être compensée par un apport de nutriments, mais le milieu de culture est alors modifié, en fonction des nouveaux besoins des mutants. Cette expérience montre par là même que la recherche d’une bactérie viable dotée d’un génome minimal est influencé par son milieu : en effet, lors de ces recherches, les mycoplasmes sont mis en culture dans un milieu riche, favorable à leur croissance, leur apportant tous les nutriments qu’ils ne peuvent plus synthétiser ainsi que des conditions physico-chimiques optimales. Mais dans la Nature, il n’existe nulle part d’environnement aussi favorable, mais un grand nombre de niches environnementales imposant leurs conditions aux micro-organismes. Ces derniers doivent donc s’y adapter ou disparaître.

La notion de génome minimal, dans la mesure où il est impossible de trouver dans la nature un seul et unique génome minimal universel, reste donc théorique. Mais il est possible de tendre, pour chaque environnement donné, vers un jeu de génomes minimaux viables. La pression de l’environnement, et l’occupation d’une niche environnementale, agit sur l’acquisition ou la délétion de gènes. En arrivant dans une nouvelle niche environnementale, le micro-organisme va être soumis à de nouvelles conditions, et la valeur sélective de chaque gène va être redéfinie. Il va en conséquence se « spécialiser » en fonction de ces nouvelles conditions. Si l’acquisition de nouveaux gènes lui ouvrent de nouvelles possibilités, la perte de gènes va conduire le micro-organismes à une voie sans issue, et cette réduction ne peut qu’être unidirectionnelle (il ne peut y avoir par la suite de retour vers l’état primitif).

La perte de n’importe quel gène va également limiter le nombre de fonctions possibles, ainsi que la tolérance aux pertes futures. Par exemple, les transporteurs membranaires chez les Mycoplasmes ont vu leur nombre diminuer, mais ceci a été compensé par une large gamme de substrats pris en charge par les transporteurs restants. Cependant, la délétion d’autres gènes de transporteurs peut affecter les Mycoplasmes en les privant d’un plus large panel de solutés.

Gènes homologues

PNG - 15.7 ko
Figure 1 : les gènes homologues

Au cours de l’évolution des organismes, les gènes dits homologues sont apparus, hérités de la duplication et de la différenciation d’un gène ancestral. Deux étapes sont distinguées : les gènes paralogues, issus de la duplication d’un gène premier, et se différenciant progressivement. Ils codent pour des protéines ayant même structure 3D et des fonctions similaires mais avec quelques différences notoires. Puis, lorsque l’organisme ancestral a donné naissance à deux lignées suite à un phénomène de spéciation, il faut alors parler de gènes orthologues. Des protéines homologues ont un pourcentage de similitude de séquence de plus de 35 %. Par contre, deux gènes différents ayant évolué vers une fonction commune sont dits analogues.

La distinction entre orthologues et paralogues, et la détection des déplacements de gènes orthologues, sont deux notions évolutionnistes importantes pour l’estimation de jeux de gènes minimaux compatibles avec la vie cellulaire (Peterson & Fraser, 2001)

Définir les gènes essentiels

Il est possible de distinguer au sein du génome deux groupes de gènes : les gènes essentiels et les gènes dispensables.

PNG - 1.5 ko
Figure 2  : gènes essentiels et dispensables

Si nous revenons à la recherche du génome minimal théorique, ce groupe de gènes essentiels serait donc une construction de l’esprit pour tenter de définir les gènes indispensables dans n’importe quel environnement, aux fonctions communes à tous les organismes, et qui permettraient d’assurer la viabilité de l’organisme. Mais quels seraient ces gènes ? Pour les identifier, il nous faut tout d’abord distinguer les caractéristiques fonctionnelles d’un organisme vivant. Pour cela, utilisons celles rédigées par Jean-Claude Callen à l’attention de ses étudiants (Callen, 1999) : d’après cet auteur, les propriétés fonctionnelles de tout être vivant sont :

 L’accroissement et le renouvellement de sa matière
 La réaction à son milieu et l’excitabilité
 La reproduction conforme (malgré la possibilité d’erreurs lors de l’évolution) de l’organisme.

Les gène indispensables sont liés à ces fonctions :

 Assurer la transcription des gènes en ARN et la traduction des ARNm en protéines, produire de l’énergie et assurer le transport membranaire correspondent à des notions de croissance et de métabolisme
 Garantir l’homéostasie de la cellule correspond à des notions de réaction avec son milieu.
 Répliquer l’ADN et assurer la division cellulaire correspondent à la notion de reproduction.

A ces gènes essentiels viennent s’ajouter des gènes ayant eu un avantage sélectif par le passé (potentiel de biosynthèse d’un métabolite, éviter le système immunitaire, ... ) selon l’environnement. C’est l’influence de l’environnement qui, rappelons-le, va induire on non l’importance de tel ou tel gène dispensable.

Comparer les génomes connus

L’approche du génome minimal a donc été abordée en cherchant un jeu de génomes minimaux (Mushegian & Koonin, 1996 ; in Peterson & Fraser, 2001). L’étude de deux génomes entièrement séquencés, M. genitalium et Haemophilus influenzae, deux Eubactéries parasitaires ayant divergé voilà 1,5 millions d’années, a montré que les gènes en commun sont au nombre de 250 et codent pour des fonctions basiques. Haemophilus influenzae est une gamma-protéobactérie (gram -). Son génome mesure 1913 kbp et comprend 1868 gènes (dont 1791 codent pour des protéines). Mais cette bactérie est aussi parasite de l’Homme, il est possible que la comparaison soit biaisée par cette propriété en commun avec M. genitalium, et que les pressions sélectives de leurs environnements soient très semblables.

De même, la comparaison de M. genitalium et M. pneumoniae a conduit à la démonstration suivante : une comparaison des séquences d’acides aminés chez les protéines orthologues révèle un taux d’identité de 65%, suggérant une plus grande distance entre les deux génomes que ce qui avait été supposé précédemment. Le génome de M. genitalium est probablement un sous-ensemble du génome de M. pneumoniae, qui possède 210 gènes en plus.

PNG - 3.7 ko
Figure 3 : hypothèse du génome de Mycoplasma genitalium sous-ensemble du génome de Mycoplasma pneumoniae.

Les différences : 6 réarrangements chromosomiques majeurs et plus de 10 délétions chromosomiques. Mais la synténie (ordre des gènes) est bien conservée (espèces proches). Pour expliquer cette dichotomie apparente, il a été a supposé que Mycoplasma était un genre capable de nombreuses mutations, probablement en raison de la perte de systèmes de réparation de l’ADN et de la présence de mutator loci (Peterson & Fraser, 2001). Les différences souligneraient la perte de gènes chez M. genitalium après divergence depuis l’ancêtre commun. Bien que toutes les deux parasites de l’Homme, leur milieu environnemental est peut-être suffisamment différent (tractus uro-génital chez l’une et poumons chez l’autre) pour que les pression sélectives sur les gènes diffèrent. Enfin, une explication de cette différence de gènes repose aussi sur le fait que M. genitalium a acquis le statut de pathogène intracellulaire.

Un troisième génome de mycoplasme a été par la suite séquencé : Ureaplasma urealyticum. Il mesure 0,75 Mb et possède 613 ORF (Open Reading Frames). Une perte inégale de gènes a eu lieu chez ce mycoplasme par rapport aux autres mycoplasmes. Il est plus distant de M. pneumoniae et M. genitaliumU. urealyticum et M. genitalium. 74 gènes sont absents chez U. urealyticum et présents chez M. genitalium. Ces 74 gènes sont utiles à M. genitalium. 10 de ces 74 gènes codent pour des fonctions impliquées dans la production d’énergie. Les gènes de la glycolyse ont été également substitués. U. urealyticum a évolué de façon à produire de l’ATP à partir de l’hydrolyse d’urée. Absence de protéines chaperonnes GroES et GroEL, et de la protéine ftsZ (protéine cytokinesis). Leur absence de ce mycoplasme n’est pas claire. sur le plan phylogénétique. Seulement 324 gènes sont partagés entre

Virtuellement, tout gène dans le génome de M. genitalium a un orthologue dans le génome de M. pneumoniae. En partant du principe que les deux bactéries ont un ancêtre commun à génome plus large, il semble possible que les différences entre les 2 génomes reflètent la perte de gènes qui est survenue chez M. genitalium après spéciation. Mais cette perte de gènes serait unidirectionnelle. Il est concevable que M. genitalium se soit adapté à un environnement encore moins sélectif, autorisant plus de pertes de génome, en comparaison avec M. pneumoniae.

Les mycoplasmes et ne sont pas les seules bactéries étudiées. En 2005, 20 génomes d’alpah-protéobactéries étaient séquencés, pour une taille variant de 1,1 à 9,1 Mpb. Les alpha-protéobactéries sont très souvent impliquées dans des mutualismes ou des parasitismes avec des Eucaryotes. Leurs génomes ont subi , depuis la spéciation à partir de leur ancêtre commun, deux épisodes indépendants de réduction du génome. La conservation de l’ordre des gènes (synthénie) varie selon les cas : des épisodes indépendants de remodelage ont contribué à l’état actuel des génomes des alpha-protéobactéries : si certaines espèces proches ont largement conservé l’ordre de leur génome (comme chez les Bartonella), ce n’est pas toujours le cas, comme chez Wolbachia (Sällström & Andersson, 2005).

La réduction des génomes peut également prendre des dimensions impressionnantes : chez Blochmannia floridanus, parasite cellulaire d’Hémiptères dont l’ancêtre commun avec Escherichia coli remonte à près de 100 millions d’années, 70 à 75% du génome ancestral a été perdu (Klasson & Andersson, 2004).

Méthodes d’investigation

A partir de ces connaissances théoriques, de nombreuses méthodes d’investigation ont été mises au point, afin de rechercher différents jeux de génomes minimaux :

La première méthode utilise la technique de mutagenèse par insertion de transposons. L’intérêt de cette méthode est d’inactiver plusieurs gènes. Si aucun gène essentiel n’est inactivé, la bactérie mutée est viable. Les zones de jonction entre le génome et les séquences transposables insérées sont séquencées, révélant une cartographie des sites d’insertion. Chez M. genitalium, il a été ainsi possible de repérer les gènes essentiels : 265 à 350 gènes codant pour des protéines. Cependant, cette méthode a ses limites : l’insertion peut être sans effets et n’interrompra pas de gène, ou bien une même fonction sera exprimée par plusieurs gènes et l’inactivation d’un de ces gènes n’aura pas d’effet sur la viabilité de la bactérie (Hutchison et al., 1999).

Une autre technique d’inactivation de gènes consiste à effectuer une recombinaison homologue spécifique. L’inactivation est réalisée gène par gène, grâce à l’apport de séquences complémentaires sur un vecteur plasmidique qui insère ainsi avant le gène un promoteur inductible IPTG-dépendant. Si la bactérie peut se développer sans IPTG, alors le gène mis sous contrôle du promoteur inductible n’est pas considéré comme essentiel. L’étude réalisée sur 2957 gènes de Bacillus subtilis (Kobayashi et al., 2003) a mis en évidence 150 gènes essentiels, impliqués dans la réplication et l’empaquetage du génome, la transcription, la traduction et les voies métaboliques majeures (biosynthèses de la paroi, de cofacteurs, de nucléotides, glycolyse, fermentation).

Les ARN anti-sens permettent de passer sous silence des gènes cibles précis. Cette technique a été effectuée gène après gène chez Staphylococcus aureus, mettant en évidence 150 gènes essentiels pour son développement en laboratoire. Cette technique sous-entend une très bonne connaissance des cadres de lecture des gènes ciblés, afin de pouvoir concevoir les ARN anti-sens et d’interpréter les résultats obtenus sur la croissance de la bactérie (Kobayashi et al., 2003).

La mutation par saturation, quant à elle, consiste à effectuer plusieurs cycles de mutagenèse, en contrôlant entre chaque cycle la capacité des bactéries à se développer. Cependant, les bactéries mutantes perdent rapidement leur bon état de santé physiologique (fitness) jusqu’à ne plus pouvoir croître. Cette expérience, réalisée sur Mycoplasma genitalium, a montré qu’au bout de 100 cycles, le mycoplasme n’était plus capable de se développer. Cela laisse sous-entendre deux hypothèses : soit le génome de M. genitalium possède des gènes aux fonctions redondantes ou partiellement redondantes, lui permettant ainsi de supporter un certain nombre de cycles de mutations ; soit la contribution au fitness est variable suivant les gènes, et l’inactivation de ceux ayant la plus faible valeur peut être envisagée sans trop nuire à la bactérie (Peterson & Fraser, 2001).

L’approche informatique par comparaison de génomes séquencés a également été introduite afin de caractériser les gènes essentiels. Pour cela, des algorithmes de recherche de gènes orthologues ont trié afin d’identifier les groupes communs au plus grand nombre d’organismes (outil de comparaison COG). Les résultats permettent d’estimer que 55% à 83% des gènes codant pour des protéines chez les Eubactéries et chez les Archées sont des gènes orthologues. Par la suite, la comparaison de 21 génomes d’organismes choisis dans les trois super-règnes du Vivant ont mis en évidence 80 gènes universellement conservés. Cependant, cette méthode ne permet pas de définir un génome minimal global théorique. De plus, les algorithmes utilisés ne sont pas capables de détecter les gènes ayant trop divergé, ou bien ayant subi trop d’événements indépendants de mutation depuis leur divergence (Peterson & Fraser, 2001).

Comment éviter la redondance ?

Un moyen d’estimer indirectement la redondance consiste à estimer le niveau de paralogie - la fraction de gènes qui ont au moins un paralogue dans leur génome. Le niveau de paralogie entre E. coli et H. influenzae, deux espèces relativement proches, est estimé à respectivement 50% et 33%, alors que le nombre de gènes chez E. coli est 2,5 fois plus élevé. Le ratio du nombre de gènes est de 1,4:1, et le ratio des niveau respectifs de gènes paralogues est de 1,15 :1 entre M. genitalium et M. pneumoniae (Peterson & Fraser, 2001). Le degré de paralogie chez deux espèces phylogénétiquement proches semble changer d’un rapport de la racine carrée du ratio du nombre de gènes.

Existe-t-il une limite physique au génome minimal ?

L’existence de génomes viraux et de plasmides, incapables de se dupliquer seuls et utilisant des hôtes cellulaires pour se faire, pose le problème de la taille minimale absolue d’un génome. En effet, les génomes viraux ont une taille plus petite que les génomes bactériens (mis à part les récentes découvertes autour des mimivirus). Leur réplication est également possible grâce à la présence de séquences de réplication (ou origines de réplication). Les plus petites ORI connues appartiennent au plasmide ColE2 et mesurent 32 pb. Cependant il n’est pas physiquement possible qu’un tel fragment se réplique seul : il ne peut en effet se circulariser et être ainsi reconnu par la machinerie réplicative de l’hôte. Il est donc nécessaire qu’il soit accompagné d’un fragment supplémentaire, afin que la circularisation soit possible, et éventuellement codant pour une protéine ou un ARN permettant la formation d’un complexe de réplication et la mise en route de la machinerie réplicative (Wegrzyn, 2001).

Conclusion

Bien que le génome minimal reste une notion théorique, approchable en laboratoire grâce à des conditions de culture propices palliant les carences de la bactérie, ces études laissent entrevoir une application de choix en biotechnologies : en effet, réaliser un génome minimisé selon les besoins de l’industriel et les conditions de culture en bioréacteurs permettrait de produire des composés d’intérêt, sans risque de contamination par d’autres métabolites. De plus, la capacité de stockage de gènes recombinants serait alors plus importante, l’ADN complémentaire insérée remplaçant les gènes dispensables délétés. Enfin, ces études permettent d’envisager une meilleure compréhension des génomes minimums de parasites, ce qui pourrait permettre d’élaborer de nouveaux traitements-cibles contre ces agents pathogènes.

 
 
  nombre de visiteurs venus 771178 visiteurs (2611558 hits) Ici!

Tracked by Histats.com
Recherche personnalisée
$value) { if ($param == 'client') { google_append_url($google_ad_url, $param, 'ca-mb-' . $GLOBALS['google'][$param]); } else if (strpos($param, 'color_') === 0) { google_append_color($google_ad_url, $param); } else if ((strpos($param, 'host') === 0) || (strpos($param, 'url') === 0)) { google_append_url($google_ad_url, $param, $google_scheme . $GLOBALS['google'][$param]); } else { google_append_globals($google_ad_url, $param); } } google_append_url($google_ad_url, 'dt', round(1000 * array_sum(explode(' ', microtime())))); return $google_ad_url; } $google_ad_handle = @fopen(google_get_ad_url(), 'r'); if ($google_ad_handle) { while (!feof($google_ad_handle)) { echo fread($google_ad_handle, 8192); } fclose($google_ad_handle); } ?>
 
 
Ce site web a été créé gratuitement avec Ma-page.fr. Tu veux aussi ton propre site web ?
S'inscrire gratuitement