Des gènes soit presque morts soit presque vivants

cliquez sur l’image

On sait depuis longtemps que les gènes naissent, vivent et meurent. Forcément, puisqu’on observe des gènes dans certaines espèces mais pas d’autres (par exemple y a des récepteurs aux estrogènes chez les vertébrés mais pas chez les mouches, encore moins les plantes ou les champignons), donc ils du « naître » à un moment, et on observe parfois que la distribution doit s’expliquer par une perte (par exemple presque tous les mammifères ont l’enzyme de synthèse de la vitamine C, sauf un sous-groupe de primates dégénérés dont nous sommes), donc le gène a du « mourir ».

Un article récent dans Nature (dont d’accès fermé, désolé) propose un très joli modèle sur la façon dont ce cycle vie-mort des gènes peut se produire, et met en avant surtout l’aspect graduel de la transition entre ADN codant pour un gène fonctionnel (« vivant ») ou non.

Ils ont utilisé plusieurs avantages du modèle « levure » : la levure S. cerevisiae (de boulanger et autres fermentations) est très bien étudiée du point de la fonction des gènes ; les levures ont des génomes très compacts où presque tout est fonctionnel, donc c’est facile d’étudier le reste ; et on a les génomes de 13 autres levures plus ou moins apparentées à S. cerevisiae, qui permettent de faire des comparaisons à différents degrés de divergence évolutive (comme on pourrait comparer le génome humain à ceux du chimpanzé, du gorille, du macaque, d’un lémurien, de la souris, etc).

Dans le génome de la levure (quand je dis la levure, je veux dire S. cerevisiae, OK ?) on connait des gènes bien définis, clairement fonctionnels. On connaît aussi des pseudo-gènes, qui sont des cadavres de gènes ayant perdu leur fonction mais ayant encore une ressemblance notable au gène dont ils sont issu. Les pseudo-gènes n’étant pas protégés par la sélection naturelle accumulent beaucoup de mutations, et deviennet peu-à-peu indistinguables de l’ADN non fonctionnel aléatoire.

Mais les gènes et pseudo-gènes connus ont un biais de taille si je puis dire : on sait très mal détecter les plus petits des gènes. On manque de signal statistique.

Pourquoi donc ? Parce qu’une séquence courte peut sembler avoir les propriétés d’un gène par hasard. Tiens donc. Et alors une séquence courte ne pourrait-elle pas réellement avoir les propriétés d’un gène par hasard ? L’hypothèse que testent (et démontrent c’est pour ça qu’on en cause) les auteurs est que des séquences courtes peuvent générer au hasard des « proto-gènes », des gènes naissant. Pour tester cela, ils prévoient qu’il y ait non pas une division nette entre gènes clairement actifs et conservés dans l’évolution, et séquences non géniques inactives et non conservées, mais un continuum entre les deux, avec les proto-gènes généralement plus courts, moins actifs (ils sont encore en train de devenir des gènes), et moins conservés dans l’évolution (ils viennent d’apparaître).

Et c’est ce qu’ils observent : plus une séquence qui ressemble à un gène (clairement fonctionnelle ou proto-gène potentiel) est longue, plus elle est exprimée (en première approximation, plus elle produit de protéine), plus les protéines potentielles sont codées efficacement (codon bias index, fréquence des acides aminés), plus les protéine potentielles sont solubles (moins hydrophobe, moins de régions transmembranaires, moins de régions désorganisées). De plus, si on ne regarde que les gènes potentiels courts, ceux qui sont partagés seulement entre la levure et des espèces très proches, donc sont apparus récemment, ressemblent moins à des gènes fonctionnels que ceux qui sont partagés par des espèces éloignées, et donc existent depuis longtemps. On voit donc les différentes étapes du passage de proto-gène à vrai gène, en comparant des séquences qui ont des âges évolutifs différents.

Donc il y a bien naissance progressive des gènes à partir des séquences aléatoires, de manière approximativement symmétrique à la mort progressive des gènes, qui deviennent des séquences aléatoires. A noter que ce sont des processus réversibles : un proto-gène peut être inactivé par une vilaine mutation et redevenir non fonctionnel. Et il y a des cas connus de pseudo-gènes réactivés par une gentille mutation, et redevenus donc des gènes actifs. Et bien sûr dans l’ADN non fonctionnel « aléatoire », on ne sait pas quel fraction est composée de pseudo-gènes tellement dégénérés qu’on ne les reconnaît plus, mais peuvent maintenant donner naissance à des pseudo-gènes.

Et on a donc le « cyle de la vie » des gènes suivant :

cliquez sur l’image si vous avez un abonnement à Nature

7 réponses à “Des gènes soit presque morts soit presque vivants

  1. « cliquez sur l’image si vous avez un abonnement à Nature », j’adore 🙂

  2. Ping : Des gènes soit presque morts soit presque vivants | C@fé des Sciences | Scoop.it

  3. Ping : Semaine du c@fé de la mort | Tout se passe comme si

  4. Article très intéressant!

    Peut être que je me trompe mais il me semble avoir lu quelque part que les pseudo-gènes pouvaient avoir un rôle assez important dans la cellule. Leur transcription permettrait de bloquer plus ou moins l’action des microARN sur le gène ressemblant. Par exemple si un microARN A régule négativement le gène X, le pseudo-gène X’ (ressemblant au gène X mais inactif) peut être transcrit pour empêcher cette régulation négative. Est ce que je me trompe ?

  5. Je ne suis pas sûr d’avoir tout compris, mais cette histoire de longueur de gène m’intrigue car elle me rappelle les propriétés des mots eux-mêmes et la loi de Zipf. Est-ce que, comme dans une langue, plus le gène est court plus la protéine est fréquemment utilisée et de signification à large spectre (comme en français, le mot « le », « a », « ou » etc. qui sont à la fois courts, fréquents et peu significatifs)?

  6. Ping : Pourquoi est-ce que l’étude #Seralini sur les #OGM m’énerve ? | Tout se passe comme si