Archives pour l'étiquette sciences de la vie

Vent de folie dans les journaux scientifiques: 2- halte aux parasites qui osent analyser les données

Après le dogme cladiste issu du fond des ages, un nouvel épisode de « maman j’ai raté le 21ème siècle », avec l’éditorial du New England Journal of Medicine du 21 janvier. Contrairement au journal Cladistics (voir billet précédent), NEJM est très connu et reconnu, l’un des plus prestigieux de la recherche en médecine :

Dan L. Longo, M.D.*, and Jeffrey M. Drazen, M.D.* Data sharing N Engl J Med 2016; 374:276-277
* M.D. = medical doctor, parce que pour les chercheurs en médecine les titres sont souvent importants ; no comment.

Que dit l’éditorial (j’ai mis une version rapidement annotée sur Dropbox ici) ? Après avoir dit quelques mots sur la beauté théorique du partage des données, ça se gâte :

The first concern is that someone not involved in the generation and collection of the data may not understand the choices made in defining the parameters.

Les éditorialistes s’inquiètent de ce que des chercheurs n’ayant pas participé à la collecte des données ne comprennent pas les subtilités de ces données, et donc les interprètent mal. Donc ils pensent que le rapport des méthodes dans les articles, et les informations fournies avec les données, ne suffisent pas à comprendre ce qui a été fait ? C’est très inquiétant. En science, on doit rapporter les choses de manière reproductible (voir débat à propos du code scientifique).

Ca devient pire :

A second concern held by some is that a new class of research person will emerge — people who had nothing to do with the design and execution of the study but use another group’s data for their own ends, possibly stealing from the research productivity planned by the data gatherers, or even use the data to try to disprove what the original investigators had posited.

Et d’une, il risque d’émerger une classe de gens qui volent la productivité des collecteurs de données (noble occupation on le comprend). Enchanté, moi je suis prof de bioinformatique depuis 2005, et je fais ça depuis le milieu des années 1990. Margaret Dayhoff a publié le premier atlas de séquences et structures de protéines en 1965 (pas trouvé de version en ligne), et Grantham et al (conflit d’intérêts : j’ai cosigné des articles avec deux des « et al ») ont découvert que différentes espèces utilisaient le code génétique universel de manière subtilement différente en analysant toutes les séquences d’ADN alors disponibles en 1980.

Et de deux, les éditorialistes ont peur que « même » de vils chercheurs utilisent les données des gentils collecteurs de données pour tenter d’invalider les hypothèses de départ. Mais c’est que ça oserait faire de la science ces vauriens ! (Bon, conflit d’intérêt, c’est ce que je fais moi, voir ici en anglais par exemple.)

On arrive à la phrase qui a le plus enflammé les réseaux sociaux des scientifiques :

There is concern among some front-line researchers that the system will be taken over by what some researchers have characterized as “research parasites.”

Ah on est des parasites ? Hop, hashtags Twitter #Iamaresearchparasite, #researchparasites et #researchparasite. Alors, là ça a réagi de partout : le storify.

Soyons justes, l’éditorial propose une solution : quand on veut analyser des données, on doit concevoir une hypothèse non évidente, contacter les auteurs de l’étude d’origine, et établir une fructueuse collaboration entre gens bien nés. Ca n’arrive en effet jamais de manière légitime que l’on veuille analyser les données de centaines d’expériences, que l’on veuille remettre en cause les analyses telles que publiées, ou que l’on veuille analyser des données publiées il y a des années par des personnes parties à la retraite ou ayant arrété de faire de la recherche. Et bien entendu ceux qui génèrent des données intéressantes ont le temps de prendre en compte et répondre de manière appropriée à toutes les demandes qui pourraient leur être faites (génome humain : plus de 18000 citations). Le bioinformaticien Claus Wilke donne sur son blog l’histoire intéressante d’un cas où il a du promettre de co-signer un papier pour avoir les données sur un soit-disant effet du jaune d’oeuf qui serait aussi mauvais pour la santé que le tabac. Ayant eu les données, il a refait l’analyse, trouvé que l’analyse de départ était faussée, et que l’hypothèse ne tenait pas. Les chercheurs en médecine concernés l’ont traité avec mépris, et il n’y a jamais eu de publication. Comme il avait signé de ne pas publier tout seul, ça en est resté là. Voilà le problème de la seule approche « collaborative » bien illustré.

Quelques autres réactions en vrac : Une traduction rigolote en anglais ordinaire. Un point de vue qui contraste cet éditorial avec les déclarations du vice-président américain sur le partage de données pour combattre le cancer. Puis un point de vue d’écologie (la science) discutant comme le partage des données peut en effet être difficile. Et une interprétation de cet éditorial comme le dernier des dinosaures mourants de l’ancienne façon de faire de la recherche bio-médicale.

Et puis c’est pas comme si ce journal avait un problème de reproducibilité des résultats, par exemple s’il avait un taux élevé d’articles rétractés :

corrélation entre facteur d'impact et taux de rétraction, avec flèche vers le journal que dont il est question ici

corrélation entre facteur d’impact et indice de rétraction, avec flèche vers le journal que dont il est question ici

Bon 4 jours plus tard ils ont publié un correctif (ce qui montre une fois de plus l’impact des médias sociaux sur la façon de fonctionner de la science, y compris ceux qui se croient à l’abri en haut de la tour d’ivoire). Ils disent qu’ils sont gentils, parce qu’ils ont signé des accords de diffusion des données. D’ailleurs même s’ils trouvent que c’est de mauvais goût, ils vont les respecter. Mais ils réitèrent que c’est légitime de considérer ceux qui analysent les données avec suspicion pour le moins. Et dans un article dans Forbes, l’auteur principal de l’éditorial a refusé de condamner le terme « parasites ». Comme dit sur le blog de Mick Watson, ce n’est pas encore des excuses, et c’est insuffisant.

Finalement le mieux qui soit sorti de tout ceci sont les dessins de RedPenBlackPen, qui dessine sur la science :

Vent de folie dans les journaux scientifiques: 1- la secte du Cladisme

Il y a eu récemment plusieurs éditoriaux ou billets d’opinion qui ont eu un certain, euh, écho sur les médias sociaux. Ils diffèrent par bien des points, mais ont en commun un certain aspect « what the fuck? » comme disent élégamment les américains.

Commençons par l’éditorial du journal Cladistics du 12 janvier (lien).  Je l’ai vu via ce tweet :

L’éditorial commence direct :

The epistemological paradigm of this journal is parsimony. There are strong philosophical arguments in support of parsimony versus other methods of phylogenetic inference (e.g. Farris, 1983).

Alors un peu de contexte. Il existe différentes méthodes pour reconstruire des arbres phylogénétiques, à savoir les relations évolutives entre espèces. Jusque dans les années 1960-70 la classification des espèces se faisait de manière très approximative, sans méthode formelle. Dans les années 1970 est apparu un mouvement appelé « cladistique », qui visait à réformer la classification des espèces en la rendant objective, suite à un livre de Willi Hennig (1966 pour l’édition anglaise). Les cladistes proposaient un critère de classification, les relations phylogénétiques. Et comme il n’existait pas de méthode objective pour reconstruire ces relations, et l’objectivité était leur objectif, ils ont aussi proposé une méthode formelle (programmable informatiquement même), dite de « parcimonie » (orthographe discutée ici 😉 ). Jusque là tout va bien. Mais dès la fin des années 1970 (1978 pour être précis) Joe Felsenstein a montré que dans certains cas identifiables la parcimonie pouvait se tromper de phylogénie de manière systématique. Ce sont ensuivies deux décénnies de débats entre d’un coté des bio-statisticiens (école dont je suis issu) qui cherchaient les limites des méthodes de phylogénie et les améliorations à y apporter, et de l’autre le groupe proclamant que seul l’usage de la parcimonie fait le vrai « cladiste », pour la plupart issues de musées d’histoire naturelle. Durant ma thèse cette dispute était encore vive, et je me rappelle de discours très agressifs de Guillaume Lecointre fustigeant les fausses phylogénies des statisticiens.

Depuis la plupart des phylogénéticiens sont passés du coté statistique de la force, notamment parce que l’amélioration conjointe des ordinateurs et du séquençage d’ADN fait que nous avons des données bien adaptées au traitement statistique. Et puis quand même une méthode dont on peut montrer qu’elle est juste a quelque chose de préférable à une méthode qu’on aime bien pour des raisons historiques (voir aussi débat dans ce billet).

Et donc l’éditorial de Cladistics, journal de la Hennig society, nous renvoie en arrière vers cette époque, et sans aucune nuance ni aucune leçon apprise. Il commence par dire que ce journal, c’est parcimonie et c’est tout. Il continue dans cette veine :

(…) we do not hold in special esteem any method solely because it is novel or purportedly sophisticated. Phylogenetic data sets submitted to this journal should be analysed using parsimony. If alternative methods are also used and there is no difference among the results, the author should defer to the principles of the Society and present the tree obtained by parsimony.

J’adore « because it is novel or purpotedly sophisticated ». Les éditeurs ne se laissent pas impressioner par une méthode juste parce qu’elle est nouvelle (plus récente que 1966) ou soit disant sophistiquée. Ca fait pas du tout vieux barbons.

Plus loin :

we do not consider the hypothetical problem of statistical inconsistency to constitute a philosophical argument for the rejection of parsimony

Les problèmes connus et documentés à répétition depuis 1978 ne les embêtent pas, puisqu’il ne s’agit pas d’un argument philosophique. Bin tiens. Une méthode d’estimation de phylogénie estime la mauvaise phylogénie, mais puisqu’elle est théologiquement philosophiquement pure, gardons-la.

Et une phrase qui a fait se gratter bien des têtes en biologie évolutive :

The absence of certain truth represents a philosophical limit of empirical science.

Euh… oui on ne sait pas toujours tout, mais est-ce une justification pour accepter des méthodes qui se plantent ?

Bref, cet édito a fait rire tout ce qu’internet a de biologistes évolutifs, avec un storify des tweets ici :

https://storify.com/phylogenomics/cladistics-journal-declares-long-live-parsimony

Il faut préciser que perso, faisant de la biologie évolutive, je n’ai plus rencontré ce genre d’attitudes depuis une vingtaine d’années, ce qui tend à indiquer que bien que des gens comme ça existent toujours, ils fréquentent peu les conférences habituelles de biologie évolutive. Je pense qu’ils vont entre eux à la conférence de la Hennig Society (voir à ce propos un compte-rendu rigolo de Dan Graur d’une de ces conférences ainsi que la discussion dans les commentaires).

Que penser de tout ceci ? Que le dogmatisme peut exister dans des sous-cultures de la communauté scientifique ; que ce dogmatisme est battu en brêche dans la communauté scientifique globale ; et qu’internet fait que ce genre d’attitudes s’attire le ridicule généralisé.

A bientôt pour une deuxième histoire d’éditorial étrange. Soyez sages.

ADN partout 3/3 : lire l’ADN est une technique très générale, aux applications infinies donc inconnues

dilbert_kit

Pourquoi est-ce que la démocratisation et la distribution ubiquitaire potentielle du séquençage d’ADN doivent vous concerner davantage que, disons, des microscopes de poche ou des chromatographes moins chers ? C’est parce que l’ADN est une molécule qui code de l’information. Les types d’informations codés et les usages que l’on peut en faire sont donc extrêmement divers. Ils sont illustrés mais certainement pas listés de manière exhaustive dans le billet précédent. L’ADN est le support de l’information, et c’est à cette information que le séquençage nous donnes accès. Quelque part, c’est aussi général que « savoir lire » : on peut tout lire.

Cette généralité du code donne à la démocratisation potentielle du séquençage d’ADN le potentiel d’applications révolutionaires ou triviales, mais doit en tous cas être compris pour bien être préparé à ce qui arrive. L’ADN contient l’information de la généalogie et du groupe ethnique, des maladies génétiques et des variations normales, des microbes que l’on porte et de ce que l’on a mangé.

Pour être clair : je ne suis pas contre le séquençage d’ADN, j’en fais moi-même  ;). Mais il me semble que nos sociétés avancent vers un avenir proche où le pouvoir de cette approche sera libéré, sans être prêtes du tout. Il y a ceux qui ont peur de tout, et ceux qui n’ont peur de rien. Comment faire pour avoir un débat pertinent et qui ne soit pas trop tard ?

ADN partout 2/3 : Séquençage d’ADN dans vos toilettes et à l’aéroport ?

une BD sympa même si le rapport est distant

une BD sympa même si le rapport est distant : cliquez et lisez

Il semble acquis que le séquençage d’ADN suit une trajectoire similaire à celle de l’informatique, mais en plus rapide (voir billet précédent). Lorsque le prix baisse à ce point, des applications qui étaient inimaginables peuvent devenir routinières. Pour l’informatique on voit ce que ça donne (y pas que les smartphones, quand le réparateur est venu j’ai appris que notre frigo a deux cartes mères…). Et pour le séquençage d’ADN, ça peut donner quoi ?

Un article récent propose justement des réponses à cette question, inspirons-nous en. Avec un grain de sel, l’auteur de l’article est très techno-optimiste, et serait probablement qualifié de scientisme par Cécile Michaut (voir ce billet / débat).

Yaniv Erlich 2015 A vision for ubiquitous sequencing. Genome Res. 2015. 25: 1411-1416 doi:10.1101/gr.191692.115

Yaniv distingue les « plateformes de séquençage » des « senseurs de séquençage ». Une plateforme de séquençage peut être une grosse machine statique, et doit être précise car lire de nouvelles séquences d’ADN inconnues. Un senseur de séquençage doit être petit et rapide, et doit plutôt reconnaître des séquences d’ADN connues.

T1.medium

Alors, quelles applications imagine Yaniv ?

Séquençage à la maison : des appareils domestiques sensibles à l’ADN
–> des toilettes intelligentes ! Bin oui, y a déjà un branchement à l’eau (pour les réactifs chimiques) et une collecte quotidienne de matériel biologique. Et en général il y a de la place en dessous, là où ça prend la poussière. Que peut-on voir dans ce « matériel biologique » ? La flore intestinale, indicateur de santé et plus généralement d’état physiologique. La nouriture (bin tiens), donc un suivi individuel de si on fait bien son régime, encore plus énervant que les sonneries de ceinture pas attachée en voiture et que les montres qui rappellent qu’on n’a pas assez marché. « Vous avez mangé beaucoup de sucreries aujourd’hui, or votre smartwatch me dit que vous avez à peine marché. » L’ADN de la personne, qui normalement ne change pas trop ; mais un cas où il change, ce sont les cancers. Le dépistage très précoce des cancers, ça ça peut être intéressant. On rigole, mais les toilettes sont une piste très sérieuse dans la mesure où il y a très peu de changements à faire à notre maison et à nos habitudes pour que ça marche.

Séquenceur grand public à acheter et utiliser où on veut : j’admets, même si ça devient possible, les applications ne me paraissent pas évidentes. Accessoirement, la régulation d’un séquenceur d’ADN généraliste (pas programmé spécifiquement pour reconnaître la flore intestinale par exemple) ne me paraît pas évidente du tout. Ceci dit, il y a eu beaucoup de réflexions sur ce que les gens accepteraient ou pas avant les smartphones, et quand l’iphone est sorti, on a vu : les gens acceptent tout si ça leur permet de partager des photos de chatons gratos.

Applications médicales et santé : C’est le gros morceau évident. Mais dans les détails, on peut penser à des applications pas si évidentes :
• séquençage rapide aux contrôles de sécurité des aéroports ; Yaniv pense surtout à la détection de maladies contagieuses, pour limiter les épidémies ; tout le monde à part lui se demande s’il fait confiance à la sécurité des aéroports avec son ADN.
• plus évident, le séquenceur portable pour médecins. Obtenir des résultats rapides et fiables sur le terrin, même en cas de crise humanitaire ; ou même à l’hôpital sans délai d’aller-retour à un labo d’analyses.
• et si on branche le séquenceur domestique sur le réseau de l’hôpital ? Des données sur le patient fiables, précises et en temps réel, notamment sur les maladies infectieuses.
• un peu similaire aux contrôles d’aéroport mais peut-être plus faisable (me semble-t-il), un suivi constant de points clés pour connaître la diffusion des maladies, telles que bouches d’aération, points d’épuration d’eau, les systèmes de circulation d’eau de batiments collectifs, etc.
• de même à l’hôpital, un séquenceur qui analyse de petits échantillons à intervalles courts et réguliers, pour un suivi en temps réel des patients.

Applications légales et de sécurité : Ah on rigole moins, là.
• séquençage rapide des « indices ADN » sur la scène même du crime ; admettons, encore qu’il faille avoir accès une base de données de suspects de manière sécurisée sur ledits lieux du crime, ce qui n’est pas évident. Mais ça pourrait je pense permettre d’innocenter rapidement quelqu’un, d’éviter une fausse piste.
• « identification positive de la cible » par les militaires ; permettez-moi d’avoir des doutes sur l’applicabilité pratique dans un contexte militaire de l’attente du résultats d’une analyse ADN.
• identification à la sécurité des aéroports : vous le sentiez venir quand ils mis des séquenceurs pour microbes, hein ? Ce qui est intéressant ceci dit c’est qu’on peut potentiellement identifier une personne sans l’avoir elle-même dans sa bases de données, grâce au partage d’information génétique au sein d’une famille (voir ce vieux billet à moi), par exemple pour retrouver de jeunes fugueurs.
Je me dois à ce point de citer une phrase de l’article (à propos d’identification de noms de familles depuis l’ADN) qui montre à la fois le potentiel des méthodes et (à mon avis) l’optimisme de Yaniv :

With careful implementation that is sensitive to genetic privacy and cultural issues (Kim and Katsanis 2013), such technology at checkpoints could play a role in fighting human trafficking

Oui ça peut marcher avec une mise en place très prudente qui fait très attention à tous les risques et sensibilités culturelles etc, mais ça peut aussi marcher sans. C’est même beaucoup plus facile sans les précautions. Alors, où va-t-on ?

Un point technique à noter sur tous les aspects d’identification d’individus c’est qu’à partir du moment où l’on sait quelle espèce on cherche (contrairement aux pathogènes) et où l’on connait bien la variabilité génétique présente dans l’espèce, bref dans le cas des humains, il y a besoin de peu séquencer pour avoir une identification fiable.

Industrie alimentaire: le séquençage d’ADN peut notamment servir au contrôle qualité :
• intégré dans la chaîne de production.
• spécifique pour des risques connus : champignons vénéneux, niveau de bactéries pathogènes dans la viande, traces d’allergènes, etc.
Par ailleurs, on peut imaginer un système de « code barre » pour authentifier des produits : une séquence d’ADN unique artificielle introduite dans des produits permettant de les reconnaître à coup sûr, pour les éviter ou s’assurer qu’on les a bien obtenus. Au cas où vous pensiez que ce soit difficile, ce type de technique de code barres ADN est utilisé en routine dans de nombreuses expériences de biologie moléculaire.
• codes barres ADN sur les aliments plus toilettes séquenceuses = aide au régime ! Killer app !

Bon c’est sympa tout ça, mais qu’en est-il de la faisabilité ? Parce que même si le prix du séquençage d’ADN baisse, il faut encore le faire. Or à l’heure actuelle il faut quand même préparer les échantillons d’ADN avant séquençage, et cette préparation est relativement longue (autant pour le séquençage en temps réel) et compliquée (autant pour le séquenceur à la maison). Mais : de nouvelles approches en développement promettent de diminuer les étapes de pré-traitement. Il n’est pas inimaginable qu’on puisse diminuer cela à un point où le séquençage ubituitaire devienne réellement praticable. Il faut quand même être conscient que le prix n’est pas la seule limitation. Les réactifs utilisés doivent être pour le moment stockés à différentes températures, souvent +4°C (frigo) ou -20°C (congélo), et se gardent mal. Yaniv propose deux pistes à cela : l’utilisation de réactifs lyophilisés que l’on réhydrate au dernier moment, peut-être même en cartouches toutes prêtes. Et des technologies solides plutôt que liquides, grâce aux nanotechnologies. Là aussi c’est moins science-fiction qu’on ne pourrait le penser, le séquenceur MinION ou la technique de la société BioNano, par exemple, reposent sur des nanopores et une part de nanotechnologie.

Un autre problème pratique est l’analyse des données : les séquences d’ADN sont inutiles sans analyse bioinformatique. On peut mettre le logiciel sur le séquenceur, mais il faut aussi connaître les séquences de référence auxquelles comparer, qui peuvent être très nombreuses (donc prendre beaucoup de place), et qui peuvent n’avoir d’intérêt que si elles sont à jour. On parle beaucoup de « cloud computing », d’envoyer les séquences chez un service via internet qui vous renvoie le résultat du calcul, mais avec les quantités de données que l’on a en séquençage d’ADN il faut prévoir de très bonnes bandes passantes, ce qui limite les applications du type médecine de brousse. Il y a aussi le problème que si le séquençage est rapide et que l’analyse prend 24h, on n’a pas vraiment la réponse de suite. Il faut donc travailler sur des méthodes bioinformatiques permettant une réponse « dès que possible », avec analyse des données en temps réel et rapport dès qu’on a la réponse cherchée (espèce de bactérie, individu recherché, etc). C’est faisable, mais ce sont des défis intéressants.

Il y a d’autres problèmes, statistiques. Par exemple, pour reconnaître un humain d’un groupe très étudié (les européens de l’ouest, au hasard), on aura davantage de résolution que pour une population africaine très peu étudié. Du coup, les chances de se tromper d’individu jusque parce qu’il a la bonne (ou la mauvaise) ethnicité se posera. Pour la microbiologie, reconnaître une espèce que l’on soupçonne être présente (E. coli dans la nourriture non traitée) est facile, reconnaître n’importe quelle espèce quand on ne sait pas ce que l’on cherche, et qu’on ne connait qu’une petite partie de toutes les espèces existantes, et nettement plus difficile.

Et bien sûr, il y a les implications « éthiques, légales et sociales ». On sent bien dans le papier que ce n’est pas ce qui intéresse Yaniv le plus, et peut-être a-t-il raison dans la mesure où son travail est d’explorer ce qui est techniquement possible, mais ça m’a quand même un peu mal à l’aise en lisant un papier par ailleurs très intéressant. D’autant que ces implications peuvent être le plus grand obstacle à la mise en place des solutions qu’il imagine.

D’abord, il existe dans de nombreux pays des lois interdisant ou complicant la collecte d’échantillons humains. Il faut noter qu’en fait nous laissons tous des échantillons partout derrière nous tout le temps, la question est donc leur usage délibéré. L’ADN humain est partout.

Yaniv suggère des messages d’avertissement aux utilisateurs, ou des mécanismes de suppression des séquences lues dès qu’elles ont été analysées, voire de suppression des séquences humaines avant analyse lorsque l’on cherche des séquences bactériennes (par exemple). Mouais, parce qu’on sait que tout le monde lit attentivement les messages d’avertissement des logiciels, apps, pages web, et smartphones que nous utilisons. Et nous faisons totalement confiance à Facebook, Ashley Madison, et demain Nesté ou la sécurité des aéroports, pour effacer les données compromettantes ou personnelles.

Un petit exemple de problème de vie privée pour finir : si des toilettes « intelligentes » peuvent lire l’ADN, elles peuvent savoir si quelqu’un d’extérieur à la famille est venu et a utilisé les toilettes, voire si cette personne vient régulièrement, par exemple quand l’un des partenaires d’un couple est absent…

Bref, tout est possible et rien n’est résolu.

ADN partout 1/3 : Le prix du séquençage baisse encore (plus)

cliquez sur l'image : Boulet au MIT (zombies inclus)

cliquez sur l’image : Boulet au MIT (zombies inclus)

Le prix du séquençage de l’ADN vient encore de se casser la gueule un peu plus, en décrochant du « plateau » de décroissance où il était depuis trois ans :

Sequencing graphs JAN_13

Sur le graphe ci-dessus, deux choses doivent être notées en plus du décrochement récent :

  1. L’échelle est logarithmique, c’est-à-dire qu’une ligne droite correspond à un changement exponentiel. Donc même la décroissance apparemment lente de 2012 à récemment est en fait une décroissance exponentielle simplement moins forte qu’avant.
  2. La droite blanche, c’est la « loi de Moore », la croissance exponentielle de la puissance de calcul des ordinateurs. La loi de Moore, c’est ce qui fait que votre téléphone est plus puissant que les ordinateurs disponibles à la NASA pour aller sur la Lune.

En corrolaire de ces deux points, remarquez que le séquençage d’ADN devient moins cher plus vite que la puissance des ordinateurs n’augmente depuis 2003, carrément plus vite depuis 2008. On peut remarquer que la différence entre les deux exponentielles est elle-même une exponentielle : tous les ans, pour le même prix, vous pouvez séquencer encore plus d’ADN par minute de calcul possible. Autrement dit, notre capacité à séquencer de l’ADN croit beaucoup beaucoup plus vite que notre puissance informatique.

Cela a plusieurs conséquences, que nous allons explorer en deux autres billets. Mais un point à noter d’entrée est que la croissance de la puissance informatique à prix constant a eu des conséquences qu’à-peu-près personne n’a prévu. Les smartphones ou le streaming des vidéos légalement ou pas sont essentiellement absents de la science fiction jusqu’à ce qu’ils apparaissent pour de vrai. Alors imaginer ce que va être le monde du séquençage d’ADN très bon marché est difficile. Une certitude : ce monde est déjà là :

Une autre figure, montrant les différentes techniques de séquençage commercialisées. Les points liés par des traits montrent des progrès d’une même machine.

developments_in_high_throughput_sequencing

Brève sur l’édition de génomes 2 : quelques faits rapides

cliquez sur l'image pour lire (et une critique de cette BD ici)

cliquez sur l’image pour lire (et une critique de cette BD ici)

Un deuxième billet rapide après « Tout se qui est possible sera-t-il fait ?« , basé sur un article dans Nature que je viens de voir qui fait un tour succint de la question :

Genome editing: 7 facts about a revolutionary technology. What everyone should know about cut-and-paste genetics. Nature News

1. Jusqu’ici, une seule étude de l’édition de génome humain dans des cellules germinales (permettant potentiellement de développer un embryon) a été publiée dans un article scientifique :

Liang et al 2015 CRISPR/Cas9-mediated gene editing in human tripronuclear zygotes Protein & Cell 6: 363-372

Dans cet article, les embryons n’étaient pas viables, mais on a envie de dire « pas encore ».

2. Les législations sur la question sont très différentes selon les pays. Notamment Nature dit qu’ils n’y a que « des réglèments inapplicables » en Chine, Japon, Irelande et Inde ; et que de nombreux scientifiques demandent une législation internationale. Sur laquelle j’ai personnellement des doutes, alors qu’il y a encore des pays qui ne reconnaissent pas le copyright (voir Convention de Berne).

3. Avec CRISPR/Cas9, il est facile de modifier des génomes, et les « biohackers » plus ou moins amateurs s’y intéressent (article dans Nature d’août). Contrairement aux techniques précédentes de génétique moléculaire, et c’est ce qui fait une partie de son potentiel révolutionaire, cette technique n’est pas réservée à quelques laboratoires très équipés avec du personnel très bien formé.

Mise à jour : vu dans cette excellente interview de Doudna et Charpentier (voir point 7), la companie Addgene vend des kits de CRISPR/Cas9.

4. D’autres enzymes que Cas9 sont en train d’être découvertes, ce qui va encore faciliter les choses (techniquement) ou les compliquer (pour réguler).

5. Les expériences les plus avancées ont lieu chez des cochons : super-musclés, mini, ou sur-édités. Pourquoi les cochons ? Notamment dans l’espoir de construire des donneurs d’organes animaux humain-compatibles. En attendant, ils pensent vendre les mini cochons comme animaux domestiques.

6. Les grosses multinationales et les millardaires s’y intéressent : la Gates Foundation, Google ou DuPont investissent dans CRISPR/Cas9.

7. Il y a une guerre de brevets entre Jennifer Doudna (University of California, Berkeley) et Emmanuelle Charpentier (Max Planck Institute) d’un coté, généralement créditées de l’invention du système, et Feng Zhang de MIT & Harvard de l’autre, qui a fait marcher le système dans des cellules humaines.

Et puis un 8ème point qui n’était pas encore connu quand l’article de Nature a été publié : la conférence sur l’édition de génomes a conclu que « Gene-editing technology should not be used to modify human embryos that are intended for use in establishing a pregnancy » (Nature news) : l’édition de génomes ne devrait pas être utilisée pour modifier des embryons humains prévus pour être utilisés pour une grossesse. Mais des cellules humaines chez une personne (thérapie génique), oui, et des embryons humains à fins non reproductives apparemment oui aussi.

Tout se qui est possible sera-t-il fait ? Brève sur l’édition de génomes humains #GeneEditSummit

cliquez pour des savant fous et solitaires

cliquez pour des savant fous et solitaires

Il y a une conférence en cours sur les aspects éthiques de l’édition de gènes et génomes humains. Ca a notamment été couvert par Le Monde (payant). La conférence a été organisée parce que la technique CRISPR/Cas9 (voir ici et ici) et ses dérivés permettent des modifications aisées des génomes. Et si c’est possible chez la souris ou le cochon, c’est possible chez l’humain (voir ici et ici).

Je ne vais pas écrire longuement sur le sujet maintenant, mais juste noter le tweet suivant de Paul Knoepfler, chercheur et blogueur sur les cellules souches (on a parlé de son blog ipscell ici) :

Philip Campbell est l’éditeur en chef de Nature, le journal scientifique le plus prestigieux de la planète. Et ce qu’il nous dit c’est que (1) des scientifiques font des expériences d’édition de lignée germinale (spermatozoïdes et ovules) humains, (2) ils soumettent les résults à Nature, (3) Nature refuse, (4) parce qu’ils n’ont pas suivi les règles éthiques du journal.

Il parait difficile d’en conclure autre chose que « si c’est faisable, ça sera fait ». Et que nos commentaires éthiques n’y changeront pas grand chose. Mais peut-être suis-je trop pessimiste. En tous cas, ça me parait un problème autrement plus urgent que les sempiternelles bisbilles autour des OGM en agriculture.

Voir aussi ce tweet par exemple, George Church étant un généticien très connu et favorable au laissez faire en la matière :

Je recommande de regarder les « top tweets » si vous êtes intéressés : https://twitter.com/hashtag/GeneEditSummit

Pacman ! Avec de l’ADN et des acides aminés !

cliquez sur le lien, c'est trop beau, trop cool, trop tout, allez sérieux

cliquez sur le lien, c’est trop beau, trop cool, trop tout, allez sérieux

Syed Hussain Ather, un étudiant d’un collègue américain (Matthew Hahn, mentionné ici), vient de rendre disponible sur github un programme Python rigolo qui reproduit PacMan mais en version biologie moléculaire : on mange de l’ARN, et on fabrique des protéines.

https://github.com/HussainAther/dnapacman

Pour traduire l’ADN en protéines, il est en effet transcrit en ARN. Les nucléotides d’ADN sont A, C, G et T (comme dans « Bienvenue à GATACA »), alors que ceux de l’ARN sont A, C, G, U (donc « Bienvenue à GAUACA »). L’ARN peut alors être traduit en protéines, composé de 20 acides aminés. Pour faire correspondre 4 nucléotides à 20 acides aminés, il y a un code basé sur des triplets de nucléotides. En effet, 41 = 4, pas assez ; 42 = 16 pas assez ; 43 = 64, davantage que 20, cool. Ces triplets s’appellent « codons ». (Notez que ça veut dire qu’il y a plusieurs codons pour un même acide aminé.) Pour que la traduction démarre, il faut un codon « start », AUG (codé par ATG dans l’ADN), qui code pour l’acide aminé méthionine (symbole M). Il y a dans le code standard trois codons « stop », qui arrêtent la traduction.

code génétique de Wikipedia

code génétique standard (depuis Wikipedia)

Dans DNA-PacMan (qui à mon avis devrait s’appeler RNA-PacMan, mais passons), il faut donc se balader en mangeant des nucléotides, et dès qu’on a mangé un AUG on commence à fabriquer des acides aminés, jusqu’à manger un codon stop … ou se faire manger par un fantôme.

C’est un programme simple qu’il faut lancer directement avec Python, et les résultats s’affichent dans une console terminale. Ce qui accentue encore le coté geek. 😉

pacman1pacman2

L’agriculture kényane prend le chemin des #OGM, les journalistes du Monde ne prennent pas le chemin du sens critique

cliquez pour une blague de mauvais goût

cliquez pour une blague de mauvais goût

Alors que j’essaye de me botter le derrière pour finir quelques billets de blogs avec un peu de substance, que vois-je dans Le Monde ? Un article sur « L’agriculture kényane prend le chemin des OGM » qui cite plusieurs choses erronées sans la moindre distance. Imagine-t-on un article qui cite « les vaccins donnent des maladies comme l’autisme » sans aucun recul ? Parce que c’est le niveau.

D’abord notons la citation « Les scientifiques du pays sont à l’unisson derrière le discours du vice-président ». On ne saura pas pourquoi les scientifiques sont à l’unisson favorables à un truc aussi mauvais. Peut-être sommes-nous tous des monstres. Ou peut-être y a-t-il des faits intéressants à obtenir en leur parlant ? On ne saura pas, aucun n’est cité. Ni aucun scientifique étranger d’ailleurs. C’est clair, les plantes, les virus, les gènes, tout ça est étranger aux scientifiques.

En détail :

…moratoire sur les importations d’OGM, instauré en 2012, suite à une étude démontrant que le maïs transgénique pouvait provoquer des cancers chez des rats de laboratoire.

Il ne peut s’agir que de la pseudo-étude de Séralini et al, qui n’a rien démontré du tout. Une phrase plus juste aurait été « qui a soulevé le soupçon que le maïs transgénique pouvait provoquer des cancers chez des rats de laboratoire, mais depuis été retirée et jamais reproduite. »

« Le maïs MON810 disperse autour de lui une toxine qui fait chuter le nombre d’abeilles et la biodiversité, contamine les plantes aux alentours. »

Les abeilles, on peut comprendre, si on met du maïs Bt (ce qui est le cas de MON810) qui contient un insecticide, quoiqu’aucun lien avec les problèmes des abeilles n’ait jamais été montré malgré plusieurs études. Le Bt ciblant les lépidoptères (voir discussion sur l’effet sur d’autres espèces ici). Et on peut toujours rappeler que le même Bt est utilisé en agriculture bio, en pulvérisation. (Edition : en plus les OGM contrairement aux pulvérisations conventionnelles ou bio ne dispersent rien du tout.) Les plantes aux alentours, j’ai un peu plus de mal. Comment un insecticide peut-il leur faire du mal ? On peut aussi rappeler l’étude montrant un gain de biodiversité des insectes avec des OGM Bt. Bref, affirmation très forte qui n’est soutenue par aucun élément factuel.

Je suis encore plus perdu car l’article parle de protéger le maïs d’un virus, ce qui est possible par OGM dans certains cas (notamment papaye à Hawaï), mais n’a rien à voir avec l’insecticide Bt. Je suppose que c’est un effet secondaire de la mise dans le même sac de tous les OGM dans la plupart des discours, mais il faut bien répéter que chaque OGM est différent, c’est juste une technique pour obtenir ce que l’on veut. Ce que l’on veut, c’est très divers. Juste avant les phrases citées ci-dessus, on note d’ailleurs que les « OGM de Monsanto, résistants au virus, apparaissent comme une solution d’urgence ». Si c’est ceux résistants à un virus, ce n’est pas le MON810 alors ?

« On ne maîtrise pas non plus les conséquences sur la santé : des études montrent que les OGM peuvent avoir des effets sur les reins, provoquer des allergies ou des problèmes sexuels. »

Là c’est carrément bizarre. Chaque fois que je lis un article grand public sur les OGM je découvre de nouveaux maux qu’il sont sensés causer (voir ici par exemple). Des problèmes sexuels ? Parce qu’un maïs résiste aux insectes ou à un virus ? Comment pourquoi ? Ca cause aussi les ongles incarnés ? Pour les allergies, on rappelle que les OGM sont testés à ce propos, contrairement à toutes les autres variétés générées par mutagenèse ou hybridation, et qu’on commence à avoir pas mal d’expérience là-dessus.

Plus inquiétants, selon Justus Lavi, « la levée du moratoire, et l’autorisation de culture OGM au Kenya, seraient une porte ouverte pour les OGM sur tout le continent. »

Là on touche finalement au même fond du problème qu’avec le riz doré ou les moustiques à descendance stérile. Il y a un tel investissement moral et pratique dans le refus de principe des OGM qu’il est inacceptable qu’un OGM particulier fasse partie de la solution à un problème particulier.

Je me répète, mais si quelqu’un ne veut pas d’OGM pour des raisons philosophiques, qu’il le dise. Mais il faut arrêter de répéter à l’infini des choses simplement fausses, et de tout mélanger sous l’étiquette somme toute trompeuse « OGM ».

Un gène n’est pas un organisme, un #OGM n’est pas un hybride

metaphysics

Cliquez sur l’image : le monstre a-t-il une essence ?

Et voilà que je parle encore d’OGM, car de quoi parle-t-on encore de partout ? D’OGM. Si vous ne venez pas de passer 2 jours en spéléo sans contact externe, vous avez entendu parler de la vente au public de la carcasse d’un agneau OGM. Bon résumés, comme déjà signalé, sur Sciences2 et Docteurjd.

Mon objectif ici n’est pas de revenir en détail sur cette histoire, mais d’en profiter pour rebondir sur un malentendu que l’on retrouve souvent lorsque l’on parle de génie génétique. Si un gène de méduse est transféré dans un agneau, cela n’en fait pas un hybride agneau-méduse. De même qu’un gène d’épinard transféré dans des orangers n’en fait pas des demi-épinards. Dans ce cas, il s’agit de transférer dans les orangers un gène de résistance à une bactérie. Les fruits ne seront pas verts, n’auront pas le goût d’épinard (et pas plus de fer, d’autant que les épinards et le fer c’est pas vraiment ça non plus mais bref).

J’ai trouvé une bonne analogie sur un blog de nourriture, The Odd Pantry : transférer un gène, c’est comme transférer une instruction d’une recette de cuisine. Ca n’implique pas forcément de transférer l’essentiel de la recette. Dans l’exemple de The Odd Pantry, l’auteure préparait de la lotion pour les mains maison, à base de cire d’abeille. Elle a eu l’idée de prendre la technique du bain-marie de sa recette de glaçage au chocolat pour faciliter les choses. Alors, cela en a-t-il fait une lotion au chocolat ? Une lotion glacée ? Y a-t-il eu mélange des deux recettes ? Non, une technique réutilisable dans différents contextes a été réutilisée.

Le gène GFP (green fluorescent protein – page Wikipedia mise à jour grâce à un de mes étudiants, que nous remercions) c’est pareil que la technique de bain-marie. En isolation, ça fait une chose, une protéine qui donne de la fluorescence verte. Quand elle le fait dans une méduse, ça donne une méduse fluo :

Aequorea victoria.jpg
« Aequorea victoria » par Mnolf — Photo taken in the Monterey Bay Aquarium, CA, USA. Sous licence CC BY-SA 3.0 via Wikimedia Commons.

Si on le met dans un autre organisme (une bactérie, un mouton, une plante), ça rend cet organisme fluo. Mais ça ne lui transfère aucune autre propriété de méduse, aucune médusitude ou médusocité.

Parce que, et c’est là un point important, du point de vue génétique la médusitude n’existe pas. Une méduse est le résultat d’un programme génétique complet effectué dans un oeuf de méduse. Et un bout de ce programme n’est pas coloré (oserais-je dire contaminé ?) par le produit final ni pas le reste du génome. C’est bien pour ça que de nombreuses espèces peuvent échanger des gènes, c’est pour ça que le programme réductioniste de la biologie moléculaire est en grande partie un succès (billet sur le réductionisme).

Attention, je ne dis pas qu’il n’y a pas des interactions (vous avez lu le billet sur le réductionisme ?). La biologie, c’est compliqué, hein, on parle pas physique amusante ici. Mais dans les cas où le produit d’un gène a une fonction bien autonome, ce qui arrive, cette fonction de comprend pas d’essence de l’espèce dont le gène provient. Les espèces n’ont pas d’essence, et les gènes ne portent pas d’essence d’espèce. C’est vraiment important, je me répète. Je pense qu’une grande partie des incompréhensions sur les OGM et plus généralement la génétique vient d’une idée intuitive mais erronée de l’identité essentielle de chaque espèce (et de la « nature » elle-même).

Exemple à discuter pour la prochaine fois : la souris de laboratoire Tc1 dans laquelle les chercheurs ont introduit 90% du chromosome 21 humain (article d’origine de 2005, description formelle de la bestiole).

Merci de votre attention.