Vent de folie dans les journaux scientifiques: 1- la secte du Cladisme

Il y a eu récemment plusieurs éditoriaux ou billets d’opinion qui ont eu un certain, euh, écho sur les médias sociaux. Ils diffèrent par bien des points, mais ont en commun un certain aspect « what the fuck? » comme disent élégamment les américains.

Commençons par l’éditorial du journal Cladistics du 12 janvier (lien).  Je l’ai vu via ce tweet :

L’éditorial commence direct :

The epistemological paradigm of this journal is parsimony. There are strong philosophical arguments in support of parsimony versus other methods of phylogenetic inference (e.g. Farris, 1983).

Alors un peu de contexte. Il existe différentes méthodes pour reconstruire des arbres phylogénétiques, à savoir les relations évolutives entre espèces. Jusque dans les années 1960-70 la classification des espèces se faisait de manière très approximative, sans méthode formelle. Dans les années 1970 est apparu un mouvement appelé « cladistique », qui visait à réformer la classification des espèces en la rendant objective, suite à un livre de Willi Hennig (1966 pour l’édition anglaise). Les cladistes proposaient un critère de classification, les relations phylogénétiques. Et comme il n’existait pas de méthode objective pour reconstruire ces relations, et l’objectivité était leur objectif, ils ont aussi proposé une méthode formelle (programmable informatiquement même), dite de « parcimonie » (orthographe discutée ici 😉 ). Jusque là tout va bien. Mais dès la fin des années 1970 (1978 pour être précis) Joe Felsenstein a montré que dans certains cas identifiables la parcimonie pouvait se tromper de phylogénie de manière systématique. Ce sont ensuivies deux décénnies de débats entre d’un coté des bio-statisticiens (école dont je suis issu) qui cherchaient les limites des méthodes de phylogénie et les améliorations à y apporter, et de l’autre le groupe proclamant que seul l’usage de la parcimonie fait le vrai « cladiste », pour la plupart issues de musées d’histoire naturelle. Durant ma thèse cette dispute était encore vive, et je me rappelle de discours très agressifs de Guillaume Lecointre fustigeant les fausses phylogénies des statisticiens.

Depuis la plupart des phylogénéticiens sont passés du coté statistique de la force, notamment parce que l’amélioration conjointe des ordinateurs et du séquençage d’ADN fait que nous avons des données bien adaptées au traitement statistique. Et puis quand même une méthode dont on peut montrer qu’elle est juste a quelque chose de préférable à une méthode qu’on aime bien pour des raisons historiques (voir aussi débat dans ce billet).

Et donc l’éditorial de Cladistics, journal de la Hennig society, nous renvoie en arrière vers cette époque, et sans aucune nuance ni aucune leçon apprise. Il commence par dire que ce journal, c’est parcimonie et c’est tout. Il continue dans cette veine :

(…) we do not hold in special esteem any method solely because it is novel or purportedly sophisticated. Phylogenetic data sets submitted to this journal should be analysed using parsimony. If alternative methods are also used and there is no difference among the results, the author should defer to the principles of the Society and present the tree obtained by parsimony.

J’adore « because it is novel or purpotedly sophisticated ». Les éditeurs ne se laissent pas impressioner par une méthode juste parce qu’elle est nouvelle (plus récente que 1966) ou soit disant sophistiquée. Ca fait pas du tout vieux barbons.

Plus loin :

we do not consider the hypothetical problem of statistical inconsistency to constitute a philosophical argument for the rejection of parsimony

Les problèmes connus et documentés à répétition depuis 1978 ne les embêtent pas, puisqu’il ne s’agit pas d’un argument philosophique. Bin tiens. Une méthode d’estimation de phylogénie estime la mauvaise phylogénie, mais puisqu’elle est théologiquement philosophiquement pure, gardons-la.

Et une phrase qui a fait se gratter bien des têtes en biologie évolutive :

The absence of certain truth represents a philosophical limit of empirical science.

Euh… oui on ne sait pas toujours tout, mais est-ce une justification pour accepter des méthodes qui se plantent ?

Bref, cet édito a fait rire tout ce qu’internet a de biologistes évolutifs, avec un storify des tweets ici :

https://storify.com/phylogenomics/cladistics-journal-declares-long-live-parsimony

Il faut préciser que perso, faisant de la biologie évolutive, je n’ai plus rencontré ce genre d’attitudes depuis une vingtaine d’années, ce qui tend à indiquer que bien que des gens comme ça existent toujours, ils fréquentent peu les conférences habituelles de biologie évolutive. Je pense qu’ils vont entre eux à la conférence de la Hennig Society (voir à ce propos un compte-rendu rigolo de Dan Graur d’une de ces conférences ainsi que la discussion dans les commentaires).

Que penser de tout ceci ? Que le dogmatisme peut exister dans des sous-cultures de la communauté scientifique ; que ce dogmatisme est battu en brêche dans la communauté scientifique globale ; et qu’internet fait que ce genre d’attitudes s’attire le ridicule généralisé.

A bientôt pour une deuxième histoire d’éditorial étrange. Soyez sages.

ADN partout 3/3 : lire l’ADN est une technique très générale, aux applications infinies donc inconnues

dilbert_kit

Pourquoi est-ce que la démocratisation et la distribution ubiquitaire potentielle du séquençage d’ADN doivent vous concerner davantage que, disons, des microscopes de poche ou des chromatographes moins chers ? C’est parce que l’ADN est une molécule qui code de l’information. Les types d’informations codés et les usages que l’on peut en faire sont donc extrêmement divers. Ils sont illustrés mais certainement pas listés de manière exhaustive dans le billet précédent. L’ADN est le support de l’information, et c’est à cette information que le séquençage nous donnes accès. Quelque part, c’est aussi général que « savoir lire » : on peut tout lire.

Cette généralité du code donne à la démocratisation potentielle du séquençage d’ADN le potentiel d’applications révolutionaires ou triviales, mais doit en tous cas être compris pour bien être préparé à ce qui arrive. L’ADN contient l’information de la généalogie et du groupe ethnique, des maladies génétiques et des variations normales, des microbes que l’on porte et de ce que l’on a mangé.

Pour être clair : je ne suis pas contre le séquençage d’ADN, j’en fais moi-même  ;). Mais il me semble que nos sociétés avancent vers un avenir proche où le pouvoir de cette approche sera libéré, sans être prêtes du tout. Il y a ceux qui ont peur de tout, et ceux qui n’ont peur de rien. Comment faire pour avoir un débat pertinent et qui ne soit pas trop tard ?

ADN partout 2/3 : Séquençage d’ADN dans vos toilettes et à l’aéroport ?

une BD sympa même si le rapport est distant

une BD sympa même si le rapport est distant : cliquez et lisez

Il semble acquis que le séquençage d’ADN suit une trajectoire similaire à celle de l’informatique, mais en plus rapide (voir billet précédent). Lorsque le prix baisse à ce point, des applications qui étaient inimaginables peuvent devenir routinières. Pour l’informatique on voit ce que ça donne (y pas que les smartphones, quand le réparateur est venu j’ai appris que notre frigo a deux cartes mères…). Et pour le séquençage d’ADN, ça peut donner quoi ?

Un article récent propose justement des réponses à cette question, inspirons-nous en. Avec un grain de sel, l’auteur de l’article est très techno-optimiste, et serait probablement qualifié de scientisme par Cécile Michaut (voir ce billet / débat).

Yaniv Erlich 2015 A vision for ubiquitous sequencing. Genome Res. 2015. 25: 1411-1416 doi:10.1101/gr.191692.115

Yaniv distingue les « plateformes de séquençage » des « senseurs de séquençage ». Une plateforme de séquençage peut être une grosse machine statique, et doit être précise car lire de nouvelles séquences d’ADN inconnues. Un senseur de séquençage doit être petit et rapide, et doit plutôt reconnaître des séquences d’ADN connues.

T1.medium

Alors, quelles applications imagine Yaniv ?

Séquençage à la maison : des appareils domestiques sensibles à l’ADN
–> des toilettes intelligentes ! Bin oui, y a déjà un branchement à l’eau (pour les réactifs chimiques) et une collecte quotidienne de matériel biologique. Et en général il y a de la place en dessous, là où ça prend la poussière. Que peut-on voir dans ce « matériel biologique » ? La flore intestinale, indicateur de santé et plus généralement d’état physiologique. La nouriture (bin tiens), donc un suivi individuel de si on fait bien son régime, encore plus énervant que les sonneries de ceinture pas attachée en voiture et que les montres qui rappellent qu’on n’a pas assez marché. « Vous avez mangé beaucoup de sucreries aujourd’hui, or votre smartwatch me dit que vous avez à peine marché. » L’ADN de la personne, qui normalement ne change pas trop ; mais un cas où il change, ce sont les cancers. Le dépistage très précoce des cancers, ça ça peut être intéressant. On rigole, mais les toilettes sont une piste très sérieuse dans la mesure où il y a très peu de changements à faire à notre maison et à nos habitudes pour que ça marche.

Séquenceur grand public à acheter et utiliser où on veut : j’admets, même si ça devient possible, les applications ne me paraissent pas évidentes. Accessoirement, la régulation d’un séquenceur d’ADN généraliste (pas programmé spécifiquement pour reconnaître la flore intestinale par exemple) ne me paraît pas évidente du tout. Ceci dit, il y a eu beaucoup de réflexions sur ce que les gens accepteraient ou pas avant les smartphones, et quand l’iphone est sorti, on a vu : les gens acceptent tout si ça leur permet de partager des photos de chatons gratos.

Applications médicales et santé : C’est le gros morceau évident. Mais dans les détails, on peut penser à des applications pas si évidentes :
• séquençage rapide aux contrôles de sécurité des aéroports ; Yaniv pense surtout à la détection de maladies contagieuses, pour limiter les épidémies ; tout le monde à part lui se demande s’il fait confiance à la sécurité des aéroports avec son ADN.
• plus évident, le séquenceur portable pour médecins. Obtenir des résultats rapides et fiables sur le terrin, même en cas de crise humanitaire ; ou même à l’hôpital sans délai d’aller-retour à un labo d’analyses.
• et si on branche le séquenceur domestique sur le réseau de l’hôpital ? Des données sur le patient fiables, précises et en temps réel, notamment sur les maladies infectieuses.
• un peu similaire aux contrôles d’aéroport mais peut-être plus faisable (me semble-t-il), un suivi constant de points clés pour connaître la diffusion des maladies, telles que bouches d’aération, points d’épuration d’eau, les systèmes de circulation d’eau de batiments collectifs, etc.
• de même à l’hôpital, un séquenceur qui analyse de petits échantillons à intervalles courts et réguliers, pour un suivi en temps réel des patients.

Applications légales et de sécurité : Ah on rigole moins, là.
• séquençage rapide des « indices ADN » sur la scène même du crime ; admettons, encore qu’il faille avoir accès une base de données de suspects de manière sécurisée sur ledits lieux du crime, ce qui n’est pas évident. Mais ça pourrait je pense permettre d’innocenter rapidement quelqu’un, d’éviter une fausse piste.
• « identification positive de la cible » par les militaires ; permettez-moi d’avoir des doutes sur l’applicabilité pratique dans un contexte militaire de l’attente du résultats d’une analyse ADN.
• identification à la sécurité des aéroports : vous le sentiez venir quand ils mis des séquenceurs pour microbes, hein ? Ce qui est intéressant ceci dit c’est qu’on peut potentiellement identifier une personne sans l’avoir elle-même dans sa bases de données, grâce au partage d’information génétique au sein d’une famille (voir ce vieux billet à moi), par exemple pour retrouver de jeunes fugueurs.
Je me dois à ce point de citer une phrase de l’article (à propos d’identification de noms de familles depuis l’ADN) qui montre à la fois le potentiel des méthodes et (à mon avis) l’optimisme de Yaniv :

With careful implementation that is sensitive to genetic privacy and cultural issues (Kim and Katsanis 2013), such technology at checkpoints could play a role in fighting human trafficking

Oui ça peut marcher avec une mise en place très prudente qui fait très attention à tous les risques et sensibilités culturelles etc, mais ça peut aussi marcher sans. C’est même beaucoup plus facile sans les précautions. Alors, où va-t-on ?

Un point technique à noter sur tous les aspects d’identification d’individus c’est qu’à partir du moment où l’on sait quelle espèce on cherche (contrairement aux pathogènes) et où l’on connait bien la variabilité génétique présente dans l’espèce, bref dans le cas des humains, il y a besoin de peu séquencer pour avoir une identification fiable.

Industrie alimentaire: le séquençage d’ADN peut notamment servir au contrôle qualité :
• intégré dans la chaîne de production.
• spécifique pour des risques connus : champignons vénéneux, niveau de bactéries pathogènes dans la viande, traces d’allergènes, etc.
Par ailleurs, on peut imaginer un système de « code barre » pour authentifier des produits : une séquence d’ADN unique artificielle introduite dans des produits permettant de les reconnaître à coup sûr, pour les éviter ou s’assurer qu’on les a bien obtenus. Au cas où vous pensiez que ce soit difficile, ce type de technique de code barres ADN est utilisé en routine dans de nombreuses expériences de biologie moléculaire.
• codes barres ADN sur les aliments plus toilettes séquenceuses = aide au régime ! Killer app !

Bon c’est sympa tout ça, mais qu’en est-il de la faisabilité ? Parce que même si le prix du séquençage d’ADN baisse, il faut encore le faire. Or à l’heure actuelle il faut quand même préparer les échantillons d’ADN avant séquençage, et cette préparation est relativement longue (autant pour le séquençage en temps réel) et compliquée (autant pour le séquenceur à la maison). Mais : de nouvelles approches en développement promettent de diminuer les étapes de pré-traitement. Il n’est pas inimaginable qu’on puisse diminuer cela à un point où le séquençage ubituitaire devienne réellement praticable. Il faut quand même être conscient que le prix n’est pas la seule limitation. Les réactifs utilisés doivent être pour le moment stockés à différentes températures, souvent +4°C (frigo) ou -20°C (congélo), et se gardent mal. Yaniv propose deux pistes à cela : l’utilisation de réactifs lyophilisés que l’on réhydrate au dernier moment, peut-être même en cartouches toutes prêtes. Et des technologies solides plutôt que liquides, grâce aux nanotechnologies. Là aussi c’est moins science-fiction qu’on ne pourrait le penser, le séquenceur MinION ou la technique de la société BioNano, par exemple, reposent sur des nanopores et une part de nanotechnologie.

Un autre problème pratique est l’analyse des données : les séquences d’ADN sont inutiles sans analyse bioinformatique. On peut mettre le logiciel sur le séquenceur, mais il faut aussi connaître les séquences de référence auxquelles comparer, qui peuvent être très nombreuses (donc prendre beaucoup de place), et qui peuvent n’avoir d’intérêt que si elles sont à jour. On parle beaucoup de « cloud computing », d’envoyer les séquences chez un service via internet qui vous renvoie le résultat du calcul, mais avec les quantités de données que l’on a en séquençage d’ADN il faut prévoir de très bonnes bandes passantes, ce qui limite les applications du type médecine de brousse. Il y a aussi le problème que si le séquençage est rapide et que l’analyse prend 24h, on n’a pas vraiment la réponse de suite. Il faut donc travailler sur des méthodes bioinformatiques permettant une réponse « dès que possible », avec analyse des données en temps réel et rapport dès qu’on a la réponse cherchée (espèce de bactérie, individu recherché, etc). C’est faisable, mais ce sont des défis intéressants.

Il y a d’autres problèmes, statistiques. Par exemple, pour reconnaître un humain d’un groupe très étudié (les européens de l’ouest, au hasard), on aura davantage de résolution que pour une population africaine très peu étudié. Du coup, les chances de se tromper d’individu jusque parce qu’il a la bonne (ou la mauvaise) ethnicité se posera. Pour la microbiologie, reconnaître une espèce que l’on soupçonne être présente (E. coli dans la nourriture non traitée) est facile, reconnaître n’importe quelle espèce quand on ne sait pas ce que l’on cherche, et qu’on ne connait qu’une petite partie de toutes les espèces existantes, et nettement plus difficile.

Et bien sûr, il y a les implications « éthiques, légales et sociales ». On sent bien dans le papier que ce n’est pas ce qui intéresse Yaniv le plus, et peut-être a-t-il raison dans la mesure où son travail est d’explorer ce qui est techniquement possible, mais ça m’a quand même un peu mal à l’aise en lisant un papier par ailleurs très intéressant. D’autant que ces implications peuvent être le plus grand obstacle à la mise en place des solutions qu’il imagine.

D’abord, il existe dans de nombreux pays des lois interdisant ou complicant la collecte d’échantillons humains. Il faut noter qu’en fait nous laissons tous des échantillons partout derrière nous tout le temps, la question est donc leur usage délibéré. L’ADN humain est partout.

Yaniv suggère des messages d’avertissement aux utilisateurs, ou des mécanismes de suppression des séquences lues dès qu’elles ont été analysées, voire de suppression des séquences humaines avant analyse lorsque l’on cherche des séquences bactériennes (par exemple). Mouais, parce qu’on sait que tout le monde lit attentivement les messages d’avertissement des logiciels, apps, pages web, et smartphones que nous utilisons. Et nous faisons totalement confiance à Facebook, Ashley Madison, et demain Nesté ou la sécurité des aéroports, pour effacer les données compromettantes ou personnelles.

Un petit exemple de problème de vie privée pour finir : si des toilettes « intelligentes » peuvent lire l’ADN, elles peuvent savoir si quelqu’un d’extérieur à la famille est venu et a utilisé les toilettes, voire si cette personne vient régulièrement, par exemple quand l’un des partenaires d’un couple est absent…

Bref, tout est possible et rien n’est résolu.

ADN partout 1/3 : Le prix du séquençage baisse encore (plus)

cliquez sur l'image : Boulet au MIT (zombies inclus)

cliquez sur l’image : Boulet au MIT (zombies inclus)

Le prix du séquençage de l’ADN vient encore de se casser la gueule un peu plus, en décrochant du « plateau » de décroissance où il était depuis trois ans :

Sequencing graphs JAN_13

Sur le graphe ci-dessus, deux choses doivent être notées en plus du décrochement récent :

  1. L’échelle est logarithmique, c’est-à-dire qu’une ligne droite correspond à un changement exponentiel. Donc même la décroissance apparemment lente de 2012 à récemment est en fait une décroissance exponentielle simplement moins forte qu’avant.
  2. La droite blanche, c’est la « loi de Moore », la croissance exponentielle de la puissance de calcul des ordinateurs. La loi de Moore, c’est ce qui fait que votre téléphone est plus puissant que les ordinateurs disponibles à la NASA pour aller sur la Lune.

En corrolaire de ces deux points, remarquez que le séquençage d’ADN devient moins cher plus vite que la puissance des ordinateurs n’augmente depuis 2003, carrément plus vite depuis 2008. On peut remarquer que la différence entre les deux exponentielles est elle-même une exponentielle : tous les ans, pour le même prix, vous pouvez séquencer encore plus d’ADN par minute de calcul possible. Autrement dit, notre capacité à séquencer de l’ADN croit beaucoup beaucoup plus vite que notre puissance informatique.

Cela a plusieurs conséquences, que nous allons explorer en deux autres billets. Mais un point à noter d’entrée est que la croissance de la puissance informatique à prix constant a eu des conséquences qu’à-peu-près personne n’a prévu. Les smartphones ou le streaming des vidéos légalement ou pas sont essentiellement absents de la science fiction jusqu’à ce qu’ils apparaissent pour de vrai. Alors imaginer ce que va être le monde du séquençage d’ADN très bon marché est difficile. Une certitude : ce monde est déjà là :

Une autre figure, montrant les différentes techniques de séquençage commercialisées. Les points liés par des traits montrent des progrès d’une même machine.

developments_in_high_throughput_sequencing

Brève sur l’édition de génomes 2 : quelques faits rapides

cliquez sur l'image pour lire (et une critique de cette BD ici)

cliquez sur l’image pour lire (et une critique de cette BD ici)

Un deuxième billet rapide après « Tout se qui est possible sera-t-il fait ?« , basé sur un article dans Nature que je viens de voir qui fait un tour succint de la question :

Genome editing: 7 facts about a revolutionary technology. What everyone should know about cut-and-paste genetics. Nature News

1. Jusqu’ici, une seule étude de l’édition de génome humain dans des cellules germinales (permettant potentiellement de développer un embryon) a été publiée dans un article scientifique :

Liang et al 2015 CRISPR/Cas9-mediated gene editing in human tripronuclear zygotes Protein & Cell 6: 363-372

Dans cet article, les embryons n’étaient pas viables, mais on a envie de dire « pas encore ».

2. Les législations sur la question sont très différentes selon les pays. Notamment Nature dit qu’ils n’y a que « des réglèments inapplicables » en Chine, Japon, Irelande et Inde ; et que de nombreux scientifiques demandent une législation internationale. Sur laquelle j’ai personnellement des doutes, alors qu’il y a encore des pays qui ne reconnaissent pas le copyright (voir Convention de Berne).

3. Avec CRISPR/Cas9, il est facile de modifier des génomes, et les « biohackers » plus ou moins amateurs s’y intéressent (article dans Nature d’août). Contrairement aux techniques précédentes de génétique moléculaire, et c’est ce qui fait une partie de son potentiel révolutionaire, cette technique n’est pas réservée à quelques laboratoires très équipés avec du personnel très bien formé.

Mise à jour : vu dans cette excellente interview de Doudna et Charpentier (voir point 7), la companie Addgene vend des kits de CRISPR/Cas9.

4. D’autres enzymes que Cas9 sont en train d’être découvertes, ce qui va encore faciliter les choses (techniquement) ou les compliquer (pour réguler).

5. Les expériences les plus avancées ont lieu chez des cochons : super-musclés, mini, ou sur-édités. Pourquoi les cochons ? Notamment dans l’espoir de construire des donneurs d’organes animaux humain-compatibles. En attendant, ils pensent vendre les mini cochons comme animaux domestiques.

6. Les grosses multinationales et les millardaires s’y intéressent : la Gates Foundation, Google ou DuPont investissent dans CRISPR/Cas9.

7. Il y a une guerre de brevets entre Jennifer Doudna (University of California, Berkeley) et Emmanuelle Charpentier (Max Planck Institute) d’un coté, généralement créditées de l’invention du système, et Feng Zhang de MIT & Harvard de l’autre, qui a fait marcher le système dans des cellules humaines.

Et puis un 8ème point qui n’était pas encore connu quand l’article de Nature a été publié : la conférence sur l’édition de génomes a conclu que « Gene-editing technology should not be used to modify human embryos that are intended for use in establishing a pregnancy » (Nature news) : l’édition de génomes ne devrait pas être utilisée pour modifier des embryons humains prévus pour être utilisés pour une grossesse. Mais des cellules humaines chez une personne (thérapie génique), oui, et des embryons humains à fins non reproductives apparemment oui aussi.

Tout se qui est possible sera-t-il fait ? Brève sur l’édition de génomes humains #GeneEditSummit

cliquez pour des savant fous et solitaires

cliquez pour des savant fous et solitaires

Il y a une conférence en cours sur les aspects éthiques de l’édition de gènes et génomes humains. Ca a notamment été couvert par Le Monde (payant). La conférence a été organisée parce que la technique CRISPR/Cas9 (voir ici et ici) et ses dérivés permettent des modifications aisées des génomes. Et si c’est possible chez la souris ou le cochon, c’est possible chez l’humain (voir ici et ici).

Je ne vais pas écrire longuement sur le sujet maintenant, mais juste noter le tweet suivant de Paul Knoepfler, chercheur et blogueur sur les cellules souches (on a parlé de son blog ipscell ici) :

Philip Campbell est l’éditeur en chef de Nature, le journal scientifique le plus prestigieux de la planète. Et ce qu’il nous dit c’est que (1) des scientifiques font des expériences d’édition de lignée germinale (spermatozoïdes et ovules) humains, (2) ils soumettent les résults à Nature, (3) Nature refuse, (4) parce qu’ils n’ont pas suivi les règles éthiques du journal.

Il parait difficile d’en conclure autre chose que « si c’est faisable, ça sera fait ». Et que nos commentaires éthiques n’y changeront pas grand chose. Mais peut-être suis-je trop pessimiste. En tous cas, ça me parait un problème autrement plus urgent que les sempiternelles bisbilles autour des OGM en agriculture.

Voir aussi ce tweet par exemple, George Church étant un généticien très connu et favorable au laissez faire en la matière :

Je recommande de regarder les « top tweets » si vous êtes intéressés : https://twitter.com/hashtag/GeneEditSummit

Je suis vieux : histoire de ma signature email « la liberté ne s’use que quand on ne s’en sert pas »

ring

cliquez sur l’image

Ma signature email professionnelle comprend en bas la phrase « La liberté ne s’use que quand on ne s’en sert pas » depuis longtemps. J’ai essayé de retrouver depuis quand. Je garde tous mes emails envoyés et reçus depuis fin 1997, et à l’époque c’était déjà là.

1997 :

Marc Robinson            tel    : +972-3-6408646
Department of Zoology    fax    : +972-3-6409403
Tel Aviv University      e-mail : marc@kimura.tau.ac.il
Ramat Aviv 69978 Israel
"La liberte ne s'use que quand on ne s'en sert pas."

2015 :

Marc Robinson-Rechavi
Department of Ecology and Evolution
Biophore 3219, University of Lausanne, 1015 Lausanne, Switzerland
tel: +41 21 692 4220    fax: +41 21 692 4165
http://bioinfo.unil.ch/
Twitter: @marc_rr
Swiss Institute of Bioinformatics
http://www.isb-sib.ch/groups/lausanne/eb-robinson-rechavi.html
La liberte ne s'use que quand on ne s'en sert pas

On voit aussi mon grand âge à ce que j’évitais les accents dans les emails (longtemps mal gérés), et je m’apperçois que c’est resté par le miracle du copié-collé. Et que j’ai connu Tel Aviv en des temps d’espoir de paix et de normalisation qui semblent étranges aujourd’hui. 🙁

Pour chercher plus loin, j’ai regardé ma participation à des forums internet, qui prédatent le web, et sont maintenant stockés par Google (qui d’autre ?). J’ai trouvé un message de 1994 avec cette signature ! Sur le forum de droits de l’homme, où je trollais pour Amnesty International.

En cherchant ces forums, j’ai trouvé que j’ai discuté avec PZ Myers, qui n’étais pas encore le bloggeur scientifique le plus lu au monde (Pharyngula chez Scienceblogs, chez FreeThought blogs) : lien. Amusant.

Représentation graphique des victimes d’attentats en France depuis 2 siècles

cliquez sur l'image

cliquez sur l’image

En suivant un lien vers les victimes d’attentats au Liban, j’ai découvert que Wikipedia a une liste des attentats avec les victimes au Liban. Du coup j’ai regardé pour la France, et il y a aussi une telle liste, et dans le cas de la France il y a un tableau analysable. Du coup, cela permet de mettre les attentats récents en perspective.

D’abord, je récupère le tableau de chiffres depuis Wikipedia. Il y a des accès programmatiques élégants, mais j’ai fait ça « quick and dirty », donc copier-coller dans un fichier texte puis importation dans R. R est un environnement de statistiques gratuit et open source, puissant si peu facile d’usage pour les débutants (page officielle, petite explication sur le blog bioinfo-fr).

Puis j’ai mis en forme : remplacer les entrées de type « 50+ » par le nombre seul, par exemple « 50 » dans ce cas, pour permettre le traitement. Et transformer le format bizarre de dates dans Wikipedia en un format reconnu par R, en mettant des tabulations entre les éléments des dates dans le fichier texte (récupérable ici), puis en important dans R et transformant avec as.Date().

Ensuite, c’est simplement une histoire de faire des graphiques simples avec la fonction plot(). Comme je suis chef d’équipe et que j’utilise à peine R (ou d’autres languages) de nos jours, mon code est tout moche mais le voici :

terror_france<-read.delim("~/Desktop/terror_france.txt")
terror_france$date<-as.Date(with(terror_france, paste(Year, Month, Day, sep='-'), "%Y-%m-%d"))
terror_france<-terror_france[order(terror_france$date),]
terror_france$cumulative_dead<-cumsum(terror_france$Dead)
terror_france$cumulative_injured<-cumsum(terror_france$Injured)

plot(terror_france$date, terror_france$cumulative_dead, type='o', xlab="date", ylab="cumulative number of dead", col=ifelse(terror_france$Dead>50, "red", "black"))
text(x=2000, y=350, "These are the dead of 13th November 2015", col="red", pos=2)
text(x=2000, y=330, "in context of 2 centuries of terrorism", col="red", pos=2)

plot(terror_france$date, terror_france$cumulative_injured, type='o', xlab="date", ylab="cumulative number of injured", col=ifelse(terror_france$Injured>200, "red", "black"))
text(x=2000, y=1900, "These are the injured of 13th November 2015", col="red", pos=2)
text(x=2000, y=1800, "in context of 2 centuries of terrorism", col="red", pos=2)

Voici les résultats :cumulative_dead

On voit immédiatement que les attentats de ce vendredi 13 novembre ont fait beaucoup plus de morts que n’est habituel (je n’ai pas envie d’utiliser le mot « normal » pour des attentats qui ne devraient pas l’être). On voit aussi que la guerre d’Algérie n’a pas fait tant de morts que ça en France métropolitaine par attentats (clairement d’autres sources de victimes ne sont pas comptées ici). Mais que les années 1980 ont été marquées par de nombreux attentats, chacun d’amplitude pas très forte, mais qui cumulent un grand nombre de morts au final.cumulative_injuredPour les blessés les années 1980 sont encore plus marquantes, et les attentats récents moins, ce qui met en avant à quel point ces attentats ont été meurtriers en nombre de morts relativement au nombre total de victimes.

En réagissant à une version préliminaire de ces graphiques, Alexander Doria a remarqué :

Bonne question, je ne sais pas. Lecteurs historiens ?

Mise à jour suite au commentaire de MAthieu : courbe en escalier :

staircase_deadMise à jour 2 : un article similaire sur le site Les Décodeurs du Monde.

Mise à jour 3 : suite à demande populaire, le graphe en non cumulé, que personnellement je trouve moins clair mais voici.

non_cumumative_dead

La science est universelle, et un scientifique qui ne l’accepte pas voit son article rétracté

cliquez sur l'image

cliquez sur l’image

Gangolf Jobb est un chercheur à son propre compte (on pourrait aussi dire au chômage dans son cas) qui travaille sur la bioinformatique de l’évolution, et est notamment l’auteur d’un logiciel de manipulation d’arbres évolutifs, TreeFinder. Il est relativement connu dans la communauté de biologie évolutive pour ses messages étranges sur des listes e-mail, ou sur son site. Toutefois, récemment ses bizarreries ont passé un cap.

  • En février 2015, il a modifié la licence d’utilisation de son logiciel pour en interdire l’utilisation aux chercheurs dans les Etats-Unis d’Amérique.
  • En octobre 2015, il a à nouveau modifié la licence pour en interdire l’utilisation aux chercheurs dans les pays suivants : Allemagne, Autriche, France, Pays Bas, Belgique, Royaume Uni, Suède et Denmark.
  • En novembre 2015, l’article scientifique principal décrivant son logiciel a été rétracté.

Gangolf a interdit aux personnes travaillant dans ces pays européens d’utiliser TreeFinder parce que ce sont les pays qui acceuillent le plus d’immigrants non européens. Je ne vais pas reproduire ici son texte, qui est une diatribe haineuse et sans grand intérêt. Vous pouvez le trouver aisément par une recherche web. Le journal BMC Evolutionary Biology a rétracté l’article parce que le logiciel n’est plus disponible pour tous les scientifiques qui désirent l’utiliser, ce qui est en opposition avec la politique éditoriale du journal. (Déclaration de conflit d’intérêts : je suis éditeur associé bénévole à ce journal.) Il est notable que les autres auteurs de l’article, Arndt von Haeseler et Korbinian Strimmer, approuvent la rétraction étant donné les circonstances.

Le site Retraction Watch a une analyse plus détaillée de la rétraction, dans laquelle ils citent ledit Korbinian Strimmer, qui note que si le logiciel avait été placé d’entrée sous une licence de type GNU GPL, les restrictions de Gangolf Jobb auraient été impossibles, et qu’il va donc être strict sur l’usage de telles licences pour les logiciels publiés par son laboratoire dans le futur. (On a d’ailleurs remarqué récemment dans mon labo qu’on n’avait pas fait très attention à nos licences – il faut qu’on soit plus rigoureux nous aussi.) Retraction Watch reflète aussi les réactions que j’ai vues très généralement dans la communauté biologie évolutive : ce ne sera pas un problème de se passer de TreeFinder, et c’est ce qu’on va faire.

Cette rétraction est importante parce qu’au delà du cas étrange de Gangolf Jobb, il faut insister sur l’universalité de la science. Nous construisons ensemble une connaissance et une compréhension du monde pour l’humanité. La liberté de communiquer, de penser, de débattre, de se parler, de construire sur les résultats des autres ou de les invalider, de collaborer ou de se disputer, sont indispensables au progrès de cette connaissance et cette compréhension. La science n’est pas une affaire individuelle, c’est une aventure collective ; c’est vrai pour les personnes individuelles comme pour les pays individuels.

C’est aussi pour cela qu’à terme la publication open access est importante, comme le sont les licences libres. Parce que rien ni personne ne peut empêcher un cubain, un américain, un chinois, un taiwanais, un israélien, un palestinien, un russe et un ukrainien de lire un article dans PLOS ou BMC, qui que ce soit qui l’ait écrit. Et quels que soient les évènements politiques à venir.

Je vais finir ce billet en allant un peu au-delà du cas particulier de la communauté scientifique pour rappeler qu’en 1939, les autorités françaises ont interné les citoyens allemands qui étaient en France. Largement des réfugiés anti-Nazis, des juifs, des communistes. Parmi eux étaient quelques agents allemands infiltrés (je ne retrouve pas la référence exacte, mais il y a un cas décrit dans les mémoires de Marthe Cohn), mais cet internement était quand même injustifié et inhumain pour la masse des réfugiés. Et c’est cela qui me vient à l’esprit quand j’entend des appels à rejeter tous les réfugiés qui fuient la barbarie, comme illusion de protection contre cette barbarie.

Qu’est le scientisme, et quelles questions ne pas poser en recherche ?

cliquez pour voir la BD (et ici pour du contexte)

cliquez pour voir la BD (et ici pour du contexte)

Ce billet fait suite à une discussion Twitter avec MrPourquoi (un peu) et Cécile Michaut (surtout).

Donc, suite à un dialogue avec MrPourquoi concernant le site « Alerte Environement », je fais pars de mon étonnement toujours renouvelé de l’existence d’anti écologistes militants sur internet, suite à quoi Cécile intervient :

Donc ce billet a deux objectifs : premièrement, permettre à Cécile d’expliciter en commentaire pourquoi et comment elle pense qu’il ne faille pas autoriser tous les sujets de recherche fondamentale. Et deuxièmement, d’exprimer mon étonnement face à son usage du mot « scientisme ».

Quand j’ai dit que je comprenais jamais ce que l’on voulait dire, ce n’est pas que je ne sache pas chercher une définition bien sur. Et celle de Wikipedia, par exemple, est cohérente avec mon intuition : en gros, le scientisme c’est de faire confiance à la science et à elle seule, même quand elle n’a rien à dire ou n’est pas la bonne source. Ce que je voulais dire, avec le parallèle au politiquement correct, c’était que ce terme ne me semble employé que négativement, en tant qu’accusation envers ceux dont on n’aime pas les arguments, les positions, ou l’usage de la science. Et en tant que terme péjoratif, il me semble en effet mal défini, pouvant être appliqué à toute invocation de la science, ses méthodes ou ses résultats, qui déplait à quelqu’un.

La définition donnée par Cécile au travers de ses exemples semble être d’être des gens qui sont anti-science. J’espère qu’elle pourra expliquer cela plus clairement dans les commentaires.