Grandeur et chute de la bioinformatique ? Promesses et progrès

cliquez sur l’image

De manière exceptionnelle, ce billet va consister pour l’essentiel en la traduction d’un article paru dans une revue spécialisée. Il s’agit d’un article d’opinion, écrit par Christos Ouzounis, bioinformaticien grec, qui décrit de manière que je trouve intéressante l’histoire de la bioinformatique, discipline jeune, et de ses relations avec le reste de la biologie.

J’ai le droit de traduire et publier cet article parce qu’il est publié dans PLoS Computational Biology sous copyright Creative Commons, ce qui nous rappelle l’utilité de la publication ouverte en sciences. J’ai quand même demandé l’autorisation de Christos, par politesse, et il me l’a volontiers donnée. Ma traduction n’a pas préservé les citations bibliographiques, ce qui m’aurait réclamé un travail supplémentaire que je n’avais pas le temps de faire. Déjà, je dois dire que si je m’étais rendu compte du travail que cela représenterait, je n’aurait pas entrepris de le faire.

En plus de traduire l’article, je vais ajouter mes commentaires dans un format un peu différent, comme ceci.

Dernier point : j’ai déjà tendance à faire des anglicismes en temps normal (mon activité scientifique étant en anglais), donc dans la traduction il y en aura surement d’autant plus. Je m’en excuse par avance.

 

Citation: Ouzounis CA (2012) Rise and Demise of Bioinformatics? Promise and Progress. PLoS Comput Biol 8(4): e1002487.

Ce qui remplace l’introduction

Après avoir bien réfléchi, et avoir discuté à de nombreuses reprises avec des collègues ces dernières années, et après avoir fait le point dans plusieurs papiers, je voudrais m’avancer sur un autre aspect de l’histoire de la bioinformatique*. Mon intention est d’explorer ici l’essor et le déclin du terme « bioinformatics« , ainsi que la manière dont son usage linguistique pourrait traduire des tendances dans le domaine en tant que tel. Je vais citer un ensemble relativement peu conventionnel d’éditoriaux, de visions prospectives, de rapports stratégiques gouvernementaux, de documents quasi-commerciaux de think tanks, et les médias. Je dois préciser ceci afin de présenter mon approche sans m’aliéner des lecteurs habitués à un style plus académique. Je vais examiner deux aspects clés de la bioinformatique, à savoir son coté très technologique et son rôle de support pour d’autres disciplines biologiques. Ces tendances pourraient être utiles pour anticiper de futures directions de recherche et d’application, et pour explorer l’importance fondamentale de cette discipline pour les sciences de la vie.

* En anglais il y a une nuance souvent absente en français entre bioinformatics et computational biology. Ici l’auteur a utilisé computational biology, que je me suis permis de traduire bioinformatique.

Tendance au déclin?

L’on pourrait se demander si le terme « bioinformatics » est passé de mode, par rapport aux années une décennie en arrière où il semblait associé avec beaucoup d’excitation et l’attente d’une ère nouvelle. Une simple considération de Google Trends suggère un remarquable déclin des apparitions dans Google News. En effet, l’usage du terme « bioinformatics », qui reflète en grande partie les annonces d’actualités (news feeds) pour la discipline, ont diminué d’un facteur presque 6 sur les 7 dernières années (Figure 1). L’équation correspondante est une exponentielle de la forme y = 2,1395e−0.0047x avec un R2 = 0,9636, ce qui signifie que nous pourrions atteindre y = 0,1, presque l’insignifiance, dans x = 651 semaines, à savoir dans seulement une douzaine d’années. Une telle tendance réclame une explication. Comment se fait-il qu’une discipline que l’on ne semblait pas pouvoir arrêter, dans toute sa gloire, il y a seulement quelques années, ait déjà des signes de fatigue (dans les médias) ?Et est-ce que cette tendance indique un manque de progrès, un manque d’intérêt, les deux ou aucun ? Nous allons utiliser ce graphique comme point de départ, comme opportunité pour discuter ces questions, en gardant à l’esprit que ceci est une analyse de tendances et non un discours proprement scientifique.

Figure 1. Utilisation du terme “bioinformatics” dans Google Trends.

The use of the term “bioinformatics” in Google Trends (http://www.google.com/trends?q=bioinformatics&ctab=0&geo=all&date=all&sort=0) plotted with relative scaling, i.e., scaled to the average search traffic for the term (y-axis) during the time period (x-axis) (for additional explanations, check the About document http://www.google.com/intl/en/trends/about.html). The trend equation and the R2 factor are also shown.

C’est rigolo, j’avais constaté la même chose l’an dernier, dans un billet sur corrélation et causalité. Tous les termes corrélés à bioinformatique sont des techniques has been.

Une explication : trop de promesses ?

Une manière d’appréhender le développement de la bioinformatique et ses prédictions de progrès, est d’examiner les prédictions faites lorsque la discipline est entrée sous les projecteurs. Alors qu’on pourrait penser que la discipline a été sur-vendue, en fait la plupart des commentaires étaient raisonnablement équilibrés, mesurés, et ne prêchaient que subtilement pour la mise en place d’une recherche informatique au sein des sciences de la vie, une tâche monumentale qui a probablement été accomplie avec succès. Les textes sélectionnés ici couvrent environ 15 ans, divisés artificiellement en trois périodes, que je vais définir comme « l’enfance » (1996-2001), « l’adolescence » (2002-2006) et « l’âge adulte » (2006-2011). Cette sélection est uniquement basée sur la pertinence des défis et opportunités pour la discipline, et ne dépend pas de mesures d’impact, telles que le prestige ou le nombre de citations. De cette manière, j’espère que ce mélange éclectique de références sera  aussi inclusif que possible, et représentera ainsi mieux l’ensemble des opinions exprimées durant ces périodes, pas trop biaisé vers des spécialités, des institutions ou des journaux particuliers.

Vous trouvez, vous aussi, que enfance – adolescence – adulte, ça laisse à penser qu’on est maintenant dans la vieillesse ? Par ailleurs, je trouve quand même ses sources un peu biaisées vers l’EBI (European Bioinformatics Institute), dans lequel il a longtemps travaillé.

La période de « l’enfance » : 1996–2001

Durant la période de « l’enfance », la perception du public, y compris les biologistes, était que c’était une nouvelle discipline, alors que beaucoup de choses s’étaient déjà passées : les idées de base étaient en place, certains des algorithmes clés étaient complètement développés, et les ressources en bases de données étaient en train d’être constituées. Il y avait déjà des débats sur l’interopérabilité des systèmes de bases de données avec les nouveaux protocoles HTTP et autres, ainsi que des éléments sociaux, y compris la coordination internationale de ressources et de besoins en formation. Le marché du travail explosait pratiquement, et la demande dépassait l’offre : il y avait un sentiment que l’Europe était en retard sur les Etats-Unis, et des efforts ont été mis en place pour s’assurer des financements.

C’est l’époque où de nombreux programmes doctoraux ou de master* ont été mis en place, sous l’égide de la toute nouvelle International Society for Computational Biology. Durant cette période qui paraît si distante, on a compris que la bioinformatique, bien appariée à la biologie à haut débit, avait le pouvoir de transformer la recherche biomédicale. Les termes « inondation » et « explosion » étaient couramment utilisés pour les volumes de données en augmentation constante ; on s’attendait à ce que cette espèce d’explosion présente des défis pour « l’organisation, l’accessibilité, et surtout l’interprétation des données ». Beaucoup de ces défis sont encore avec nous aujourd’hui, dans le même ordre (l’interprétation étant le plus difficile). Des prédictions de « miniaturisation des laboratoires et de technologies non destructives » annonçaient déjà la biologie des systèmes. Du côté des systèmes, on pensait que les humains se regrouperaient autour des ordinateurs (et non le contraire, ce que l’on voit aujourd’hui, dans notre époque d’informatique ubiquitaire). Du côté des données, on notait que l’utilisation incontournable d’approches automatisées avait mené à « beaucoup de mésinformation dans les bases de données ». C’était une époque de création d’ontologies et de vocabulaires, et de références croisées entre bases de données plus étendues. La nature des données était « globale » : il y avait des gènes, des séquences, des structures, des profils d’expression et des génomes, qui se retrouvaient dans le contenu des bases de données de biologie moléculaire les plus connues, fournissant l’opportunité pour croiser l’expérimentation haut débit et la recherche informatisée. Lentement, les disciplines médicales adoptaient les méthodes haut débit et la révolution génomique. Dans l’industrie, de nombreuses opportunités existaient, et les perspectives de croissance étaient très positives. En plus des applications pratiques, il y avait un changement conceptuel en biologie, avec le sentiment que nous entrions dans une nouvelle discipline scientifique, où nous essayerions de « développer des algorithmes de haut niveau pour mettre en relation les données, les structures, et la fonction des réseaux ». En conséquence, le financement augmentait : par exemple le budget de l’EBI a doublé durant cette période. Les infrastructures étaient déjà considérées comme indispensables pour que le domaine avance correctement. Des questions de politique de diffusion et de disponibilité des données et de propriété intellectuelle protégée par des brevets émergeaient aussi durant cette période précoce : « le traitement légal des inventions en bioinformatique est dans son enfance ». Ce court voyage dans un passé pas si lointain fournit je l’espère un goût de la fluidité du domaine à ces débuts. L’un dans l’autre, je proposerait que la plupart des déclarations publiques durant cette première phase étaient raisonnablement modérées et ne simplifiaient pas à outrance les défis et les directions probables de la bioinformatique au début du 21ème siècle.

*Le terme « graduate programs » peut couvrir les deux, surtout que dans de nombreux systèmes anglo-saxons on peut aller en thèse après une licence/bachelor, le master étant intégré à la thèse.

Je me permets à propos de l’interprétation des données de rappeler un vieux billet où je discutais des parallèles entre le management avec beaucoup de données, et la bioinformatique.

A propos du terme « révolution génomique », j’ai eu de nombreuses discussions avec des collègues au cours des années 2000, qui pensaient que la génomique n’était pas une révolution, mais juste « plus de la même chose ». Je pense au contraire que le couple génomique-bioinformatique représente une révolution similaire à l’arrivée de la biologie moléculaire. Parmi les innovations majeures à mon sens, la possibilité de considérer le système complet, la prise en compte de la biodiversité au niveau moléculaire et fonctionnel, et le partage et la réutilisation des données.

La période de « l’adolescence” : 2002–2006

A ce point, la discipline était déjà sous les feux de la rampe, après la célèbre poignée de mains Clinton-Blair pour l’achèvement du génome humain en 2000. Il s’en est suivi des titre sensationnels du type « le rat de laboratoire cède la place à la souris d’ordinateur », en partie pour expliquer des marchés de milliards de dollars. Différentes agences contemplaient des stratégies de soutien au domaine, et préparaient des scénarios, par exemple une éventuelle stratégie ou intégration au niveau européen dès 2006. Une observation critique est que la bioinformatique sortait de sa zone de confort, avec de nouveaux types de données, vers de la « vraie » biologie – un point qui sera discuté plus loin. L’impact des données d’expression se faisait sentir dans la communauté. A partir de ses humbles racines en biologie moléculaire, la bioinformatique montait dans la société, vers les hauteurs de la biologie cellulaire computationnelle*. L’informatisation ne se déplaçait pas seulement plus profondément au sein de la cellule, mais elle devenait aussi plus large : déjà des douzaines puis plus de 100 génomes étaient en cours de séquençage, et la comparaison multiple de génomes émergeait comme un sujet de recherche entre autres. L’établissement de la génomique structurale générait de nouveaux défis, notamment le suivi des métadonnées**. Les documents prospectifs sur l’avenir de la biologie prenaient maintenant en compte la nature interdisciplinaire du domaine, élargissant ses horizons. Il y avait une reconnaissance solide de l’élément humain dans l’utopie d’automatisation offerte auparavant par la bioinformatique, connu comme le « paradoxe des personnes »*** : la réalisation que « l’application de l’informatique à la biologie résulte en une demande accrue en personnel ». En même temps, les notions de « médecine personnalisée » et de partage des données en pharmacogénomique augmentaient les enjeux et établissaient le rôle déterminant de la bioinformatique en cette nouvelle ère. Cet impact était ressenti aussi dans des disciplines émergentes, telles que la biologie synthétique. Toutefois, dans presque toutes les présentations la question de l’intégration des données apparaissait de manière répétée, avec le développement rapide des bio-ontologies et des vocabulaires contrôlés en réponse. Il semblait que quelque soit l’effort consenti, le « paradoxe des personnes » réapparaissait pour nous hanter. C’était l’époque de l’apparition de sous-disciplines spécialisées, par exemple pour l’agronomie, générant toujours plus de données, toujours plus complexes et spécifiques. La robotique et l’automatisation progressaient rapidement en médecine. Il était de plus en plus clair que la fusion de disciplines était plus profondes qu’une intersection biologie – informatique : pour la santé publique, des questions éthiques, légales, et sociales devaient être prises en compte, ainsi que des éléments éducationnels et épistémologiques. Il y avait toutefois des inquiétudes dues à ce que le taux de découvertes et d’applications en biotechnologie médicale ne correspondait pas aux attentes très élevées, avec la réalisation que la transition d’une approche expérimentale plus artisanale à une plus industrielle, bien que productive, rencontrait de nombreux blocages en chemin vers la découverte elle-même. Un facteur dans les attentes élevées des décideurs a pu être un certain manque d’objectifs intermédiaires précis : étant donné la nature duelle du domaine, science et ingénierie, la bioinformatique a rarement des moments de « eureka » de découverte scientifique et tient davantage du processus laborieux mais inspiré de l’invention par l’ingénieur. En même temps, beaucoup d’efforts étaient investis dans la mise au point de formations, continues et primaires. Nous avons ainsi atteint un tournant, où la bioinformatique a trouvé sa place en tant que discipline clé à la fois dans les sciences de la vie et dans la biotechnologie.

* Non moi non plus je ne suis pas sûr de comprendre cette phrase.

** Génomique structurale : tentative de résoudre les structures cristallographiques des protéines à haut débit, comme le séquençage des génomes est à haut débit. A mon avis, un échec en première approximation, mais dont plein de choses intéressantes sont quand même sorties. Les métadonnées, c’est enregistrer non seulement le résultat de l’expérience, mais le matériel utilisé, les conditions exactes de l’expérience, etc. Par exemple, dans certains cas cela fait une différence d’utiliser une bouteille de solvant ouverte le jour même ou la veille, il faudrait pouvoir le tracer informatiquement.

*** « people paradox », difficile à traduire.

Je suis bien d’accord que la bioinformatique tient autant de l’ingénierie que de la science. Je dirais même plus. C’est pourquoi un laboratoire de bioinformatique qui veut avoir une bonne productivité scientifique doit également se rattacher à une discipline plus fondamentale, que ça soit l’algorithmique, la génétique médicale, la biologie évolutive, ou autre.

La période de « l’âge adulte » : 2007–2011

Il n’y a pas de division claire pour la transition suivante. La placer entre les années 2006 et 2007 permet une certaine symétrie. Néanmoins, il est évident que durant les 5 dernières années nous sommes passés dans une nouvelle phase, qui – si elle est bien comprise – peut nous aider à définir notre stratégie future. Dès 2007, les choses étaient devenues plus sophistiquées : le text mining pouvait à présent être utilisé pour l’analyse de tendances en aide à la décision, le développement des ontologies proliférait dans tous les aspects de l’informatique, et la bioinformatique était ubiquitaire dans les sciences de la vie, par exemple, s’étendant à la biologie de la conservation ou la biologie synthétique. A côté des aspects plus théoriques de la biologie des réseaux, illustrés par les réseaux d’interactions de gènes ou de protéines, la pression montait pour soutenir la médecine translationnelle, de la variation structurale à la bioinformatique des cancers. Avec l’enthousiasme initial réapparaissaient des erreurs du passé, par exemple dans la publication de variants structuraux*, pour lesquels « il n’y a eu aucune approche standard pour collecter les données, évaluer leur qualité, ou décrire leurs caractéristiques » – similaire à l’annotation fonctionnelle une décennie auparavant. D’un autre coté, les défis n’étaient pas très différents de ceux que le domaine affrontait depuis le début : « maintenir un énorme volume de données, intégrer l’information de différentes plateformes de découverte, et reconnaître les implications phénotypiques »**. Au milieu de cette nouvelle vague, les biologistes ont dû s’adapter à nouveau à une diversité incroyable de nouveaux logiciels mettant davantage l’accent sur l’utilisabilité : « l’intuition biologique et l’autonomie de l’investigateur doivent prendre précédence sur l’idée actuelle que les biologistes doivent se reformer et devenir des programmeurs lorsqu’ils analysent des jeux de données génomiques. » Un « déjà-vu » est apparu concernant la formation et l’éducation, par exemple dans la formation de cliniciens (médecins) dans le domaine translationnel de la médecine génomique, qui se doit d’inclure de la bioinformatique. En même temps, de nouveaux problèmes émergeaient, dus au séquençage de nouvelle génération, du reséquençage à la métagénomique. Ce nouveau flux de données était nécessairement plus proche des plateformes le générant, par rapport aux types de données classiques de la bioinformatique plus abstraits ; plus « réel » en effet ! Des problèmes traditionnels sont encore avec nous, comme la découverte de médicaments et de biomarqueurs, l’annotation des données, la fouille de la littérature, et la mise au point de flux d’opérations (workflow). La prédiction en 2008 était que dans 10 ans nous aurions une infrastructure suffisante pour la recherche en biologie, avec une fusion des disciplines. En regardant aujourd’hui, nous sommes faces à une expansion des problèmes, de l’assemblage des génomes au design des protéines, de la métagénomique à la médecine génomique, aux maladies infectieuses, et à la détermination de phénotypes. Ces derniers méritent quelques citations, puisqu’ils deviennent maintenant très « réels ». Du côté de la métagénomique, il a été noté que « comprendre comme la Terre respire, grandit, évolue, se renouvelle et soutien la vie est la grande aventure qui nous appelle maintenant. » Pour la médecine génomique, nous entendons que « la médecine des systèmes devrait être développée à travers un réseau international […] dédié à la formation et l’éducation inter-disciplinaires, pour aider à diminuer le fossé en soins entre pays développés et en voie de développement », et que puisque « les micro-organismes ne respectent pas les frontières, de telles initiatives devraient être l’initiative d’organisations non gouvernementales […] pour faciliter la diffusion de nouveaux concepts et logiciels. » Dans un sens, le complexe génomique-bioinformatique s’est maintenant répandu dans le monde réel. Les défis de la santé, de l’alimentation, des matériaux, des carburants, des sources d’énergie, et de l’environnement sont tous au programme. Les attentes sont élevées et les enjeux n’ont jamais été aussi élevés.

* Variations entre génomes individuels dus à de gros changements chromosomiques, par exemple la répétition d’un fragment ou son inversion.

** Le phénotype c’est le résultat de l’activité des gènes, qui nous intéresse (en gros).

Il me semble que le point de coupure correspond vraiment à la maturation du marché du séquençage de nouvelle génération (voir sur BioPsi), qui permet à de nombreux domaines de passer facilement au haut débit, et confronte les bioinformaticiens à des quantités de données comparables à celles des physiciens. Un autre effet auquel l’auteur fait allusion est que jusqu’alors on pouvait analyser les données sans nécessairement comprendre les méthodes expérimentales les générant. Mais avec ces nouvelles données expérimentales (déjà avec les puces à ADN d’ailleurs) les biais expérimentaux deviennent une part majeure de l’analyse bioinformatique.

Une autre explication : trop de progrès

Il est peut-être évident à ce point que le « déclin » de l’intérêt médiatique et la diminution potentielle de l’usage linguistique de « bioinformatique » ne sont peut-être pas due à l’explication évidente « trop de promesses ». Ainsi que nous l’avons suggéré ci-dessus, les attentes des dernières 15 années ont généralement été modestes et réalistes au sein de la communauté bioinformatique. Malgré les défis importants représentés par les attentes extérieures, les opportunités commerciales, les problèmes légaux et éthiques,  les besoins en formation et en éducation, ainsi que les révolutions technologiques multiples, du Web aux portables, le domaine a non seulement contribué à la révolution omique*, mais a aussi établi la base pour transformer la biologie en une science quantitative. Dans ce sens, une explication alternative et probablement plus juste pour ce déclin apparent pourrait être qu’en effet, s’il s’est passé quelque chose, c’est un excès de progrès. Pour lister quelques-uns des efforts récents, de manière ad hoc, on peut mentionner les liens à la biologie synthétique, les interactions protein-molécules, la médecine ou la physiologie des systèmes, la médecine translationnelle et personnalisée, ou les études d’association pangénomique (GWAS). Malgré des reportage parfois négatifs, il y a eu un progrès énorme vers la mise en place de l’informatique dans à-peu-près tous les domaines des sciences de la vie. Et pourtant les vieux problèmes restent avec nous et ne doivent pas être négligés, tels que la recherche dans les bases de données, l’alignement multiple, la détection d’orthologues, les relations structure-fonction ou entre espèces, et l’annotation des protéines. Avec de nouveaux volumes de données, tous ces problèmes reviennent au centuple – y compris une fois encore la formation.

* Terme recouvrant la génomique et d’autres techologies haut-débit en biologie (transcriptomique, protéomique, etc.).

De global à local – et retour

La présentation ci-dessus est une tentative de présenter un tour rapide de ce qui s’est passé dans les dernières 15 années dans le domaine. L’accent a été sur la perception du domaine et non seulement le contenu : quand cette étude a commencé, je cherchais des promesses hyperboliques, mais j’en ai trouvé peu. Ainsi on peut admettre que la tendance au déclin peut être attribuée surtout à la nature du domaine, qui se trouve au sein d’un plus grand changement, poussé par des besoins industriels et sociaux*. En d’autres termes, ce n’est pas un manque d’intérêt, et encore moins un manque de progrès : c’est plutôt l’inverse. Le vaste progrès et le démembrement de la recherche biologique traditionnelle en une science plus précise et plus quantitative a déplacé la bioinformatique de la périphérie à l’œil du cyclone.

Deux remarques qui concernent d’autres questions posées plus tôt. Premièrement, le passage de l’exploration académique aux applications « monde réel », et l’extension du domaine d’application au fonds de la cellule et à travers les niveaux d’organisation de la biologie entraînent des moyens de calcul de plus en plus locaux. Il y a quelques années, il aurait été inconcevable de rester compétitif avec quelques données partielles et un ordinateur. Il semblait quel l’on aurait besoin de plus en plus de capacité de stockage et de calcul pour mettre en œuvre une recherche un tant soit peu significative, et que de passer à l’échelle supérieure était le seul moyen d’avancer. Et pourtant, grâce aux infrastructures déjà en place et aux particularités de la nouvelle génération de plateformes de génération de données, il devient possible de décroître et étudier des problèmes de manière effective. De manière subtile mais significative, à la fois les données biologiques et la puissance informatique semblent apparaître dans les nuages de l’internet. Les données peuvent être très riches, et de petites doses concentrées peuvent générer des résultats fascinants. De même, la puissance de calcul devient disponible de différentes manières et à des endroits inattendus. Le jeu change : ce n’est plus un effort pour concentrer le plus de données possible et les jeter dans de gros ordinateurs, mais peut-être quelque chose de beaucoup plus effervescent**. Le bon mélange de données et de machines va fournir de petits paquets de science excitante de grande qualité***. Les calculs en biologie vont peut-être produire l’équivalent du parfum ou des épices pour la recherche scientifique ou médicale, sans exclure bien sûr l’équivalent de la nourriture de masse, à laquelle nous avons été habitués jusqu’à présent.

Deuxièmement, il est intéressant de voir combien de questions clé que nous pensions résolues nous reviennent à des niveaux différents. Nous avons listé quelques-unes de ces questions scientifiques ci-dessus ; elles peuvent être liées à des thèmes sociaux toujours présents tels que les joies de l’anarchie et de la gestion des données qui en résulte, le besoin jamais satisfait pour l’éducation et la formation, l’illusion de l’intégration des données, et surtout la nature duelle du domaine. Une évaluation honnête et la définition d’objectifs pertinents ont le potentiel d’améliorer la compréhension publique de la bioinformatique et d’aller vers une gestion plus sage et meilleure des attentes.

* Je suis important !

** C’est le mot qu’il utilise ; j’ai hésité à traduire excitant, mais voilà.

*** Voilà, c’est ça que je fais toute la journée.

Alors j’avoue que j’ai du mal à suivre l’auteur par ici. Je pense qu’il est très biaisé par son propre passage à l’EBI, à faire de grosses bases de données. Pas tout le monde faisait ça, et la recherche avec des moyens modestes et des résultats intéressants a toujours existé en bioinformatique.

Sur sa dernière phrase, là, je crois qu’il rêve un peu, mais bon.

Epilogue

La notion d’informatique en biologie, qui tenait presque de la discussion religieuse il y a seulement 10 ans, est maintenant acceptée comme un pilier de la nouvelle biologie. C’est pour ceci que malgré l’usure apparente les infrastructures pour l’analyse informatique des systèmes biologiques augmentent, et passent de laboratoires de recherche au grand public des sciences de la vie*. En même temps, la fusion de la bioinformatique avec le gros de la biologie rend difficile la mise en valeur du domaine : comme prédit il y a des années « cette discipline va continuer à évoluer rapidement au 21ème siècle, jusqu’à être méconnaissable ». Il se peut qu’une nouvelle « biologie théorique » émerge, dans laquelle les modèles et leurs prédictions puissent être évaluées par la biologie expérimentale, de manière analogue à ce qui se passe avec la physique théorique et expérimentale. Ce moment pourrait venir plus tôt qu’attendu. La fusion de l’informatique dans la nature des sciences de la vie et de la médecine d’ici 2020, en acquérant une position clé et critique au sein des outils utilisés, va peut-être nécessiter une redéfinition de la bioinformatique en tant que discipline à part dans le futur pas si lointain.

* J’ai eu du mal à traduire « mainstream » ici.

Je reprends la main ici, l’article est fini.

Globalement, je suis d’accord avec l’argument principal de l’article (sinon je ne l’aurais pas traduit), à savoir que la bioinformatique est de plus en plus intégrée à l’activité normale de la bioinformatique biologie [merci à @RomainStuder d’avoir remarqué l’erreur], et donc de moins en moins considérées comme un truc bizarre et à part. Je pense que la même chose est arrivée à la biologie moléculaire, où on est passé d’une activité très particulière, à l’embauche de professeurs « de biologie moléculaire », à l’invasion des autres domaines par les techniques et approches issues de la biologie moléculaire (virologie moléculaire, endocrinologie moléculaire, écologie moléculaire, etc), à un point où cela va sans dire, on ne fait plus de biologie en ignorant les approches moléculaires. Pour la bioinformatique, je pense qu’on en est en transition entre la phase « on embauche un prof de bioinformatique » et la phase « on fait de la bioinformatique/génomique des virus, des populations, de l’endocrinologie, etc ».

We live in interesting times.

Mise à jour : je viens de découvrir grâce à @goulu que Google translate offre un excellent service qui m’aurait permis de garder les références et de moins m’embéter globalement. La prochaine fois.

4 réponses à “Grandeur et chute de la bioinformatique ? Promesses et progrès

  1. Bel effort. Je ne relève pas les défauts de ta traduction, plutôt le courage (dont je serais incapable) pour mettre en ligne une traduction imparfaite plutôt que de ne rien faire du tout, puisque faire une traduction soignée aurait requis un effort beaucoup plus conséquent.

    Sur le fond, en gros, je ne trouve rien d’intéressant aux détails (mais c’est moi, et sans recul juste après avoir lu), ta conclusion m’aurait suffi. Peut-être parce qu’une traduction rapide d’un texte quand même assez riche, c’est un truc difficile à relire…

  2. Ping : Grandeur et chute de la bioinformatique ? Promesses et progrès | C@fé des Sciences | Scoop.it

  3. Ping : Impact de la bioinformatique : questions / réponses | Tout se passe comme si

  4. Ping : Grandeur et chute de la bioinformatique ? Prome...