Archives pour la catégorie mort

Représentation graphique des victimes d’attentats en France depuis 2 siècles

cliquez sur l'image

cliquez sur l’image

En suivant un lien vers les victimes d’attentats au Liban, j’ai découvert que Wikipedia a une liste des attentats avec les victimes au Liban. Du coup j’ai regardé pour la France, et il y a aussi une telle liste, et dans le cas de la France il y a un tableau analysable. Du coup, cela permet de mettre les attentats récents en perspective.

D’abord, je récupère le tableau de chiffres depuis Wikipedia. Il y a des accès programmatiques élégants, mais j’ai fait ça « quick and dirty », donc copier-coller dans un fichier texte puis importation dans R. R est un environnement de statistiques gratuit et open source, puissant si peu facile d’usage pour les débutants (page officielle, petite explication sur le blog bioinfo-fr).

Puis j’ai mis en forme : remplacer les entrées de type « 50+ » par le nombre seul, par exemple « 50 » dans ce cas, pour permettre le traitement. Et transformer le format bizarre de dates dans Wikipedia en un format reconnu par R, en mettant des tabulations entre les éléments des dates dans le fichier texte (récupérable ici), puis en important dans R et transformant avec as.Date().

Ensuite, c’est simplement une histoire de faire des graphiques simples avec la fonction plot(). Comme je suis chef d’équipe et que j’utilise à peine R (ou d’autres languages) de nos jours, mon code est tout moche mais le voici :

terror_france<-read.delim("~/Desktop/terror_france.txt")
terror_france$date<-as.Date(with(terror_france, paste(Year, Month, Day, sep='-'), "%Y-%m-%d"))
terror_france<-terror_france[order(terror_france$date),]
terror_france$cumulative_dead<-cumsum(terror_france$Dead)
terror_france$cumulative_injured<-cumsum(terror_france$Injured)

plot(terror_france$date, terror_france$cumulative_dead, type='o', xlab="date", ylab="cumulative number of dead", col=ifelse(terror_france$Dead>50, "red", "black"))
text(x=2000, y=350, "These are the dead of 13th November 2015", col="red", pos=2)
text(x=2000, y=330, "in context of 2 centuries of terrorism", col="red", pos=2)

plot(terror_france$date, terror_france$cumulative_injured, type='o', xlab="date", ylab="cumulative number of injured", col=ifelse(terror_france$Injured>200, "red", "black"))
text(x=2000, y=1900, "These are the injured of 13th November 2015", col="red", pos=2)
text(x=2000, y=1800, "in context of 2 centuries of terrorism", col="red", pos=2)

Voici les résultats :cumulative_dead

On voit immédiatement que les attentats de ce vendredi 13 novembre ont fait beaucoup plus de morts que n’est habituel (je n’ai pas envie d’utiliser le mot « normal » pour des attentats qui ne devraient pas l’être). On voit aussi que la guerre d’Algérie n’a pas fait tant de morts que ça en France métropolitaine par attentats (clairement d’autres sources de victimes ne sont pas comptées ici). Mais que les années 1980 ont été marquées par de nombreux attentats, chacun d’amplitude pas très forte, mais qui cumulent un grand nombre de morts au final.cumulative_injuredPour les blessés les années 1980 sont encore plus marquantes, et les attentats récents moins, ce qui met en avant à quel point ces attentats ont été meurtriers en nombre de morts relativement au nombre total de victimes.

En réagissant à une version préliminaire de ces graphiques, Alexander Doria a remarqué :

Bonne question, je ne sais pas. Lecteurs historiens ?

Mise à jour suite au commentaire de MAthieu : courbe en escalier :

staircase_deadMise à jour 2 : un article similaire sur le site Les Décodeurs du Monde.

Mise à jour 3 : suite à demande populaire, le graphe en non cumulé, que personnellement je trouve moins clair mais voici.

non_cumumative_dead

Carl Woese a révolutionné la biologie puis est mort sans prix Nobel

pieuvre

cliquez sur l’image

Tiens on parlait de phylogénie moléculaire, revenons sur un très grand monsieur de la biologie, qui est mort fin 2012 : Carl Woese. Peut-on imaginer un physicien ou un chimiste qui aurait changé par sa recherche le premier chapitre des livres d’introduction à la matière, et en fait la façon dont on considère toute sa discipline, mais n’aurait pas eu de prix Nobel ? Mais voilà, il n’y a pas de prix Nobel en biologie, mais en médecine, ce qui n’est pas la même chose. C’est dégoutant, voilà ce que c’est.

On pensait bien depuis Dawin et ses successeurs que toutes les espèces vivantes étaient apparentées, et que leurs relations avaient la forme d’un arbre. De manière très célèbre, la seule figure dans l’Origine des espèces est un schéma d’arbre des espèces, et la plus ancienne trace de cet idée date de ses brouillons en 1837 :

I think

Dans le siècle et demi qui a suivi, on a fait pas mal de progrès pour faire des arbres phylogénétiques des grosses espèces qu’on voit à l’oeil nu et qui ont plein de caractères permettant aisément de retrouver les parentés les plus évidentes. Les animaux et les plantes donc. Mais pour les micro-organismes, et notamment les bactéries, on restait coincé dans une approche pré-Darwinienne. On classait en gros et petits, en ronds et en longs, en qui réagissent à ce produit chimique et qui ne réagissent pas, et bien sur qui rendent malade ou pas.

Carl Woese a eu le premier l’idée que la génétique moléculaire fournissait des outils pour étudier l’histoire évolutive des bactéries. Toutes les bactéries partagent certaines molécules qui s’occupent de fonctions fondamentales à la survie de la cellule, comme la traduction des gènes en protéines (merci d’applaudir le ribosome !). De manière frappante, surtout par rapport à nos connaissances de l’époque, les gènes codant pour ces molécules, notamment l’ARNr 16S, sont suffisamment conservées entre espèces très différentes pour les comparer, classifier les similarités et les différences, et utiliser cette information pour non seulement classer les espèces au sens de Linné, les ranger dans de jolies boîtes, mais les classer au sens de Darwin, retrouver leur histoire évolutive, leurs relations de parenté. Mieux, ces gènes sont comparables entre les bactéries et les animaux ou les plantes ! Pour la première fois depuis Darwin, en 1977, on peut tracer un arbre phylogénétique incluant toutes les sortes d’espèces vivantes.

Et cet arbre était plein de surprises ! Animaux, plantes et champignons représentent une part de toute petite de la diversité du vivant, trois petites branches tardives au sein de l’embranchement des eucaryotes, qui inclut aussi toutes sortes de microbes dont les cellules marchent à-peu-près comme les notres. Et les autres microbes, qui zont pas de vrai noyau à chromosomes, se partagent en deux groupes d’âge et d’importance équivalent chacun aux eucaryotes, les bactéries « vraies » et les archées, d’abord trouvées dans des environnements dits extrêmes, sources très chaudes, eau très salée, mileu riche en sulfure, etc.

Cette découverte a eu plein de conséquences, je vais surement en oublier. Il devenait possible de classer le vivant de manière phylogénétique. Il devenait possible de classer des espèces dont on ne savait rien que l’ADN. Il devenait possible de comparer des espèces n’ayant aucun trait commun. Avant cela, même classer les relations entre insectes, vertébrés et vers n’était pas faisable. La diversité du monde microscopique devenait visible. Depuis, on a fait plein de progrès, on a nuancé cet arbre en découvrant l’abondance du transfert latéral de gènes entre espèces microbiennes, on a découvert une diversité encore plus grande en séquençant de l’ADN de l’environnement et en le classifiant, on a bien sur grandement amélioré et nos techniques de séquençage d’ADN et d’analyse phylogénétique, mais la contribution de Woese demeure immense.

Et le manque de Nobel met en évidence de la manière la plus forte possible que nous n’avons pas de prix Nobel en biologie.

Semaine du c@fé de la mort

Le dessin de la mort, cliquez donc.

Cette semaine, il n’y aura pas de matériel neuf sur ce blog, mais le C@fé des sciences fait une semaine thématique sur le thème de la mort. Y compris un billet publié en septembre sur ce blog, sur la mort des gènes.

Lisez-y, y a plein de bon, des nouveaux articles chaque jour : Thema mort sur C@fé des sciences.

 

Des gènes soit presque morts soit presque vivants

cliquez sur l’image

On sait depuis longtemps que les gènes naissent, vivent et meurent. Forcément, puisqu’on observe des gènes dans certaines espèces mais pas d’autres (par exemple y a des récepteurs aux estrogènes chez les vertébrés mais pas chez les mouches, encore moins les plantes ou les champignons), donc ils du « naître » à un moment, et on observe parfois que la distribution doit s’expliquer par une perte (par exemple presque tous les mammifères ont l’enzyme de synthèse de la vitamine C, sauf un sous-groupe de primates dégénérés dont nous sommes), donc le gène a du « mourir ».

Un article récent dans Nature (dont d’accès fermé, désolé) propose un très joli modèle sur la façon dont ce cycle vie-mort des gènes peut se produire, et met en avant surtout l’aspect graduel de la transition entre ADN codant pour un gène fonctionnel (« vivant ») ou non.

Ils ont utilisé plusieurs avantages du modèle « levure » : la levure S. cerevisiae (de boulanger et autres fermentations) est très bien étudiée du point de la fonction des gènes ; les levures ont des génomes très compacts où presque tout est fonctionnel, donc c’est facile d’étudier le reste ; et on a les génomes de 13 autres levures plus ou moins apparentées à S. cerevisiae, qui permettent de faire des comparaisons à différents degrés de divergence évolutive (comme on pourrait comparer le génome humain à ceux du chimpanzé, du gorille, du macaque, d’un lémurien, de la souris, etc).

Dans le génome de la levure (quand je dis la levure, je veux dire S. cerevisiae, OK ?) on connait des gènes bien définis, clairement fonctionnels. On connaît aussi des pseudo-gènes, qui sont des cadavres de gènes ayant perdu leur fonction mais ayant encore une ressemblance notable au gène dont ils sont issu. Les pseudo-gènes n’étant pas protégés par la sélection naturelle accumulent beaucoup de mutations, et deviennet peu-à-peu indistinguables de l’ADN non fonctionnel aléatoire.

Mais les gènes et pseudo-gènes connus ont un biais de taille si je puis dire : on sait très mal détecter les plus petits des gènes. On manque de signal statistique.

Pourquoi donc ? Parce qu’une séquence courte peut sembler avoir les propriétés d’un gène par hasard. Tiens donc. Et alors une séquence courte ne pourrait-elle pas réellement avoir les propriétés d’un gène par hasard ? L’hypothèse que testent (et démontrent c’est pour ça qu’on en cause) les auteurs est que des séquences courtes peuvent générer au hasard des « proto-gènes », des gènes naissant. Pour tester cela, ils prévoient qu’il y ait non pas une division nette entre gènes clairement actifs et conservés dans l’évolution, et séquences non géniques inactives et non conservées, mais un continuum entre les deux, avec les proto-gènes généralement plus courts, moins actifs (ils sont encore en train de devenir des gènes), et moins conservés dans l’évolution (ils viennent d’apparaître).

Et c’est ce qu’ils observent : plus une séquence qui ressemble à un gène (clairement fonctionnelle ou proto-gène potentiel) est longue, plus elle est exprimée (en première approximation, plus elle produit de protéine), plus les protéines potentielles sont codées efficacement (codon bias index, fréquence des acides aminés), plus les protéine potentielles sont solubles (moins hydrophobe, moins de régions transmembranaires, moins de régions désorganisées). De plus, si on ne regarde que les gènes potentiels courts, ceux qui sont partagés seulement entre la levure et des espèces très proches, donc sont apparus récemment, ressemblent moins à des gènes fonctionnels que ceux qui sont partagés par des espèces éloignées, et donc existent depuis longtemps. On voit donc les différentes étapes du passage de proto-gène à vrai gène, en comparant des séquences qui ont des âges évolutifs différents.

Donc il y a bien naissance progressive des gènes à partir des séquences aléatoires, de manière approximativement symmétrique à la mort progressive des gènes, qui deviennent des séquences aléatoires. A noter que ce sont des processus réversibles : un proto-gène peut être inactivé par une vilaine mutation et redevenir non fonctionnel. Et il y a des cas connus de pseudo-gènes réactivés par une gentille mutation, et redevenus donc des gènes actifs. Et bien sûr dans l’ADN non fonctionnel « aléatoire », on ne sait pas quel fraction est composée de pseudo-gènes tellement dégénérés qu’on ne les reconnaît plus, mais peuvent maintenant donner naissance à des pseudo-gènes.

Et on a donc le « cyle de la vie » des gènes suivant :

cliquez sur l’image si vous avez un abonnement à Nature