SommaireArchives
EmploisLivresForum
01/03/1997 La Recherche
PASCAL TASSY est professeur au Muséum national d'histoire naturelle à Paris.

Exercice de construction phylogénétique
Les rongeurs forment-ils un groupe monophylétique ?
Évaluer les méthodes phylogénétiques
Figure 1.

Figure 2.











*LA CONSTRUCTION PHYLOGÉNÉTIQUE a pour but de retracer l'ascendance des êtres vivants. Le concept de phylogénie a été introduit en 1866 par le naturaliste allemand Ernst Haeckel. Aux premiers temps de l'élaboration des théories de l'évolution, on parlait de généalogie.
*UN GROUPE ANCESTRAL rassemble des espèces partageant un même niveau évolutif primitif.
*LA MÉTHODE PHÉNÉTIQUE (du grec phaino : paraître) classifie les espèces sur la base de leur ressemblance globale. Celle-ci est exprimée au moyen de différents indices mathématiques.
*LES HOMOPLASIES sont les ressemblances dues à des convergences ou à des réversions.
*LE TAXON est un groupe d'organismes reconnu en tant qu'unité formelle à quelque niveau de la classification que se soit.
*Il existe trois types de
MODIFICATIONS DES SÉQUENCES DE NUCLÉOTIDES :
une perte de nucléotide (délétion), un remplacement d'un nucléotide par un autre (substitution) et une addition de nucléotide (insertion).
*En biologie moléculaire,
LE TAUX D'ÉVOLUTION D'UN SITE NUCLÉOTIDIQUE est le taux moyen auquel des modifications se produisent sur ce site.




(1) G.G. Simpson, Principles of animal taxonomy, Columbia University Press, 1961.
(2) E. Mayr, Principles of systematic zoology, McGraw-Hill, New York, 1969.
(3) C.B. Stewart , Nature, 361, 603, 1993.
(4) A.A. Sidow, Nature, 367, 26, 1994.
(5) C.B. Stewart , Nature, 367, 26, 1994.
(6) L-L. Cavalli-Sforza, P. Menozzi et A. Piazza , The history and geography of human genes, Princeton University Press, 1994.
(7) W. Hennig, Grundzüge einer Theorie der phylogenetischen Systematik , Deutcher Zentralverlag, Berlin, 1950.
(8) W. Hennig, Phylogenetic systematics , University of Illinois Press, Urbana, 1966.
(9) P. Forey et P. Janvier, Amer. Sci., 82 , 554, 1994.
(10) J.S. Farris, in « Advances in cladistics 2 » , N.I Platnick et V. A. Funk (eds.), Columbia University Press, 7-36, 1983.
(11) G. Nelson, in « Systématique et phylogénie », P. Tassy et H. Lelièvre (coords.), Biosystema 11 , 528, 1994.
(12) M. d'Udekem-Gevers, Biosystema, 4 , 28, 1990.
(13) J. Felsenstein, Syst. Zool., 27, 401, 1978.
(14) J.P. Huelsenbeck et D.M. Hillis , Syst. Biol., 42, 247, 1994.
(15) J.P Huelsenbeck, Syst. Biol., 44, 17, 1995.
(16) D.M. Hillis et al., Science, 255, 589, 1992.
(17) D.M. Hillis, J.P. Huelsenbeck et C.W. Cunningham, Science, 264, 671, 1994.
(18) P. Tassy, Vie et milieu , 46 , 115, 1996.
(19) D. Penny, M.D. Hendy et M.A. Steel, Trends Ecol.Evol. , 7 , 73, 1994.
(20) J. Felsenstein , Biol. J. Linn. Soc., 16 , 183, 1981.
(21) D.R. Brookes et D.A. McLennan, Phylogeny, ecology and behaviour, The University of Chicago Press, 1991.
(22) « Tests phylogénétiques de scénarios évolutifs », E.P. 90, CNRS, 3-4 juin 1996, MNHN, Paris.

La Recherche a publié :
(I)Philippe Janvier et al., « Le cladisme », décembre 1980.
(II)Pierre Thuiller,« Le scandale du British Museum », septembre 1981.
(III)Véronique Barriel,« Mythes et réalités de l'approche génétique », juin 1995.



> DOSSIER


> MÉTHODOLOGIE

Comment reconstituer la généalogie des organismes vivants
Un arbre pas comme les autres

Dans les années 1970, l'arrivée en force du cladisme a bousculé les vieilles idées en matière de construction phylogénétique. Pour les cladistes, seul le partage des caractères évolués entre espèces permet de retracer l'histoire du développement des êtres vivants. Leurs modèles impliquent une généalogie économique : l'arbre des cladistes est en effet l'arbre le plus court, celui qui comporte le plus petit nombre de pas évolutifs. Contrairement à ce que prétendent ses détracteurs, l'efficacité de cette théorie est désormais testable.
Les paléontologues et les biologistes de ma génération Ñ qui ont fréquenté les amphithéâtres universitaires dans les années 1960 Ñ ont appris l'histoire de l'évolution des espèces, l'origine des groupes, l'acquisition des grandes structures, au travers d'arbres généalogiques. Les idées d'alors étaient souvent formulées en termes d'arguments d'autorité autour desquels se créait, ou non, un consensus. Aussi telle hypothèse était-elle préférée à une autre, tout simplement en raison de l'autorité de son auteur, ou Ñ ce qui revient au même Ñ des écoles de pensée. Quoique rationnelle et savante, la construction des arbres généalogiques, parce qu'extrêmement subjective, fut l'objet de critiques sévè-res. De fait, l'arbre généalogique, fruit d'une opinion, fut souvent mis en opposition avec les productions des « vraies sciences » hypothético-déductives.

Aujourd'hui, en marge des théories sur l'évolution, la construction phylo-génétique* est un objet de recherche, une discipline à part entière née il y a une vingtaine d'années avec l'arrivée de nouveaux modèles sur l'évolution. Comment est-on passé des arguments d'autorité à la science des arbres phylogénétiques ?

Nous savons que les êtres vivants ont évolué depuis plus de trois milliards d'années. Pendant tout ce temps ils se sont transformés et se sont diversifiés jusqu'à donner les deux millions d'espèces actuelles recensées (il en existerait de trois à dix fois plus à identifier) auxquelles s'ajoutent les espèces fossiles. On peut représenter les parentés entre tous ces êtres par une succession de branchements dichotomiques Ñ la séquence des diversifications Ñ qui se déploient dans la dimension du temps géologique. Cette illustration de l'histoire Ñ l'arbre phylogénétique Ñ est l'image emblématique de la science évolutionniste.

Bien que cette image soit connue et, somme toute familière, la phylogénie reste un concept subtil. Les parentés entre espèces et groupes d'espèces ne nous sont pas données : c'est au phylogénéticien de construire son arbre à l'aide de l'analyse comparative des organes des êtres vivants et des traces laissées par les fossiles. Cette opération de construction, quasi bicentenaire depuis la publication par Jean-Baptiste Lamarck en 1809 d'un schéma fort simple illustrant les parentés entre les êtres vivants, a toujours suscité des controverses.

L'essentiel du débat repose sur les règles du jeu de construction. Dans les années 1950-1960, la construction des arbres phylogénétiques s'est notamment organisée autour d'un principe particulièrement bien exposé par le paléontologue George Gaylord Simpson et le zoologiste Ernst Mayr. Selon ces derniers, la recherche de l'ancêtre doit guider toute reconstruction phylogénétique, sachant que toute espèce fossile est potentiellement l'ancêtre d'une autre, voire d'une espèce actuelle. On a ainsi regroupé des espèces en groupes ancestraux* sur la base du partage de caractères primitifs, sans examiner plus à fond leurs relations de parentés précises(1,2).

Au début des années 1970, une polémique agita la communauté scientifique lorsqu'une nouvelle méthode, appelée cladisme (du grec klados : rameau)(I), prétendit, d'une part, supplanter la méthode Simpson-Mayr, et d'autre part servir de base à tout discours sur la diversité du vivant, sur les notions de classification et d'évolution, y compris sur les pratiques muséologiques dans les muséums d'histoire naturelle(II). Cette méthode a pour but d'apparenter deux espèces ou grou-pes d'espèces (appelés groupes frères) à partir de la reconnaissance des états évolués des caractères, hérités de l'espèce ancestrale immédiate (la plus proche) et non à partir des états primitifs, hérités d'une espèce ancestrale plus lointaine.

Aujourd'hui, le cladisme, dont il n'était pas difficile d'annoncer il y a quinze ans le succès inéluctable, reste pourtant sujet à controverse. On a pu lire, il y a peu, par exemple, un échange vif sur les mérites respectifs des méthodes concurrentes dites cladistique et phénétique* dans les colonnes de la revue britannique Nature (3,4,5) . Dans le livre du généticien italo-américain Luigi-Luca Cavalli-Sforza sur l'histoire des populations humaines, promis à devenir un classique(6), on trouve aussi une critique acerbe du cladisme qui, selon cet auteur, « ne suit pas la procédure scientifique standard qui est de construire un modèle pouvant être testé empiriquement, et rejeté ou modifié si nécessaire » .

Qu'est ce que le cladisme et en quoi cette méthode est-elle, selon ses promoteurs et défenseurs, un nouvel outil pour l'analyse et la compréhension de l'évolution et de la diversité du vivant ?

Le cladisme est né dans les années 1950 des réflexions d'un entomologiste allemand, Willi Hennig, auteur de deux ouvrages sur les principes de construc-tion phylogénétique(7,8). Selon ce grand connaisseur de mouches et moustiques, mais aussi exceptionnel esprit de logique analytique, la question des parentés entre les espèces est restée longtemps obscurcie par ce que l'on pourrait appeler la pensée dichotomique : l'opposition entre ce qui est et ce qui n'est pas, entre ce qui a et ce qui n'a pas. En avoir ou pas, telle est la question que le scientifique s'est posée en tentant d'organiser la diversité biologique, autrement dit depuis Aristote. Cette façon d'observer la nature a abouti, au XXe siècle, aux constructions d'arbres généalogiques où les espèces sont regroupées sur la base du partage (ou du non- partage) des caractères, sans distinguer leur état d'évolution. Ainsi, la méthode phylogénétique dite phénétique, utilisée par de nombreux biologistes moléculaires, est fondée sur l'analyse des distances entre espèces, distances calculées à partir de leur ressemblance globale.

Certes, il y a des êtres qui sont pourvus de sang et d'autres qui en sont dépourvus, des êtres qui ont des vertèbres et d'autres qui n'en ont pas, des êtres munis de mâchoires, les « gnathosto-mes », et d'autres qui en sont privés, les « agnathes ». Ces derniers ont-ils pour autant une dimension phylogénétique au sens de Hennig ? Ont-ils véritablement le même degré de parenté, la même équidistance vis-à-vis des autres organismes au regard du caractère « absence de mâchoire » ?

La théorie de l'évolution et la systématique (l'étude de la diversité biologique) nous ont appris qu'en matière de biologie tout se transforme, à commencer par les caractères. Revenons au cas des gnathostomes : la présence de mâchoires (c'est-à-dire une transformation du squelette liée aux arcs branchiaux du crâne) est un caractère évolué partagé par tous les membres du groupe Ñ les traditionnels poissons, amphibiens, reptiles, oiseaux et mammifères. On peut donc supposer que ces cinq classes d'animaux ont une origine phylogénétique commune (un ancêtre commun exclusif) et qu'elles forment en cela un groupe « monophylétique », identifié par au moins un caractère évolué commun Ñ ici, la présence de mâchoires. Mais un organisme, quel qu'il soit, n'est jamais entièrement primitif ou entièrement évolué et les caractères appartenant à différents organes peuvent montrer des niveaux d'évolution différents.

Ainsi, lorsqu'on analyse certains caractères d'une lamproie, ce vertébré sans mâchoire (groupe des agnathes) réputé pour son extrême habileté à se coller sur ses proies pour leur sucer le sang, on constate une grande disparité entre d'une part, ses arcs branchiaux restés à l'état primitif et, d'autre part, son cerveau et son système sensoriel, qui présentent en effet des transformations observées par ailleurs chez tous les gnathostomes(9). Sur la base de ces observations, le paléontologue français Philippe Janvier n'hésita pas, à la fin des années 1970, à ranger les lamproies et certains agnathes fossiles de l'ère Primaire (notamment les ostéostracés) en compagnie des gnathostomes dans un supergroupe monophylétique appelé « myopterygia ». D'où l'idée que notre lamproie serait plus proche d'un éléphant que d'une myxine, ce petit vertébré marin primitif Ñ très apprécié des restaurateurs japonais Ñ qui vit à faible profondeur dans les fonds vaseux (fig. 1) ! Selon cette thèse, l'ensemble formé par les lamproies et les myxines ne doit pas être considéré comme un groupe monophylétique puisque ses membres ne partagent pas de caractère évolué hérité d'un ancêtre exclusif et ne représentent pas la totalité de la descendance de cet ancêtre. On parle alors de groupe « paraphylétique ».

Cet exemple a valeur universelle. Les groupes paraphylétiques fourmillent dans la littérature biologique et paléontologique, à tous les niveaux de la classification, notamment au niveau des espèces et des genres, et sont une source d'erreurs majeures pour notre compréhension de l'histoire de la vie.

Le partage d'un caractère resté à l'état primitif n'est pas un signe de proche parenté, tandis qu'au contraire le partage de l'état transformé Ñ évolué Ñ d'un caractère permet d'identifier les parentés et, par voie de conséquence, les groupes monophylétiques. Telle est l'analyse cladistique : identifier les relations phylogénétiques des espèces à partir de la reconnaissance des seuls états évolués des caractères.

La figure qui montre la répartition de ces états dérivés, l'arbre cladistique, s'appelle le cladogramme. On peut adjoindre aux points de branchement, aux noeuds du cladogramme, la liste des caractères évolués partagés par les groupes frères : l'information est alors claire, nette, précise et testable.

Simple dans son principe, la construction du cladogramme impose toutefois au phylogénéticien de faire une hypothèse a priori , sur le modèle évolutif car le partage des caractères évolués hérités d'un ancêtre commun exclusif Ñ les synapomorphies Ñ ne se reconnaît pas de façon immédiate. On ne peut en effet ignorer le fait qu'un caractère primitif peut évoluer vers un état dérivé et ce, de façon indépendante au sein de différents groupes d'organismes.

Ce phénomène, appelé convergence, est souvent associé à une pression environnementale. Inversement, un caractère évolué peut revenir, en apparence, vers un stade plus primitif : c'est la réversion. Les cas de convergences ou de réversions sont plus fréquents qu'on ne l'imagine ; parmi les exemples bien connus, citons la réversion des dents carnassières de certaines espèces carnivores qui ont évolué de la forme arrondie à la forme cisaillante, puis sont retournées à la forme arrondie (tubercules des dents de l'ours).

Si l'on ne tient pas compte de ce « bruit phylogénétique », de ces homoplasies*, des espèces pourraient se retrouver artificiellement regroupées (ou séparées) sur un cladogramme. Prenons l'exemple de la bipédie. Les oiseaux et les hommes marchent exclusivement sur leurs deux jambes. Cette bipédie partagée a-t-elle été héritée d'une espèce ancestrale commune proche ? Les tests successifs employés en cladistique permettent de répondre par la négative. Quels sont ces tests et quelle est leur robustesse ?

Le premier test est celui de la ressemblance. Dans l'exemple qui nous intéresse, l'analyse cladistique va comparer en détail les traits anatomiques liés à la locomotion bipède chez l'homme et chez l'oiseau. Cette auscultation détaillée montrera qu'en réalité les bipédies des deux groupes sont bien différentes et que la ressemblance finale n'est que superficielle, due à un phénomène de convergence.

Le deuxième test cladistique est fondé sur le principe de parcimonie (ou de congruence). Ce principe vise à réduire le nombre de transformations indépendantes Ñ convergences ou réversions Ñ dans la construction phylogénétique. Si l'on fait l'hypothèse que l'homme et l'oiseau sont proches parents, alors il convient d'étendre l'analyse à d'autres caractères et à d'autres espèces afin de multiplier les possibilités de corroboration ou de réfutation de cette hypothèse. Comparons l'homme aux autres mammifères (notamment les primates) : on trouve un nombre important de caractères évolués partagés par tous les membres de ce groupe. Maintenir, dans ce cas, l'hypothèse de proche parenté de l'homme et des oiseaux impliquerait quantité d'apparitions fortuites (homoplasies) de caractères évolués présents chez tous les mammifères et chez l'homme. L'approche cladistique n'autorise pas ce type de hasard : c'est au contraire la bipédie de l'homme et des oiseaux qui est une homoplasie. Là encore il s'agira pour le cladiste d'une convergence.

La parcimonie est l'hypothèse à la base de l'analyse cladistique, le cladogramme étant l'arbre le plus « court », celui qui contient le plus petit nombre possible de transformations indépendantes, de pas évolutifs. Fondé sur ce principe d'économie, le procédé correspond à une démarche hypothético- déductive et le cladogramme peut être testé et réfuté(10,11).

Le principe de parcimonie tel que nous venons de le définir ne pourrait être invoqué en toute rigueur que si l'on étudiait la totalité des caractères des groupes dont on souhaite connaître la généalogie. Ceci n'est bien entendu pas réaliste et un cladogramme n'est jamais que l'expression de données prises parmi d'autres. Mais, dans les cas courants, les problèmes impliquant un grand nombre de caractères ont pu être résolus grâce aux progrès de l'informatique. En revanche, qu'on le veuille ou non, on ne peut pas calculer un cladogramme sur une infinité d'espèces.

On ne s'étonnera pas que l'un des pionniers en matière de logiciels d'analyse cladistique, l'Américain James S. Farris, soit aussi théoricien du principe de parcimonie en phylogénétique. Des algorithmes appropriés permettent de mener des analyses de parcimonie exactes (en morphologie comme en biologie moléculaire), conduisant à la construction de cladogrammes pour lesquels le taux relatif d'homologie et d'homoplasie peut être quantifié et où les traits homologues et homoplastiques sont localisés. Mais, là encore, il y a des limites au calcul et l'on se restreint en général à des matrices de dix à trente espèces. La recherche de l'arbre le plus court est en effet un problème mathématique complexe pour lequel il n'est pratiquement pas possible de trouver une solution exacte dans un temps de calcul raisonnable lorsque la matrice de données a une taille importante. C'est ce que les informaticiens appellent un problème « N-P complet »(12) : la relation entre le temps de calcul et le nombre d'objets étudiés (par exemple, le nombre d'espèces) est exponentielle : l'étude de dix espèces nécessite l'analyse de 34 459 425 arbres, celle de vingt espèces demande l'analyse de 8.1021 arbres ! Autrement dit, le cladogramme des espèces actuelles (deux millions répertoriées) ou même celui des espèces de mammifères vivants (4 000 espèces environ) n'est pas calculable, même si le plus gros des ordinateurs avait à sa disposition pour le calculer l'âge que l'on prête à l'Univers, environ quinze milliards d'années ! On est alors conduit à réduire le nombre de taxons* et à suivre une énumération implicite (les Anglo-Saxons utilisent le terme de « branch and bound » ). Cette procédure évite d'examiner un par un tous les arbres possibles et garantit la découverte de la solution optimale, exacte, l'arbre le plus court. Mais elle limite le nombre de taxons à 20-30. Cette difficulté de calcul explique en partie pourquoi de nombreux spécialistes d'arbres ont plutôt recours aux algorithmes de ressemblance globale (méthode phénétique), qui ne cherchent pas à identifier homologies et homoplasies mais calculent des indices de ressemblance selon des procédures qui permettent de comparer plusieurs dizaines, voire plusieurs centaines de taxons. Que faire si l'on veut persister dans l'approche cladistique au-delà de 30 taxons ?

On peut recourir aux procédures heuristiques qui consistent à n'examiner qu'une partie des arbres possibles de façon suffisamment arbitraire avec un balayage statistiquement significatif afin que l'on ait confiance dans le résultat. Dans ce type d'opération, le temps de calcul est raisonnable mais on n'est pas absolument certain d'avoir trouvé la solution exacte, l'arbre le plus court, ni certain qu'il n'en existe pas d'autres, tout aussi courts mais de topologies différentes. Néanmoins, il faut savoir que les algorithmes heuristiques sont très efficaces et assez fiables : testés sur un nombre de taxons raisonnable, ils ont toujours donné la même solution que l'algorithme exact ! Comme toute méthode dont l'objectif est la modélisation d'un processus naturel, ici l'évolution des espèces, le cladisme est construit sur des hypothèses réductrices et se trouve donc exposé à toutes sortes de critiques.

L'argument le plus souvent opposé à l'analyse cladistique réside dans le principe même de parcimonie qui vise à réduire les hypothèses de non-descendance, les fameuses homoplasies. Comme l'a souligné le généticien et statisticien américain Joe Felsenstein(13), il est possible de concevoir des situations où la parcimonie ne donne pas le bon arbre, de construire des modèles qui immanqua-blement mettront en défaut l'analyse cladistique (fig. 2). La nature, après tout, suit des voies qui peuvent très bien nous échapper. Faut-il pour autant penser, comme le prétend Luigi-Luca Cavalli-Sforza, que l'approche de parcimonie est faible parce qu'elle ne « contient pas d'hypothèses scientifiques testables » ?

Il est clair qu'en biologie moléculaire le processus évolutif qui comprend, entre autres, des substitutions de nucléotides plus ou moins rapides et plus ou moins enclines aux homoplasies, est responsable d'un bruit naturel qui peut fausser complètement la reconstruction phylogénétique. Sur cette constatation, on peut néanmoins faire deux remarques qui nous permettent d'être plus optimiste que ne l'est Cavalli-Sforza.

La première remarque concerne la grande souplesse de cette méthode : l'analyse cladistique est transparente, ouverte à la critique (l'informatisation a amplifié cette caractéristique) et peu restrictive. Trois points essentiels la distinguent des autres types d'analyse :

Tout d'abord, en biologie moléculaire, là où d'autres méthodes plus rigides Ñ comme les méthodes phénétiques dites UPGMA et NJ Ñ ignorent les vraies règles du jeu de l'évolution, c'est-à-dire l'identification des homologies et des homoplasies, l'analyse cladistique le fait de façon explicite. Comme nous l'avons souligné précédemment, la reconnaissance des homoplasies (convergences et réversions) et leur limitation sont à la base de la cladistique.

Ensuite, contrairement à certaines méthodes phénétiques, l'analyse cladistique n'est pas liée au modèle de l'horloge moléculaire Ñ restrictive et peu réaliste Ñ selon laquelle l'évolution (par extension en biologie moléculaire, les modifications des séquences de nucléotides*) se ferait à la même vitesse dans les différentes branches de l'arbre. Sur un cladogramme, les branches n'ont donc pas nécessairement la même longueur (voir l'encadré « Exercice de construction phylogénétique »).

Enfin, face à cette question du taux d'évolution d'un site nucléotidique* ou des fréquences des différents types de substitutions, l'analyse cladistique permet d'apprécier l'erreur par rapport à ce processus évolutif réel, de la corriger par des pondérations qui tiennent compte des fréquences différentes de transfor-mation(14,15). La critique est aussi possible en appliquant des tests de robustesse d'arbres exprimés par différents indices. Jusqu'à une dizaine d'espèces (ou groupes d'espèces), l'usage d'algorithmes exacts permet également de connaître tous les arbres, de savoir quel est leur coût en nombre de pas évolutifs, et donc, éventuellement, de ne pas restreindre les commentaires au seul arbre le plus court. Toutes ces possibilités échappent aux autres méthodes (phénétiques) qui, par nature, ne donnent qu'un seul résultat, un seul arbre.

Une autre raison d'être optimiste et de préférer les procédures cladistiques aux autres méthodes est peut-être plus anecdotique : une expérience de phylogénie contrôlée a été menée en laboratoire sur une souche de virus parasite et a donné de bons résultats(16,17). Dans cette expérience, huit descendants de la souche ancestrale ont en effet été séquencés. L'analyse de parcimonie a retrouvé la vraie phylogénie, l'arbre reflétant les vraies parentés (sur 135 135 arbres possibles !), en identifiant près de 98 % des synapomorphies. L'approche expérimentale est donc possible et mérite d'être poursuivie car elle seule permet de tester les différentes méthodes de construction phylogénétiques sur des phylogénies réelles infiniment plus complexes que celles envisagées dans les simulations par ordinateur.

Le cladisme permet donc de modéliser l'évolution en prenant en compte certaines de ses caractéristiques, de raisonner sur des modèles évolutionnistes a priori , et de discuter en termes de robustesse et de fiabilité la solution obtenue, c'est-à-dire l'arbre qui montre les relations de parenté entre espèces.

Grâce à l'informatisation des procédures, la construction des arbres n'est plus une science d'auteur. Il reste qu'en amont de l'analyse l'élaboration de la matrice de données est une étape qui sollicite toute la science du spécialiste, qu'il s'agisse des caractères anatomiques qui doivent être bien fixés et spécifiés par le morphologiste, ou bien de l'alignement des séquences, qui doit être particulièrement bien peaufiné par le biologiste moléculaire. Organisation des données, contrôle et test de la solution : l'approche cladistique suit donc une démarche scientifique standard(18).

Il reste, bien sûr, des progrès à accomplir, notamment dans les procédures automatiques de pondérations(19), ainsi que dans les tests de solidité des arbres. Par ailleurs, les progrès de puissance de calcul devraient permettre d'augmenter sensiblement les tailles des matrices et le nombre d'espèces à analyser. Les véritables limites sont des limites d'application : la méthode ne s'appuie encore que sur des caractères discontinus (codés en 0 et en 1) et ne traite pas véritablement le polymorphisme (des pourcentages de 0 et de 1 dans un même taxon), c'est-à-dire la composante continue des caractères.

C'est pourquoi cette méthode est largement utilisée en systématique supra-spécifique et non au niveau des filiations de populations où les caractères étudiés, comme les variations des fréquences génétiques, sont continus et sont difficiles à traiter en termes d'événements évolutifs. Actuellement, des essais sont en cours pour tenter de coder de façon discontinue de telles variations associées en particulier à l'histoire des populations humaines(III).

Le problème des vitesses d'évolution reste aussi ouvert : plusieurs études récentes en biologie moléculaire ont montré que la saturation des données, due à des vitesses d'évolution très inégales, empêchait de construire des arbres fiables (voir l'encadré « Les rongeurs forment-ils un groupe monophylétique ? »).

Des simulations numériques très efficaces permettent néanmoins de localiser les zones de performances de la méthode en fonction des différents processus évolutifs (voir l'encadré « Evaluer les méthodes phylogénétiques »).

D'autres méthodes se développeront sans doute en biologie moléculaire, comme celle du « maximum de vraisemblance(20) ». Cette technique, ni cladiste ni phénétique, mais probabiliste, consiste à rechercher l'arbre le plus vraisemblable compte tenu d'un modèle évolutif donné.

La restriction actuelle de son emploi réside dans son coût en temps de calcul, et, de façon liée, à sa limitation quant au nombre d'espèces étudiables simultanément.

Dans les années 1960, la classification était considérée comme une activité quelque peu démodée, utilisée essentiellement par les systématiciens pour « s'y reconnaître ». Avec l'arrivée des procédures cladistiques elle s'est offert un but nouveau : tenter d'exprimer la phylo-génie, mais une phylogénie désormais testable et réfutable, construite au moyen de méthodes explicites. Plus récemment, l'approche cladistique du vivant est devenue une base de recherche pour certaines études éloignées de la classi-fication comme la biogéographie, dont l'ambition première est d'établir les liens causaux entre l'histoire de la vie et l'histoire géologique, mais aussi comme l'écologie, l'éthologie, et même la gestion des espèces et des biotopes menacés(21). Une réunion scientifique qui s'est tenue récemment au Muséum national d'histoire naturelle à Paris a montré la vitalité de la recherche phylogénétique vis-à-vis de ces disciplines jusqu'alors relativement éloignées de la cladistique(22). Plus de cinquante ans après l'édification de la théorie synthétique de l'évolution, le cladogramme va-t-il sceller une nouvelle alliance de l'histoire naturelle, de la molécule à la biosphère ?


Pascal Tassy


P. Tassy, L' A rbre à remonter le temps , Ch. Bourgois, Paris, 1991.

P.L Forey, C.J. Humphries, I.J. Kitching, R.W. Scotland, D.J. Siebert et D.M. Williams, Cladistics : a practical course in systematics , Clarendon press, Oxford, 1992.

P. Darlu et P. Tassy, La R econstruction phylogénétique : concepts et méthodes , Masson, Paris, 1993.

R.W. Scotland, D.J. Siebert et D.M. Williams (eds), Models in phylogeny reconstruction , Clarendon Press, Oxford, 1994.

SPECIAL : L'HISTOIRE DE LA VIE MÉTHODOLOGIE


POWERED BY RATIO.MEDIA™ : A ROSEBUD TECHNOLOGIES SOLUTION
/ DESIGN : ARTABELSTUDIO