|
|
01/03/1997 La
Recherche PASCAL
TASSY est professeur au Muséum national d'histoire
naturelle à Paris.
Exercice de construction phylogénétique
Les
rongeurs forment-ils un groupe monophylétique ?
Évaluer
les méthodes phylogénétiques
Figure
1.
Figure
2.
*LA CONSTRUCTION
PHYLOGÉNÉTIQUE a pour but de retracer l'ascendance des
êtres vivants. Le concept de phylogénie a été introduit en
1866 par le naturaliste allemand Ernst Haeckel. Aux premiers
temps de l'élaboration des théories de l'évolution, on parlait
de généalogie. *UN GROUPE ANCESTRAL
rassemble des espèces partageant un même niveau évolutif
primitif. *LA MÉTHODE PHÉNÉTIQUE (du
grec phaino : paraître) classifie les espèces sur la
base de leur ressemblance globale. Celle-ci est exprimée au
moyen de différents indices mathématiques. *LES HOMOPLASIES sont les ressemblances dues à
des convergences ou à des réversions. *LE TAXON est un groupe d'organismes reconnu
en tant qu'unité formelle à quelque niveau de la
classification que se soit. *Il existe trois types de
MODIFICATIONS DES SÉQUENCES DE
NUCLÉOTIDES : une perte de nucléotide (délétion), un
remplacement d'un nucléotide par un autre (substitution) et
une addition de nucléotide (insertion). *En biologie
moléculaire, LE TAUX D'ÉVOLUTION D'UN SITE
NUCLÉOTIDIQUE est le taux moyen auquel des modifications
se produisent sur ce site.
(1) G.G. Simpson,
Principles of animal taxonomy, Columbia University
Press, 1961. (2) E. Mayr, Principles of systematic
zoology, McGraw-Hill, New York, 1969. (3) C.B.
Stewart , Nature, 361, 603, 1993. (4) A.A.
Sidow, Nature, 367, 26, 1994. (5) C.B. Stewart ,
Nature, 367, 26, 1994. (6) L-L. Cavalli-Sforza, P.
Menozzi et A. Piazza , The history and geography of human
genes, Princeton University Press, 1994. (7) W.
Hennig, Grundzüge einer Theorie der phylogenetischen
Systematik , Deutcher Zentralverlag, Berlin, 1950. (8)
W. Hennig, Phylogenetic systematics , University of
Illinois Press, Urbana, 1966. (9) P. Forey et P. Janvier,
Amer. Sci., 82 , 554, 1994. (10) J.S.
Farris, in « Advances in cladistics 2 » , N.I Platnick
et V. A. Funk (eds.), Columbia University Press, 7-36, 1983.
(11) G. Nelson, in « Systématique et phylogénie »,
P. Tassy et H. Lelièvre (coords.), Biosystema 11 , 528,
1994. (12) M. d'Udekem-Gevers, Biosystema, 4 , 28,
1990. (13) J. Felsenstein, Syst. Zool., 27, 401,
1978. (14) J.P. Huelsenbeck et D.M. Hillis , Syst.
Biol., 42, 247, 1994. (15) J.P Huelsenbeck, Syst.
Biol., 44, 17, 1995. (16) D.M. Hillis et al.,
Science, 255, 589, 1992. (17) D.M. Hillis, J.P.
Huelsenbeck et C.W. Cunningham, Science, 264, 671,
1994. (18) P. Tassy, Vie et milieu , 46 ,
115, 1996. (19) D. Penny, M.D. Hendy et M.A. Steel,
Trends Ecol.Evol. , 7 , 73, 1994. (20) J.
Felsenstein , Biol. J. Linn. Soc., 16 , 183, 1981.
(21) D.R. Brookes et D.A. McLennan, Phylogeny, ecology
and behaviour, The University of Chicago Press, 1991.
(22) « Tests phylogénétiques de scénarios évolutifs »,
E.P. 90, CNRS, 3-4 juin 1996, MNHN, Paris. La Recherche a publié :
(I)Philippe Janvier et al., « Le cladisme »,
décembre 1980. (II)Pierre Thuiller,« Le scandale du
British Museum », septembre 1981. (III)Véronique Barriel,«
Mythes et réalités de l'approche génétique », juin 1995.
| |
|
|
> DOSSIER
>
MÉTHODOLOGIE
Comment reconstituer la généalogie
des organismes vivants Un arbre pas comme les autres
Dans les
années 1970, l'arrivée en force du cladisme a bousculé les
vieilles idées en matière de construction phylogénétique. Pour
les cladistes, seul le partage des caractères évolués entre
espèces permet de retracer l'histoire du développement des
êtres vivants. Leurs modèles impliquent une généalogie
économique : l'arbre des cladistes est en effet l'arbre le
plus court, celui qui comporte le plus petit nombre de pas
évolutifs. Contrairement à ce que prétendent ses détracteurs,
l'efficacité de cette théorie est désormais testable.
Les paléontologues et les
biologistes de ma génération Ñ qui ont fréquenté les
amphithéâtres universitaires dans les années 1960 Ñ ont appris
l'histoire de l'évolution des espèces, l'origine des groupes,
l'acquisition des grandes structures, au travers d'arbres
généalogiques. Les idées d'alors étaient souvent formulées en
termes d'arguments d'autorité autour desquels se créait, ou
non, un consensus. Aussi telle hypothèse était-elle préférée à
une autre, tout simplement en raison de l'autorité de son
auteur, ou Ñ ce qui revient au même Ñ des écoles de pensée.
Quoique rationnelle et savante, la construction des arbres
généalogiques, parce qu'extrêmement subjective, fut l'objet de
critiques sévè-res. De fait, l'arbre généalogique, fruit d'une
opinion, fut souvent mis en opposition avec les productions
des « vraies sciences » hypothético-déductives.
Aujourd'hui, en marge des théories sur l'évolution, la
construction phylo-génétique* est un objet de recherche, une
discipline à part entière née il y a une vingtaine d'années
avec l'arrivée de nouveaux modèles sur l'évolution. Comment
est-on passé des arguments d'autorité à la science des arbres
phylogénétiques ?
Nous savons que les êtres vivants ont évolué depuis
plus de trois milliards d'années. Pendant tout ce temps ils se
sont transformés et se sont diversifiés jusqu'à donner les
deux millions d'espèces actuelles recensées (il en existerait
de trois à dix fois plus à identifier) auxquelles s'ajoutent
les espèces fossiles. On peut représenter les parentés entre
tous ces êtres par une succession de branchements
dichotomiques Ñ la séquence des diversifications Ñ qui se
déploient dans la dimension du temps géologique. Cette
illustration de l'histoire Ñ l'arbre phylogénétique Ñ est
l'image emblématique de la science évolutionniste.
Bien que cette image soit connue et, somme toute
familière, la phylogénie reste un concept subtil. Les parentés
entre espèces et groupes d'espèces ne nous sont pas données :
c'est au phylogénéticien de construire son arbre à l'aide de
l'analyse comparative des organes des êtres vivants et des
traces laissées par les fossiles. Cette opération de
construction, quasi bicentenaire depuis la publication par
Jean-Baptiste Lamarck en 1809 d'un schéma fort simple
illustrant les parentés entre les êtres vivants, a toujours
suscité des controverses.
L'essentiel du débat repose sur les règles du jeu de
construction. Dans les années 1950-1960, la construction des
arbres phylogénétiques s'est notamment organisée autour d'un
principe particulièrement bien exposé par le paléontologue
George Gaylord Simpson et le zoologiste Ernst Mayr. Selon ces
derniers, la recherche de l'ancêtre doit guider toute
reconstruction phylogénétique, sachant que toute espèce
fossile est potentiellement l'ancêtre d'une autre, voire d'une
espèce actuelle. On a ainsi regroupé des espèces en groupes
ancestraux* sur la base du partage de caractères primitifs,
sans examiner plus à fond leurs relations de parentés
précises(1,2).
Au début des années 1970, une polémique agita la
communauté scientifique lorsqu'une nouvelle méthode, appelée
cladisme (du grec klados : rameau)(I), prétendit, d'une
part, supplanter la méthode Simpson-Mayr, et d'autre part
servir de base à tout discours sur la diversité du vivant, sur
les notions de classification et d'évolution, y compris sur
les pratiques muséologiques dans les muséums d'histoire
naturelle(II). Cette méthode a pour but d'apparenter deux
espèces ou grou-pes d'espèces (appelés groupes frères) à
partir de la reconnaissance des états évolués des caractères,
hérités de l'espèce ancestrale immédiate (la plus proche) et
non à partir des états primitifs, hérités d'une espèce
ancestrale plus lointaine.
Aujourd'hui, le cladisme, dont il n'était pas difficile
d'annoncer il y a quinze ans le succès inéluctable, reste
pourtant sujet à controverse. On a pu lire, il y a peu, par
exemple, un échange vif sur les mérites respectifs des
méthodes concurrentes dites cladistique et phénétique* dans
les colonnes de la revue britannique Nature (3,4,5)
. Dans le livre du généticien italo-américain Luigi-Luca
Cavalli-Sforza sur l'histoire des populations humaines, promis
à devenir un classique(6), on trouve aussi une critique acerbe
du cladisme qui, selon cet auteur, « ne suit pas la
procédure scientifique standard qui est de construire un
modèle pouvant être testé empiriquement, et rejeté ou modifié
si nécessaire » .
Qu'est ce que le cladisme et en quoi cette méthode
est-elle, selon ses promoteurs et défenseurs, un nouvel outil
pour l'analyse et la compréhension de l'évolution et de la
diversité du vivant ?
Le cladisme est né dans les années 1950 des réflexions
d'un entomologiste allemand, Willi Hennig, auteur de deux
ouvrages sur les principes de construc-tion
phylogénétique(7,8). Selon ce grand connaisseur de mouches et
moustiques, mais aussi exceptionnel esprit de logique
analytique, la question des parentés entre les espèces est
restée longtemps obscurcie par ce que l'on pourrait appeler la
pensée dichotomique : l'opposition entre ce qui est et ce qui
n'est pas, entre ce qui a et ce qui n'a pas. En avoir ou pas,
telle est la question que le scientifique s'est posée en
tentant d'organiser la diversité biologique, autrement dit
depuis Aristote. Cette façon d'observer la nature a abouti, au
XXe siècle, aux constructions d'arbres généalogiques où les
espèces sont regroupées sur la base du partage (ou du non-
partage) des caractères, sans distinguer leur état
d'évolution. Ainsi, la méthode phylogénétique dite phénétique,
utilisée par de nombreux biologistes moléculaires, est fondée
sur l'analyse des distances entre espèces, distances calculées
à partir de leur ressemblance globale.
Certes, il y a des êtres qui sont pourvus de sang et
d'autres qui en sont dépourvus, des êtres qui ont des
vertèbres et d'autres qui n'en ont pas, des êtres munis de
mâchoires, les « gnathosto-mes », et d'autres qui en sont
privés, les « agnathes ». Ces derniers ont-ils pour autant une
dimension phylogénétique au sens de Hennig ? Ont-ils
véritablement le même degré de parenté, la même équidistance
vis-à-vis des autres organismes au regard du caractère «
absence de mâchoire » ?
La théorie de l'évolution et la systématique (l'étude
de la diversité biologique) nous ont appris qu'en matière de
biologie tout se transforme, à commencer par les caractères.
Revenons au cas des gnathostomes : la présence de mâchoires
(c'est-à-dire une transformation du squelette liée aux arcs
branchiaux du crâne) est un caractère évolué partagé par tous
les membres du groupe Ñ les traditionnels poissons,
amphibiens, reptiles, oiseaux et mammifères. On peut donc
supposer que ces cinq classes d'animaux ont une origine
phylogénétique commune (un ancêtre commun exclusif) et
qu'elles forment en cela un groupe « monophylétique »,
identifié par au moins un caractère évolué commun Ñ ici, la
présence de mâchoires. Mais un organisme, quel qu'il soit,
n'est jamais entièrement primitif ou entièrement évolué et les
caractères appartenant à différents organes peuvent montrer
des niveaux d'évolution différents.
Ainsi, lorsqu'on analyse certains caractères d'une
lamproie, ce vertébré sans mâchoire (groupe des agnathes)
réputé pour son extrême habileté à se coller sur ses proies
pour leur sucer le sang, on constate une grande disparité
entre d'une part, ses arcs branchiaux restés à l'état primitif
et, d'autre part, son cerveau et son système sensoriel, qui
présentent en effet des transformations observées par ailleurs
chez tous les gnathostomes(9). Sur la base de ces
observations, le paléontologue français Philippe Janvier
n'hésita pas, à la fin des années 1970, à ranger les lamproies
et certains agnathes fossiles de l'ère Primaire (notamment les
ostéostracés) en compagnie des gnathostomes dans un
supergroupe monophylétique appelé « myopterygia ». D'où l'idée
que notre lamproie serait plus proche d'un éléphant que d'une
myxine, ce petit vertébré marin primitif Ñ très apprécié des
restaurateurs japonais Ñ qui vit à faible profondeur dans les
fonds vaseux (fig.
1) ! Selon cette thèse, l'ensemble formé par les
lamproies et les myxines ne doit pas être considéré comme un
groupe monophylétique puisque ses membres ne partagent pas de
caractère évolué hérité d'un ancêtre exclusif et ne
représentent pas la totalité de la descendance de cet ancêtre.
On parle alors de groupe « paraphylétique ».
Cet exemple a valeur universelle. Les groupes
paraphylétiques fourmillent dans la littérature biologique et
paléontologique, à tous les niveaux de la classification,
notamment au niveau des espèces et des genres, et sont une
source d'erreurs majeures pour notre compréhension de
l'histoire de la vie.
Le partage d'un caractère resté à l'état primitif n'est
pas un signe de proche parenté, tandis qu'au contraire le
partage de l'état transformé Ñ évolué Ñ d'un caractère permet
d'identifier les parentés et, par voie de conséquence, les
groupes monophylétiques. Telle est l'analyse cladistique :
identifier les relations phylogénétiques des espèces à partir
de la reconnaissance des seuls états évolués des caractères.
La figure qui montre la répartition de ces états
dérivés, l'arbre cladistique, s'appelle le cladogramme. On
peut adjoindre aux points de branchement, aux noeuds du
cladogramme, la liste des caractères évolués partagés par les
groupes frères : l'information est alors claire, nette,
précise et testable.
Simple dans son principe, la construction du
cladogramme impose toutefois au phylogénéticien de faire une
hypothèse a priori , sur le modèle évolutif car
le partage des caractères évolués hérités d'un ancêtre commun
exclusif Ñ les synapomorphies Ñ ne se reconnaît pas de façon
immédiate. On ne peut en effet ignorer le fait qu'un caractère
primitif peut évoluer vers un état dérivé et ce, de façon
indépendante au sein de différents groupes d'organismes.
Ce phénomène, appelé convergence, est souvent associé à
une pression environnementale. Inversement, un caractère
évolué peut revenir, en apparence, vers un stade plus primitif
: c'est la réversion. Les cas de convergences ou de réversions
sont plus fréquents qu'on ne l'imagine ; parmi les exemples
bien connus, citons la réversion des dents carnassières de
certaines espèces carnivores qui ont évolué de la forme
arrondie à la forme cisaillante, puis sont retournées à la
forme arrondie (tubercules des dents de l'ours).
Si l'on ne tient pas compte de ce « bruit
phylogénétique », de ces homoplasies*,
des espèces pourraient se retrouver artificiellement
regroupées (ou séparées) sur un cladogramme. Prenons l'exemple
de la bipédie. Les oiseaux et les hommes marchent
exclusivement sur leurs deux jambes. Cette bipédie partagée
a-t-elle été héritée d'une espèce ancestrale commune proche ?
Les tests successifs employés en cladistique permettent de
répondre par la négative. Quels sont ces tests et quelle est
leur robustesse ?
Le premier test est celui de la ressemblance. Dans
l'exemple qui nous intéresse, l'analyse cladistique va
comparer en détail les traits anatomiques liés à la locomotion
bipède chez l'homme et chez l'oiseau. Cette auscultation
détaillée montrera qu'en réalité les bipédies des deux groupes
sont bien différentes et que la ressemblance finale n'est que
superficielle, due à un phénomène de convergence.
Le deuxième test cladistique est fondé sur le principe
de parcimonie (ou de congruence). Ce principe vise à réduire
le nombre de transformations indépendantes Ñ convergences ou
réversions Ñ dans la construction phylogénétique. Si l'on fait
l'hypothèse que l'homme et l'oiseau sont proches parents,
alors il convient d'étendre l'analyse à d'autres caractères et
à d'autres espèces afin de multiplier les possibilités de
corroboration ou de réfutation de cette hypothèse. Comparons
l'homme aux autres mammifères (notamment les primates) : on
trouve un nombre important de caractères évolués partagés par
tous les membres de ce groupe. Maintenir, dans ce cas,
l'hypothèse de proche parenté de l'homme et des oiseaux
impliquerait quantité d'apparitions fortuites (homoplasies) de
caractères évolués présents chez tous les mammifères et chez
l'homme. L'approche cladistique n'autorise pas ce type de
hasard : c'est au contraire la bipédie de l'homme et des
oiseaux qui est une homoplasie. Là encore il s'agira pour le
cladiste d'une convergence.
La parcimonie est l'hypothèse à la base de l'analyse
cladistique, le cladogramme étant l'arbre le plus « court »,
celui qui contient le plus petit nombre possible de
transformations indépendantes, de pas évolutifs. Fondé sur ce
principe d'économie, le procédé correspond à une démarche
hypothético- déductive et le cladogramme peut être testé et
réfuté(10,11).
Le principe de parcimonie tel que nous venons de le
définir ne pourrait être invoqué en toute rigueur que si l'on
étudiait la totalité des caractères des groupes dont on
souhaite connaître la généalogie. Ceci n'est bien entendu pas
réaliste et un cladogramme n'est jamais que l'expression de
données prises parmi d'autres. Mais, dans les cas courants,
les problèmes impliquant un grand nombre de caractères ont pu
être résolus grâce aux progrès de l'informatique. En revanche,
qu'on le veuille ou non, on ne peut pas calculer un
cladogramme sur une infinité d'espèces.
On ne s'étonnera pas que l'un des pionniers en matière
de logiciels d'analyse cladistique, l'Américain James S.
Farris, soit aussi théoricien du principe de parcimonie en
phylogénétique. Des algorithmes appropriés permettent de mener
des analyses de parcimonie exactes (en morphologie comme en
biologie moléculaire), conduisant à la construction de
cladogrammes pour lesquels le taux relatif d'homologie et
d'homoplasie peut être quantifié et où les traits homologues
et homoplastiques sont localisés. Mais, là encore, il y a des
limites au calcul et l'on se restreint en général à des
matrices de dix à trente espèces. La recherche de l'arbre le
plus court est en effet un problème mathématique complexe pour
lequel il n'est pratiquement pas possible de trouver une
solution exacte dans un temps de calcul raisonnable lorsque la
matrice de données a une taille importante. C'est ce que les
informaticiens appellent un problème « N-P complet »(12) : la
relation entre le temps de calcul et le nombre d'objets
étudiés (par exemple, le nombre d'espèces) est exponentielle :
l'étude de dix espèces nécessite l'analyse de 34 459 425
arbres, celle de vingt espèces demande l'analyse de 8.1021
arbres ! Autrement dit, le cladogramme des espèces actuelles
(deux millions répertoriées) ou même celui des espèces de
mammifères vivants (4 000 espèces environ) n'est pas
calculable, même si le plus gros des ordinateurs avait à sa
disposition pour le calculer l'âge que l'on prête à l'Univers,
environ quinze milliards d'années ! On est alors conduit à
réduire le nombre de taxons*
et à suivre une énumération implicite (les Anglo-Saxons
utilisent le terme de « branch and bound » ). Cette
procédure évite d'examiner un par un tous les arbres possibles
et garantit la découverte de la solution optimale, exacte,
l'arbre le plus court. Mais elle limite le nombre de taxons à
20-30. Cette difficulté de calcul explique en partie pourquoi
de nombreux spécialistes d'arbres ont plutôt recours aux
algorithmes de ressemblance globale (méthode phénétique), qui
ne cherchent pas à identifier homologies et homoplasies mais
calculent des indices de ressemblance selon des procédures qui
permettent de comparer plusieurs dizaines, voire plusieurs
centaines de taxons. Que faire si l'on veut persister dans
l'approche cladistique au-delà de 30 taxons ?
On peut recourir aux procédures heuristiques qui
consistent à n'examiner qu'une partie des arbres possibles de
façon suffisamment arbitraire avec un balayage statistiquement
significatif afin que l'on ait confiance dans le résultat.
Dans ce type d'opération, le temps de calcul est raisonnable
mais on n'est pas absolument certain d'avoir trouvé la
solution exacte, l'arbre le plus court, ni certain qu'il n'en
existe pas d'autres, tout aussi courts mais de topologies
différentes. Néanmoins, il faut savoir que les algorithmes
heuristiques sont très efficaces et assez fiables : testés sur
un nombre de taxons raisonnable, ils ont toujours donné la
même solution que l'algorithme exact ! Comme toute méthode
dont l'objectif est la modélisation d'un processus naturel,
ici l'évolution des espèces, le cladisme est construit sur des
hypothèses réductrices et se trouve donc exposé à toutes
sortes de critiques.
L'argument le plus souvent opposé à l'analyse
cladistique réside dans le principe même de parcimonie qui
vise à réduire les hypothèses de non-descendance, les fameuses
homoplasies. Comme l'a souligné le généticien et statisticien
américain Joe Felsenstein(13), il est possible de concevoir
des situations où la parcimonie ne donne pas le bon arbre, de
construire des modèles qui immanqua-blement mettront en défaut
l'analyse cladistique (fig.
2). La nature, après tout, suit des voies qui peuvent
très bien nous échapper. Faut-il pour autant penser, comme le
prétend Luigi-Luca Cavalli-Sforza, que l'approche de
parcimonie est faible parce qu'elle ne « contient
pas d'hypothèses scientifiques testables » ?
Il est clair qu'en biologie moléculaire le processus
évolutif qui comprend, entre autres, des substitutions de
nucléotides plus ou moins rapides et plus ou moins enclines
aux homoplasies, est responsable d'un bruit naturel qui peut
fausser complètement la reconstruction phylogénétique. Sur
cette constatation, on peut néanmoins faire deux remarques qui
nous permettent d'être plus optimiste que ne l'est
Cavalli-Sforza.
La première remarque concerne la grande souplesse de
cette méthode : l'analyse cladistique est transparente,
ouverte à la critique (l'informatisation a amplifié cette
caractéristique) et peu restrictive. Trois points essentiels
la distinguent des autres types d'analyse :
Tout d'abord, en biologie moléculaire, là où d'autres
méthodes plus rigides Ñ comme les méthodes phénétiques dites
UPGMA et NJ Ñ ignorent les vraies règles du jeu de
l'évolution, c'est-à-dire l'identification des homologies et
des homoplasies, l'analyse cladistique le fait de façon
explicite. Comme nous l'avons souligné précédemment, la
reconnaissance des homoplasies (convergences et réversions) et
leur limitation sont à la base de la cladistique.
Ensuite, contrairement à certaines méthodes
phénétiques, l'analyse cladistique n'est pas liée au modèle de
l'horloge moléculaire Ñ restrictive et peu réaliste Ñ selon
laquelle l'évolution (par extension en biologie moléculaire,
les modifications des séquences de nucléotides*) se ferait à
la même vitesse dans les différentes branches de l'arbre. Sur
un cladogramme, les branches n'ont donc pas nécessairement la
même longueur (voir l'encadré « Exercice de construction
phylogénétique »).
Enfin, face à cette question du taux d'évolution d'un
site nucléotidique* ou des fréquences des différents types de
substitutions, l'analyse cladistique permet d'apprécier
l'erreur par rapport à ce processus évolutif réel, de la
corriger par des pondérations qui tiennent compte des
fréquences différentes de transfor-mation(14,15). La critique
est aussi possible en appliquant des tests de robustesse
d'arbres exprimés par différents indices. Jusqu'à une dizaine
d'espèces (ou groupes d'espèces), l'usage d'algorithmes exacts
permet également de connaître tous les arbres, de savoir quel
est leur coût en nombre de pas évolutifs, et donc,
éventuellement, de ne pas restreindre les commentaires au seul
arbre le plus court. Toutes ces possibilités échappent aux
autres méthodes (phénétiques) qui, par nature, ne donnent
qu'un seul résultat, un seul arbre.
Une autre raison d'être optimiste et de préférer les
procédures cladistiques aux autres méthodes est peut-être plus
anecdotique : une expérience de phylogénie contrôlée a été
menée en laboratoire sur une souche de virus parasite et a
donné de bons résultats(16,17). Dans cette expérience, huit
descendants de la souche ancestrale ont en effet été
séquencés. L'analyse de parcimonie a retrouvé la vraie
phylogénie, l'arbre reflétant les vraies parentés (sur 135 135
arbres possibles !), en identifiant près de 98 % des
synapomorphies. L'approche expérimentale est donc possible et
mérite d'être poursuivie car elle seule permet de tester les
différentes méthodes de construction phylogénétiques sur des
phylogénies réelles infiniment plus complexes que celles
envisagées dans les simulations par ordinateur.
Le cladisme permet donc de modéliser l'évolution en
prenant en compte certaines de ses caractéristiques, de
raisonner sur des modèles évolutionnistes a priori , et
de discuter en termes de robustesse et de fiabilité la
solution obtenue, c'est-à-dire l'arbre qui montre les
relations de parenté entre espèces.
Grâce à l'informatisation des procédures, la
construction des arbres n'est plus une science d'auteur. Il
reste qu'en amont de l'analyse l'élaboration de la matrice de
données est une étape qui sollicite toute la science du
spécialiste, qu'il s'agisse des caractères anatomiques qui
doivent être bien fixés et spécifiés par le morphologiste, ou
bien de l'alignement des séquences, qui doit être
particulièrement bien peaufiné par le biologiste moléculaire.
Organisation des données, contrôle et test de la solution :
l'approche cladistique suit donc une démarche scientifique
standard(18).
Il reste, bien sûr, des progrès à accomplir, notamment
dans les procédures automatiques de pondérations(19), ainsi
que dans les tests de solidité des arbres. Par ailleurs, les
progrès de puissance de calcul devraient permettre d'augmenter
sensiblement les tailles des matrices et le nombre d'espèces à
analyser. Les véritables limites sont des limites
d'application : la méthode ne s'appuie encore que sur des
caractères discontinus (codés en 0 et en 1) et ne traite pas
véritablement le polymorphisme (des pourcentages de 0 et de 1
dans un même taxon), c'est-à-dire la composante continue des
caractères.
C'est pourquoi cette méthode est largement utilisée en
systématique supra-spécifique et non au niveau des filiations
de populations où les caractères étudiés, comme les variations
des fréquences génétiques, sont continus et sont difficiles à
traiter en termes d'événements évolutifs. Actuellement, des
essais sont en cours pour tenter de coder de façon discontinue
de telles variations associées en particulier à l'histoire des
populations humaines(III).
Le problème des vitesses d'évolution reste aussi ouvert
: plusieurs études récentes en biologie moléculaire ont montré
que la saturation des données, due à des vitesses d'évolution
très inégales, empêchait de construire des arbres fiables
(voir l'encadré « Les rongeurs forment-ils un groupe
monophylétique ? »).
Des simulations numériques très efficaces permettent
néanmoins de localiser les zones de performances de la méthode
en fonction des différents processus évolutifs (voir l'encadré
« Evaluer les méthodes phylogénétiques »).
D'autres méthodes se développeront sans doute en
biologie moléculaire, comme celle du « maximum de
vraisemblance(20) ». Cette technique, ni cladiste ni
phénétique, mais probabiliste, consiste à rechercher l'arbre
le plus vraisemblable compte tenu d'un modèle évolutif donné.
La restriction actuelle de son emploi réside dans son
coût en temps de calcul, et, de façon liée, à sa limitation
quant au nombre d'espèces étudiables simultanément.
Dans les années 1960, la classification était
considérée comme une activité quelque peu démodée, utilisée
essentiellement par les systématiciens pour « s'y reconnaître
». Avec l'arrivée des procédures cladistiques elle s'est
offert un but nouveau : tenter d'exprimer la phylo-génie, mais
une phylogénie désormais testable et réfutable, construite au
moyen de méthodes explicites. Plus récemment, l'approche
cladistique du vivant est devenue une base de recherche pour
certaines études éloignées de la classi-fication comme la
biogéographie, dont l'ambition première est d'établir les
liens causaux entre l'histoire de la vie et l'histoire
géologique, mais aussi comme l'écologie, l'éthologie, et même
la gestion des espèces et des biotopes menacés(21). Une
réunion scientifique qui s'est tenue récemment au Muséum
national d'histoire naturelle à Paris a montré la vitalité de
la recherche phylogénétique vis-à-vis de ces disciplines
jusqu'alors relativement éloignées de la cladistique(22). Plus
de cinquante ans après l'édification de la théorie synthétique
de l'évolution, le cladogramme va-t-il sceller une nouvelle
alliance de l'histoire naturelle, de la molécule à la
biosphère ? Pascal Tassy
P. Tassy, L' A rbre à remonter le temps ,
Ch. Bourgois, Paris, 1991.
P.L Forey, C.J. Humphries, I.J. Kitching, R.W.
Scotland, D.J. Siebert et D.M. Williams, Cladistics : a
practical course in systematics , Clarendon press, Oxford,
1992.
P. Darlu et P. Tassy, La R econstruction
phylogénétique : concepts et méthodes , Masson, Paris,
1993.
R.W. Scotland, D.J. Siebert et D.M. Williams (eds),
Models in phylogeny reconstruction , Clarendon Press,
Oxford, 1994. SPECIAL : L'HISTOIRE DE LA VIE
MÉTHODOLOGIE
|
|
|