Plant phylogenomics : approaches to make phylogenic inference more reliable

Nikiforova, Svetlana

Correct phylogenetic inference is especially hard on very shallow and deep taxonomic levels. On intraspecific/intrageneric levels, widely used genetic fingerprinting techniques (AFLP,SSR) tend to yield volatile results, partially because bands of equal size on the gel should not necessarily be orthologous, and absence of a band does not necessarily mean absence of a character, as it might be caused by experimental setup (see Kumar et al., 2009). At the same time, at this taxonomic range commonly used phylogenetic markers such as nuclear ITS regions and chloroplast spacers/genes are only of limited help due to lack of informative characters to resolve tree structure, end even medium-size data sets suffer from lack of resolution. This work demonstrates the benefit of introducing cpDNA-based phylogenomic methodology to shallow level taxonomic research. Well-resolved tree structure allowed for the first time to reveal phylogenetic affinities of the maternal line of domesticated apple sorts. Three distinct chloroplast DNA lineages present in apple cultivars diverged before the origin of agriculture. One line, represented by M. x domestica cv. Granny Smith diverged from Asian apple species, and the other two, comprising the majority of apple cultivars analyzed share sister group relationships to different, unrelated accessions of M. sylvestris from southern and south eastern Europe. The most straightforward explanation for this finding is that apple cultivation has started independently in various regions. The advantages of planting apples close to human dwellings were apparent enough, and people from various places started to grow apple trees taken from locations near about. Lack of the domestication bottleneck and clonal population structure in domesticated apples (Cornille et al., 2012) corroborate their polyphyletic origin. An alternative explanation would be substitution of cpDNA in M. x domestica by hybridisation, through pollination of M. sylvestris by pollen of domesticated apple sorts. In contrast to intrageneric/intraspecific studies, on deeper taxonomic levels phylogenomic approach is widely used today. Yet its usefulness is hampered by systematic errors inherent to current methods of phylogeny reconstruction, which assume stationarity, homogeneity and reversibility of the substitution process. These non-phylogenetic signals, violating these assumptions, stem mainly from the subset of the most fast-evolving positions in the data (Rodriguez-Ezpeleta et al., 2007), and can provoke errors in reconstruction of phylogenetic trees. This work provides evidence for further serious concerns regarding poor data-model fit at the fast-evolving, saturated positions in alignments of the chloroplast genes of spermatophytes. At the same time, it provides an analytical framework, which can help to identify and remove such positions, thereby improving the net outcome of phylogeny reconstruction. A novel character-sorting approach based on the criterion (OV), in contrast to gamma rate assignment, parsimonous tree length and compatibility of characters is more realistic proxy of the substitution rate (Goremykin, Nikiforova, Bininda-Emonds, 2010). As such it facilitates studying impact of most variable sites onto the tree topology. Accompanied by the tests estimating model-misspecification, however, it achieves perhaps the most important goal in phylogenetic analysis, namely, provides a basis for understanding the reasons causing conflicting placements of divergent taxa. This procedure strongly expands the range of usability of chloroplast DNA onto deeper taxonomic levels, and uncovers the potential of cpDNA to serve as universal marker of plant evolution. Practically, it provided solid evidence that the placement of Amborella trichopoda at the base of the angiosperm subtree as an LBA artifact. An extremely well-publicized nature of this erroneous branch, even taken alone, emphasizes importance of introducing exploratory phylogenetic analysis, which incorporates testing applicability of methodological assumptions to the data structure, to the deep-level phylogenetic studies in botany. Finding evidence of modelmisspecification affecting placement of Gnetales among non-angiosperm seed plant lineages provides yet another indication that LBA artifacts in the plant part of the Tree of Life might be abundant. Improving data-model fit has allowed to identify sister group relationship between Gnetales and Pinaceae and the composition of the basal-most angiosperm branch, comprising Hydatellaceae, Nymphaeales s.s. and Amborella. The procedures worked out in the course of this study represent a framework to guide phylogenetic research in the future.

Korrekte phylogenetische Rekonstruktion ist besonders auf sehr niedrigen und sehr hohen taxonomischen Ebenen schwer. Die auf intraspezifischen/intragenerischen Ebenen häufig genutzte Technik des genetischen Fingerabdrucks (AFLP, SSR) neigt dazu, zu unsicheren Ergebnissen zu führen, teils, weil Banden gleicher Größe auf dem Gel nicht notwendigerweise ortholog sind; teils, weil die Abwesenheit einer Bande nicht unbedingt auch die Abwesenheit eines Merkmals bedeutet, da erstere auch durch experimentelle Fehler (Kumar et al., 2009) verursacht werden kann. Gleichzeitig bieten phylogenetische Marker, die in diesem taxonomischen Bereich häufig verwendet werden, wie z.B. nukleäre ITS-Regionen und chloroplastidäre Spacer/Gene nur bedingt Hilfe und zwar aufgrund des Mangels an Information für die Baumstrukturauflösung; selbst mittelgroße, aus aneinandergehängten Markern bestehende Datensätze leiden oft unter unzureichender Auflösung. Diese Arbeit demonstriert den Nutzen der Einführung der cpDNA-basierten phylogenomischen Methodologie in phylogenetische Studien auf niedrigem taxonomischen Ebenen. Eine gut aufgelöste Baumstruktur bietet zum ersten Mal die Möglichkeit, die phylogenetische Geschichte der mütterlichen Linie von domestizierten Apfelsorten aufzuklären. Drei verschiedene in Apfelsorten vorhandene cpDNA-Linien haben sich lange vor der Entstehung der Landwirtschaft getrennt. Eine Linie, vertreten in Malus x domestica cv. Granny Smith stammte von asiatischen Apfelsorten ab, und die anderen beiden, die im den Großteil der analysierten Apfelsorten vorhanden sind darstellen, bildeten Schwestergruppen zu Chloroplastengenomen vom M. sylvestris aus Süd- und Südosteuropa. Die einfachste Erklärung für dieses Ergebnis ist, dass der Apfelanbau unabhängig voneinander in verschiedenen Regionen begonnen hat. Die von Menschen erkannten Vorteile der Anpflanzung von Äpfeln in der Nähe menschlicher Siedlungen waren vermutlich ausreichend, sie an verschiedenen Orten zu veranlassen, Apfelbäume, die aus der Nähe stammten, anzubauen. Die Abwesenheit eines Domestizierungsengpasses und die klonale Populationsstruktur bei domestizierten Äpfeln (Cornille et al., 2012) unterstützen die Annahme einer polyphyletischen Herkunft. Im Gegensatz zu intragenetischen /intraspezifischen Studien ist der phylogenomische Ansatz auf hohen taxonomischen Ebenen heute weit verbreitet. Allerdings wird seine Nützlichkeit durch systematische Fehler in den aktuellen Methoden der Phylogenierekonstruktion begrenzt. Diese setzen uniforme Basenzusammensetzung sowie Homogenität und Reversibilität des Substitionsverlaufes voraus. Die sogenannten nichtphylogenetischen Signale, die diese Annahmen verletzen, sind besonders in sich schnell verändernden Positionen in den Daten ausgeprägt (Rodriguez-Ezpeleta et al., 2007) und können zu Fehlern in der Phylogenierekonstruktion führen. Diese Arbeit liefert Evidenz für weitere ernsthafte Bedenken in Bezug auf unzureichende Anpassung der Substitutionsmodelle an die sich schnell verändernden, mutationsgesättigten Positionen in den kodierenden Sequenzen aus der cpDNA der Spermatophyten. Gleichzeitig bietet sie einen analytischen Rahmen, der hilft, solche Positionen zu identifizieren und aus der weiteren Analyse auszuschließen, wodurch das Ergebnis der phylogenetischen Rekonstruktion verbessert werden kann. Ein neuartiger Ansatz zur Sortierung der Positionen im Alignment, basierend auf dem OV-Kriterium (positios-speziefische p-Distanz), stellt, im Gegensatz zur Bestimmung der positionsspeziefischen parsimonischen Baumlänge, Gammaratenzuordnung und Kompatibilitätsmethoden eine realistischere Annäherung an die Substitutionsrate dar (Goremykin, Nikiforova, Bininda-Emonds, 2010) Als solcher erleichtert er die Untersuchung der Auswirkungen der gesättigten Positionen auf die Baumtopologie. Begleitet von Tests, die die Anpassung des Substitutionsmodells an die Daten einschätzen, ermöglicht er vielleicht, das wichtigste Ziel der phylogenetischen Analyse zu erreichen, nämlich, eine Grundlage für das Verständnis der Ursachen widersprüchlicher Baumtopologien zu schaffen. Dieses Verfahren erweitert die Grenzen der Nutzbarkeit der cpDNA-Daten für die Phylogenierekonstruktion auf hohen taxonomischen Ebenen und zeigt das Potenzial der cpDNA als unverseller Marker für Studien der Pflanzenevolution. Praktisch wurden konkrete Hinweise dafür vorgelegt, dass die Platzierung von Amborella trichopoda an der Basis des Stammbaums der Angiospermen ein LBA-Artefakt ist. Die extreme Verbreitung dieses Artefaktes in der rezenten Literatur betont schon für sich allein betrachtet die Wichtigkeit, in die Phylogeniestudien auf hohen taxonomischen Ebenen in der Botanik explorative phylogenetische Analysen einzuführen, welche das Testen der Anwendbarkeit der methodischen Annahmen für die Datensätze enthalten. Ein Nachweis dafür, dass unzureichende Modellanpassung auch die Platzierung der Gnetales innerhalb der Gymnospermenradiation beeinflusst, bietet noch einen weiteren Hinweis darauf, dass LBAArtefakte in dem in dem heute weitgehend akzeptierten Stammbaum der Pflanzen reichlich vorhanden sein dürften. Die Verbesserung der Modellanpassung an den Datensatz mittels Entfernen des Datenanteils, der nicht-phylogenetischen Signale beinhaltet, hat es erlaubt, die Schwestergrupppenbeziehung zwischen Gnetales und Pinaceae und die Zusammensetzung des basalsten Angiospermenastes zu identifizieren. Die Verfahren, die im Rahmen dieser Studie ausgearbeitet wurden, bieten einen methodologischen Rahmen für zukünftige phylogenetische Forschung.

Zitieren

Zitierform:

Nikiforova, Svetlana: Plant phylogenomics. approaches to make phylogenic inference more reliable. 2013.

Zugriffsstatistik

Gesamt:
Volltextzugriffe:
Metadatenansicht:
12 Monate:
Volltextzugriffe:
Metadatenansicht:

Grafik öffnen

Export