mzIdentML

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
mzIdentML
Dateiendung: .mzIdentML
Entwickelt von: Proteomics Standards Initiative
Aktuelle Version 1.3.0
(2024-06)
www.psidev.info/mzidentml


mzIdentML ist ein XML-basiertes Dateiformat in der Massenspektrometrie basierten Proteomik, um identifizierte Peptide oder Proteine abzuspeichern. Die zahlreichen Hersteller-spezifischen Formate wurden zum Problem, da die Qualitätsmetriken nur bedingt vergleichbar waren. Die zu Grunde liegenden Massenspektren werden dabei lediglich referenziert und werden vom Standard nicht erfasst, da es mit mzML einen bereits existierenden Standard der Initiative gibt, dessen kontrolliertes Vokabular verwendet wird. Zudem sollten auch alternative Formate erlaubt sein. Suchmaschinen verlangen in der Regel, Spektren und mzIdentML gleichzeitig hochzuladen. Den Sequenzierungsergebnissen liegt oftmals eine gewisse technologisch bedingte Mehrdeutichkeit zu Grunde, die von dem Format bedacht und entsprechend annotiert wird.[1]

Mit Version 1.2 wurden Bewertungen im Kontext der Lokalisierung von Peptidmodifikationen, Statistiken auf Peptidebene, die Identifizierung von vernetzten Peptiden und Unterstützung für Proteogenomik-Ansätze. Es gibt jetzt eine verbesserte Unterstützung für die Codierung der De-Novo-Peptidsequenzierung, Suche in Spektrenbibliotheken und die Proteininferenz.[2] Mit Version 1.3 wurde Unterstützung für cleavable crosslinkers, intern verknüpfte Peptide, nicht kovalent assoziierte Peptide eingeführt sowie für die Codierung von Scores und die entsprechenden Schwellenwerte verbessert.[3]

Zur Unterstützung der Annahme des Standards wurden zahlreiche gemeinfreie Softwarewerkzeuge veröffentlicht.[4] Zudem existierte eine Programmierschnittstelle für Java[5] und Python[6] und R.[7] Das Softwarepaket OpenMS bietet integrierte Unterstützung an.[8] Die ProteoWizard Programmbibliotheken unterstützen dies ebenfalls.[9]

  • Martin Eisenacher: mzIdentML: An Open Community-Built Standard Format for the Results of Proteomics Spectrum Identification Algorithms. In: Data Mining in Proteomics. Band 696. Humana Press, Totowa, NJ 2011, ISBN 978-1-60761-986-4, S. 161–177, doi:10.1007/978-1-60761-987-1_10.

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Andrew R. Jones, Martin Eisenacher, Gerhard Mayer, Oliver Kohlbacher, Jennifer Siepen, Simon J. Hubbard, Julian N. Selley, Brian C. Searle, James Shofstahl, Sean L. Seymour, Randall Julian, Pierre-Alain Binz, Eric W. Deutsch, Henning Hermjakob, Florian Reisinger, Johannes Griss, Juan Antonio Vizcaíno, Matthew Chambers, Angel Pizarro, David Creasy: The mzIdentML Data Standard for Mass Spectrometry-Based Proteomics Results. In: Molecular & Cellular Proteomics. Band 11, Nr. 7, 27. Februar 2012, S. M111.014381, doi:10.1074/mcp.M111.014381, PMID 22375074, PMC 3394945 (freier Volltext).
  2. Juan Antonio Vizcaíno, Gerhard Mayer, Simon Perkins, Harald Barsnes, Marc Vaudel, Yasset Perez-Riverol, Tobias Ternent, Julian Uszkoreit, Martin Eisenacher, Lutz Fischer, Juri Rappsilber, Eugen Netz, Mathias Walzer, Oliver Kohlbacher, Alexander Leitner, Robert J. Chalkley, Fawaz Ghali, Salvador Martínez-Bartolomé, Eric W. Deutsch, Andrew R. Jones: The mzIdentML Data Standard Version 1.2, Supporting Advances in Proteome Informatics. In: Molecular & Cellular Proteomics. Band 16, Nr. 7, 17. Mai 2017, S. 1275, doi:10.1074/mcp.M117.068429, PMID 28515314, PMC 5500760 (freier Volltext).
  3. Colin W. Combe, Lars Kolbowski, Lutz Fischer, Ville Koskinen, Joshua Klein, Alexander Leitner, Andrew R. Jones, Juan Antonio Vizcaíno, Juri Rappsilber: mzIdentML 1.3.0 – Essential progress on the support of crosslinking and other identifications based on multiple spectra. In: Proteomics. Band 24, Nr. 17, 2024, S. 2300385, doi:10.1002/pmic.202300385.
  4. Fawaz Ghali, Ritesh Krishna, Pieter Lukasse, Salvador Martínez-Bartolomé, Florian Reisinger, Henning Hermjakob, Juan Antonio Vizcaíno, Andrew R. Jones: Tools (Viewer, Library and Validator) that Facilitate Use of the Peptide and Protein Identification Standard Format, Termed mzIdentML. In: Molecular & Cellular Proteomics. Band 12, Nr. 11, November 2013, ISSN 1535-9476, S. 3026–3035, doi:10.1074/mcp.O113.029777.
  5. Florian Reisinger, Ritesh Krishna, Fawaz Ghali, Daniel Ríos1, Henning Hermjakob, Juan Antonio Vizcaíno, Andrew R. Jones: jmzIdentML API: A Java interface to the mzIdentML standard for peptide and protein identification data. In: Proteomics. Band 12, Nr. 6, 26. April 2012, S. 790, doi:10.1002/pmic.201100577, PMID 22539429, PMC 3933944 (freier Volltext).
  6. Joshua Klein, Joseph Zaia: psims - A Declarative Writer for mzML and mzIdentML for Python. In: Molecular & Cellular Proteomics. Band 18, Nr. 3, März 2019, S. 571–575, doi:10.1074/mcp.RP118.001070, PMID 30563850, PMC 6398200 (freier Volltext).
  7. Thomas Lin Pedersen: mzID: An mzIdentML parser for R. 15. Mai 2016, abgerufen am 12. Dezember 2024 (englisch).
  8. Hannes L. Röst, Timo Sachsenberg, Stephan Aiche, Chris Bielow, Hendrik Weisser, Fabian Aicheler, Sandro Andreotti, Hans-Christian Ehrlich, Petra Gutenbrunner, Erhan Kenar, Xiao Liang, Sven Nahnsen, Lars Nilse, Julianus Pfeuffer, George Rosenberger, Marc Rurik, Uwe Schmitt, Johannes Veit, Mathias Walzer, David Wojnar, Witold E. Wolski, Oliver Schilling, Jyoti S. Choudhary, Lars Malmström, Ruedi Aebersold, Knut Reinert, Oliver Kohlbacher: OpenMS: a flexible open-source software platform for mass spectrometry data analysis. In: Nature Methods. Band 13, Nr. 9, September 2016, S. 741–748, doi:10.1038/nmeth.3959 (mdc-berlin.de [abgerufen am 12. Dezember 2024]).
  9. Matthew C. Chambers, Brendan Maclean, Robert Burke, Dario Amodei, Daniel L. Ruderman, Steffen Neumann, Laurent Gatto, Bernd Fischer, Brian Pratt, Jarrett Egertson, Katherine Hoff, Darren Kessner, Natalie Tasman, Nicholas Shulman, Barbara Frewen, Tahmina A. Baker, Mi-Youn Brusniak, Christopher Paulse, David Creasy, Lisa Flashner, Kian Kani, Chris Moulding, Sean L. Seymour, Lydia M. Nuwaysir, Brent Lefebvre, Frank Kuhlmann, Joe Roark, Paape Rainer, Suckau Detlev, Tina Hemenway, Andreas Huhmer, James Langridge, Brian Connolly, Trey Chadick, Krisztina Holly, Josh Eckels, Eric W. Deutsch, Robert L. Moritz, Jonathan E. Katz, David B. Agus, Michael MacCoss, David L. Tabb, Parag Mallick: A Cross-platform Toolkit for Mass Spectrometry and Proteomics. In: Nature biotechnology. Band 30, Nr. 10, Oktober 2012, S. 918, doi:10.1038/nbt.2377, PMID 23051804, PMC 3471674 (freier Volltext).