Использование ИТ для идентификации структуры соединений по данным LC-MS/MS
ВВЕДЕНИЕ
Целью данной работы является исследование эффективности использования программы, а именно MS-FINDER, предназначенной для обработки данных тандемной масс-спектрометрии, поиска соединений по MS-, а также MS/MS-спектрам возможностью осуществления фрагментации in silico.
Тандемная масс-спектрометрия (МS/МS) считается незаменимым методом для высокопроизводительной идентификации как низко-, так и высокомолекулярных соединений и определения их структуры в протеомике и метаболомике. Метаболомика – это всестороннее изучение малых молекул, присутствующих в клетках, тканях и жидкостях организма. Под протеомикой же понимается анализ всех белков организма. Достижения в области метаболического профилирования привели к открытию биомаркеров различных заболеваниях с использованием разнообразных подходов.Таким образом, областью исследования является масс-спектрометрия, а именно компьютеризация процессов обработки данных, полученных в ходе применения данного метода анализа.
Предметом исслед
ОГЛАВЛЕНИЕ
СПИСОК ОБОЗНАЧЕНИЙ 3
ВВЕДЕНИЕ 4
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ 6
ГЛАВА 1. БАЗЫ ДАННЫХ, ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ И ПОДХОДЫ ДЛЯ СТРУКТУРНОЙ ИДЕНТИФИКАЦИИ ДАННЫХ LC-MS/MS 8
1.1. Базы данных веществ и ChemSpacE 9
1.2. Базы данных масс-спектров 10
1.3. Генерация MS- и MS/MS-спектров in silico 12
1.4. Программы для фрагментации in silico 13
1.5. MS-FINDER 16
ГЛАВА 2. ИСПОЛЬЗОВАНИЕ MS-FINDER ДЛЯ ИДЕНТИФИКАЦИИ СОЕДИНЕНИЙ 25
2.1 Материалы и методы 25
ГЛАВА 3. ОСНОВНЫЕ РЕЗУЛЬТАТЫ 27
ГЛАВА 4. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ 30
ЗАКЛЮЧЕНИЕ 31
СПИСОК ЛИТЕРАТУРЫ 32
СПИСОК ЛИТЕРАТУРЫ
1. Kim, H. K. NMR-based metabolomic analysis of plants / H.K. Kim, Y.H. Choi, R. Verpoorte // Nature Protocols. – 2010. – Vol. 5. – P. 536–549.
2. Pérez-Victoria, I. Combined LC/UV/MS and NMR Strategies for the Dereplica-tion of Marine Natural Products / I. Pérez-Victoria, J. Martín, F. Reyes // Planta Medica. – 2016. – Vol. 82. – P. 857–871.
3. Blaženović, I. Software tools and approaches for compound identification of LC-MS/MS data in metabolomics / I. Blaženović [et al.] // Metabolites. – 2018. – Vol. 8. – P. 1–23.
4. Milman, B. L. The chemical space for non-target analysis / B.L. Milman, I.K. Zhurkovich // Trends in Analytical Chemistry. – 2017. – Vol. 97. – P. 179–187.
5. Kind, T. Identification of small molecules using accurate mass MS/MS search / T. Kind [et al.] // Mass Spectrometry Reviews. – 2018. – Vol. 37. – P. 513–532.
6. Bolton, E. E. Chapter 12 PubChem: Integrated Platform of Small Molecules and Biological / E. E. Bolton [et al.] // Activities Annual Reports in Computational Chemistry. – 2008. – Vol. 4. – P. 217–241.
7. Pence, H. E. Chemspider: An online chemical information resource / H.E. Pence, A. Williams // Journal of Chemical Education. – 2010. – Vol. 87. – P. 1123–1124.
8. Kanehisa, M. From genomics to chemical genomics: new developments in KEGG / M. Kanehisa [et al.] // Nucleic acids research. – 2006. – Vol. 34. – P. 354–357.
9. Caspi, R. The MetaCyc database of metabolic pathways and enzymes and the BioCyc collection of pathway/genome databases / R. Caspi [et al.] // Nucleic Acids Research. – 2016. – Vol. 44. – P.471–480.
10. Schomburg, I. The BRENDA enzyme information system–From a database to an expert system / I. Schomburg [et al.] // Journal of Biotechnology. – 2017. – Vol. 261. – P. 194–206.
11. Wishart, D. S. HMDB 4.0: The human metabolome database for 2018 / D. S. Wishart [et al.] // Nucleic Acids Research. – 2018. – Vol. 46. – P. 608–617
12. Degtyarenko, K. ChEBI: A database and ontology for chemical entities of biological interest / K. Degtyarenko [et al.] // Nucleic Acids Research. – 2008. – Vol. 36. – P. 344–350.
13. Gu, J. Use of Natural Products as Chemical Library for Drug Discovery and Network Pharmacology / J. Gu [et al.] // PLoS ONE. – 2013. – Vol. 8.
14. Jeffryes, J. G. MINEs: Open access databases of computationally predicted enzyme promiscuity products for untargeted metabolomics / J. G. Jeffryes [et al.] // Journal of Cheminformatics. – 2015. – Vol. 7 – № 44.
В крупном прорыве в области вычислительной масс-спектрометрии Гримм в 2013 году описал, как молекулярная динамика Борна-Оппенгеймера может быть использована для создания in silico масс-спектров, с применением электронной ионизации любого заданного соединения [27].
Методы, основанные на машинном обучении, такие как CFM-ID, разработанные Алленом, позволяют вычислять спектры CID-MS/MS и EI-MS непосредственно по молекулярным структурам. Это очень универсальный подход, полезный для малых молекул и пептидов до 1000 Да.
Эвристические подходы, такие как LipidBlast, выгодны в использование для классов соединений, которые имеют повторяющиеся и прогностические паттерны фрагментации, например липиды [28]. Однако эвристический подход не может быть распространен на молекулы с очень разнообразными структурными каркасами. Сами библиотеки могут быть легко расширены для включения новых или недавно открытых