БИОХИМИЯ, 2021, том 86, вып. 3, с. 395–408
УДК 577.2
Клеточный ответ на стресс в панорамной протеомике: контроль ложноположительных результатов
1 Сколковский институт науки и технологий, 121205 Москва, Россия
2 Московский физико-технический институт (национальный исследовательский университет), 141701 Долгопрудный, Московская обл., Россия
3 Институт энергетических проблем химической физики им. В.Л. Тальрозе ФГБУН Федерального исследовательского центра химической физики им. Н.Н. Семенова РАН, 119334 Москва, Россия
Поступила в редакцию 09.08.2020
После доработки 03.11.2020
Принята к публикации 01.12.2020
DOI: 10.31857/S0320972521030088
КЛЮЧЕВЫЕ СЛОВА: протеомика, биоинформатика, клеточный ответ, масс-спектрометрия.
Аннотация
Одной из основных задач количественной протеомики является определение молекулярных изменений на уровне белков в клеточном ответе на стресс. При этом в основе биоинформатической обработки получаемых экспериментальных данных лежит статистический анализ, в котором многократно тестируется гипотеза о равенстве концентраций белков в стрессе относительно нормы. Возникает классическая проблема множественных сравнений, когда повышается вероятность получения ложноположительных результатов. На сегодняшний день известно множество подходов для решения этой проблемы. Однако их применение с исторически принятыми фиксированными порогами статистической значимости может приводить к потере потенциально ценной биологической информации. Используя протеомные данные, полученные ранее для модельных образцов дрожжей, содержащих белки в известных концентрациях, а также данные для биологических моделей раннего и позднего ответа клеток на стресс, были исследованы распределения ложноположительных и ложноотрицательных результатов в зависимости от значений кратных изменений концентраций и порога статистической значимости. На основе анализа плотности распределения точек на диаграммах рассеяния, метода Бенджамини–Хохберга и анализа обогащений генных онтологий предложен наглядный протокол оптимизации статистического порога и отбора дифференциально регулированных белков, который будет полезен исследователям, работающим в области количественного анализа протеомных данных.
Текст статьи
Сноски
* Адресат для корреспонденции.
Финансирование
Исследование выполнено при поддержке Российского научного фонда (грант № 20-14-00229).
Благодарности
Культура астроцитов для протеомного анализа была предоставлена сотрудниками ИМБ РАН, проф. П.М. Чумаковым и А.В. Соболевой в рамках работ, поддержанных Российским фондом фундаментальных исследований (грант № 18-29-01059-мк).
Конфликт интересов
Авторы заявляют об отсутствии конфликта интересов.
Соблюдение этических норм
Настоящая статья не содержит описания выполненных авторами исследований с участием людей или использованием животных в качестве объектов.
Дополнительные материалы
Приложение к статье на английском языке опубликовано на сайте журнала «Biochemistry» (Moscow) (http://protein.bio.msu.ru/biokhimiya/) и на сайте издательства Springer (https://link.springer.com/journal/10541), том 86, вып. 3, 2021.
Список литературы
1. Nikolov, M., Schmidt, C., and Urlaub, H. (2012) Quantitative mass spectrometry-based proteomics: an overview, in Quantitative Methods in Proteomics (Marcus, K., ed.) Humana Press, Totowa, NJ, pp. 85-100, doi: 10.1007/978-1-61779-885-6_7.
2. Zhang, X., Fang, A., Riley, C. P., Wang, M., Regnier, F. E., and Buck, C. (2010) Multi-dimensional liquid chromatography in proteomics – a review, Anal. Chimica Acta, 664, 101-113, doi: 10.1016/j.aca.2010.02.001.
3. Podwojski, K., Stephan, C., and Eisenacher, M. (2012) Important issues in planning a proteomics experiment: statistical considerations of quantitative proteomic data, in Quantitative Methods in Proteomics, (Marcus, K., ed.), Humana Press, Totowa, NJ, pp. 3-21, doi: 10.1007/978-1-61779-885-6_1.
4. Tuli, L., and Ressom, H. W. (2009) LC–MS based detection of differential protein expression, J. Proteomics Bioinform., 02, 416-438, doi: 10.4172/jpb.1000102.
5. Ishihama, Y., Oda, Y., Tabata, T., Sato, T., Nagasu, T., et al. (2005) Exponentially modified protein abundance index (EmPAI) for estimation of absolute protein amount in proteomics by the number of sequenced peptides per protein, Mol. Cell. Proteomics, 4, 1265-1272, doi: 10.1074/mcp.M500061-MCP200.
6. Griffin, N. M., Yu, J., Long, F., Oh, P., Shore, S., et al. (2010) Label-free, normalized quantification of complex mass spectrometry data for proteomic analysis, Nat. Biotechnol., 28, 83-89, doi: 10.1038/nbt.1592.
7. Trudgian, D. C., Ridlova, G., Fischer, R., Mackeen, M. M., Ternette, N., et al. (2011) Comparative evaluation of label-free SINQ normalized spectral index quantitation in the central proteomics facilities pipeline, Proteomics, 11, 2790-2797, doi: 10.1002/pmic.201000800.
8. Webb-Robertson, B.-J. M., Wiberg, H. K., Matzke, M. M., Brown, J. N., Wang, J., et al. (2015) Review, evaluation, and discussion of the challenges of missing value imputation for mass spectrometry-based label-free global proteomics, J. Proteome Res., 14, 1993-2001, doi: 10.1021/pr501138h.
9. Karpievitch, Y. V., Dabney, A. R., and Smith, R. D. (2012) Normalization and missing value imputation for label-free LC-MS analysis, BMC Bioinformatics, 13, S5, doi: 10.1186/1471-2105-13-S16-S5.
10. Nagaraj, N., Kulak, N. A., Cox, J., Neuhauser, N., Mayr, K., et al. (2012) System-wide perturbation analysis with nearly complete coverage of the yeast proteome by single-shot ultra HPLC runs on a bench top orbitrap, Mol. Cell. Proteomics, 11, M111.013722, doi: 10.1074/mcp.M111.013722.
11. Wiener, M. C., Sachs, J. R., Deyanova, E. G., and Yates, N. A. (2004) Differential mass spectrometry: a label-free LC–MS method for finding significant differences in complex peptide and protein mixtures, Anal. Chem., 76, 6085-6096, doi: 10.1021/ac0493875.
12. Zhang, B., Käll, L., and Zubarev, R. A. (2016) DeMix-Q: quantification-centered data processing workflow, Mol. Cell. Proteomics, 15, 1467-1478, doi: 10.1074/mcp.O115.055475.
13. Lim, M. Y., Paulo, J. A., and Gygi, S. P. (2019) Evaluating false transfer rates from the match-between-runs algorithm with a two-proteome model, J. Proteome Res., 18, 4020-4026, doi: 10.1021/acs.jproteome.9b00492.
14. Cox, J., and Mann, M. (2008) MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification, Nat. Biotechnol., 26, 1367-1372, doi: 10.1038/nbt.1511.
15. Zhang, B., Pirmoradian, M., Zubarev, R., and Käll, L. (2017) Covariation of peptide abundances accurately reflects protein concentration differences, Mol. Cell. Proteomics, 16, 936-948, doi: 10.1074/mcp.O117.067728.
16. The, M., and Käll, L. (2019) Integrated identification and quantification error probabilities for shotgun proteomics, Mol. Cell. Proteomics, 18, 561-570, doi: 10.1074/mcp.RA118.001018.
17. Chen, S.-Y., Feng, Z., and Yi, X. (2017) A general introduction to adjustment for multiple comparisons, J. Thorac. Dis., 9, 1725-1729, doi: 10.21037/jtd.2017.05.34.
18. Kennedy-Shaffer, L. (2019) Before p < 0.05 to beyond p < 0.05: using history to contextualize p-values and significance testing, Am. Stat., 73, 82-90, doi: 10.1080/00031305.2018.1537891.
19. Bubis, J. A., Spasskaya, D. S., Gorshkov, V. A., Kjeldsen, F., Kofanova, A. M., et al. (2020) Rpn4 and proteasome-mediated yeast resistance to ethanol includes regulation of autophagy, Appl. Microbiol. Biot., 104, 4027-4041, doi: 10.1007/s00253-020-10518-x.
20. Tarasova, I. A., Tereshkova, A. V., Lobas, A. A., Solovyeva, E. M., Sidorenko, A. S., et al. (2018) Comparative proteomics as a tool for identifying specific alterations within interferon response pathways in human glioblastoma multiforme cells, Oncotarget, 9, 1785-1802, doi: 10.18632/oncotarget.22751.
21. Bubis, J. A., Levitsky, L. I., Ivanov, M. V., Tarasova, I. A., and Gorshkov, M. V. (2017) Comparative evaluation of label-free quantification methods for shotgun proteomics: LFQ methods for proteomics, Rapid Commun. Mass Spectrom., 31, 606-612, doi: 10.1002/rcm.7829.
22. Kessner, D., Chambers, M., Burke, R., Agus, D., and Mallick, P. (2008) ProteoWizard: open source software for rapid proteomics tools development, Bioinformatics, 24, 2534-2536, doi: 10.1093/bioinformatics/btn323.
23. Kong, A. T., Leprevost, F. V., Avtonomov, D. M., Mellacheruvu, D., and Nesvizhskii, A. I. (2017) MSFragger: ultrafast and comprehensive peptide identification in mass spectrometry-based proteomics, Nat. Methods, 14, 513-520, doi: 10.1038/nmeth.4256.
24. Levitsky, L. I., Ivanov, M. V., Lobas, A. A., Bubis, J. A., Tarasova, I. A., et al. (2018) IdentiPy: an extensible search engine for protein identification in shotgun proteomics, J. Proteome Res., 17, 2249-2255, doi: 10.1021/acs.jproteome.7b00640.
25. Ivanov, M. V., Levitsky, L. I., Bubis, J. A., and Gorshkov, M. V. (2019) Scavager: a versatile postsearch validation algorithm for shotgun proteomics based on gradient boosting, Proteomics, 19, 1800280, doi: 10.1002/pmic.201800280.
26. The, M., MacCoss, M. J., Noble, W. S., and Käll, L. (2016) Fast and accurate protein false discovery rates on large-scale proteomics data sets with Percolator 3.0, J. Am. Soc. Mass Spectrom., 27, 1719-1727, doi: 10.1007/s13361-016-1460-7.
27. Eden, E., Navon, R., Steinfeld, I., Lipson, D., and Yakhini, Z. (2009) GOrilla: a tool for discovery and visualization of enriched GO terms in ranked gene lists, BMC Bioinformatics, 10, 48, doi: 10.1186/1471-2105-10-48.
28. Lualdi, M., and Fasano, M. (2019) Statistical analysis of proteomics data: a review on feature selection, J. Proteomics, 198, 18-26, doi: 10.1016/j.jprot.2018.12.004.
29. Diz, A. P., Carvajal-Rodríguez, A., and Skibinski, D. O. F. (2011) Multiple hypothesis testing in proteomics: A strategy for experimental work, Mol. Cell. Proteomics, 10, M110.004374, doi: 10.1074/mcp.M110.004374.
30. Fruzangohar, M., Ebrahimie, E., and Adelson, D. L. (2017) A novel hypothesis-unbiased method for gene ontology enrichment based on transcriptome data, PLoS One, 12, e0170486, doi: 10.1371/journal.pone.0170486.
31. Gong, H., Wu, T. T., and Clarke, E. M. (2014) Pathway-gene identification for pancreatic cancer survival via doubly regularized cox regression, BMC Syst. Biol., 8, S3, doi: 10.1186/1752-0509-8-S1-S3.