БИОХИМИЯ, 2021, том 86, вып. 3, с. 395–408

УДК 577.2

Клеточный ответ на стресс в панорамной протеомике: контроль ложноположительных результатов

© 2021 И.Т. Габдрахманов 1, М.В. Горшков 2,3, И.А. Тарасова 3*

Сколковский институт науки и технологий, 121205 Москва, Россия

Московский физико-технический институт (национальный исследовательский университет), 141701 Долгопрудный, Московская обл., Россия

Институт энергетических проблем химической физики им. В.Л. Тальрозе ФГБУН Федерального исследовательского центра химической физики им. Н.Н. Семенова РАН, 119334 Москва, Россия; электронная почта: iatarasova@yandex.ru

Поступила в редакцию 09.08.2020
После доработки 03.11.2020
Принята к публикации 01.12.2020

DOI: 10.31857/S0320972521030088

КЛЮЧЕВЫЕ СЛОВА: протеомика, биоинформатика, клеточный ответ, масс-спектрометрия.

Аннотация

Одной из основных задач количественной протеомики является определение молекулярных изменений на уровне белков в клеточном ответе на стресс. При этом в основе биоинформатической обработки получаемых экспериментальных данных лежит статистический анализ, в котором многократно тестируется гипотеза о равенстве концентраций белков в стрессе относительно нормы. Возникает классическая проблема множественных сравнений, когда повышается вероятность получения ложноположительных результатов. На сегодняшний день известно множество подходов для решения этой проблемы. Однако их применение с исторически принятыми фиксированными порогами статистической значимости может приводить к потере потенциально ценной биологической информации. Используя протеомные данные, полученные ранее для модельных образцов дрожжей, содержащих белки в известных концентрациях, а также данные для биологических моделей раннего и позднего ответа клеток на стресс, были исследованы распределения ложноположительных и ложноотрицательных результатов в зависимости от значений кратных изменений концентраций и порога статистической значимости. На основе анализа плотности распределения точек на диаграммах рассеяния, метода Бенджамини–Хохберга и анализа обогащений генных онтологий предложен наглядный протокол оптимизации статистического порога и отбора дифференциально регулированных белков, который будет полезен исследователям, работающим в области количественного анализа протеомных данных.

Сноски

* Адресат для корреспонденции.

Финансирование

Исследование выполнено при поддержке Российского научного фонда (грант № 20-14-00229).

Благодарности

Культура астроцитов для протеомного анализа была предоставлена сотрудниками ИМБ РАН, проф. П.М. Чумаковым и А.В. Соболевой в рамках работ, поддержанных Российским фондом фундаментальных исследований (грант № 18-29-01059-мк).

Конфликт интересов

Авторы заявляют об отсутствии конфликта интересов.

Соблюдение этических норм

Настоящая статья не содержит описания выполненных авторами исследований с участием людей или использованием животных в качестве объектов.

Дополнительные материалы

Приложение к статье на английском языке опубликовано на сайте журнала «Biochemistry» (Moscow) (http://protein.bio.msu.ru/biokhimiya/) и на сайте издательства Springer (https://link.springer.com/journal/10541), том 86, вып. 3, 2021.

Список литературы

1. Nikolov, M., Schmidt, C., and Urlaub, H. (2012) Quantitative mass spectrometry-based proteomics: an overview, in Quantitative Methods in Proteomics (Marcus, K., ed.) Humana Press, Totowa, NJ, pp. 85-100, doi: 10.1007/978-1-61779-885-6_7.

2. Zhang, X., Fang, A., Riley, C. P., Wang, M., Regnier, F. E., and Buck, C. (2010) Multi-dimensional liquid chromatography in proteomics – a review, Anal. Chimica Acta, 664, 101-113, doi: 10.1016/j.aca.2010.02.001.

3. Podwojski, K., Stephan, C., and Eisenacher, M. (2012) Important issues in planning a proteomics experiment: statistical considerations of quantitative proteomic data, in Quantitative Methods in Proteomics, (Marcus, K., ed.), Humana Press, Totowa, NJ, pp. 3-21, doi: 10.1007/978-1-61779-885-6_1.

4. Tuli, L., and Ressom, H. W. (2009) LC–MS based detection of differential protein expression, J. Proteomics Bioinform., 02, 416-438, doi: 10.4172/jpb.1000102.

5. Ishihama, Y., Oda, Y., Tabata, T., Sato, T., Nagasu, T., et al. (2005) Exponentially modified protein abundance index (EmPAI) for estimation of absolute protein amount in proteomics by the number of sequenced peptides per protein, Mol. Cell. Proteomics, 4, 1265-1272, doi: 10.1074/mcp.M500061-MCP200.

6. Griffin, N. M., Yu, J., Long, F., Oh, P., Shore, S., et al. (2010) Label-free, normalized quantification of complex mass spectrometry data for proteomic analysis, Nat. Biotechnol., 28, 83-89, doi: 10.1038/nbt.1592.

7. Trudgian, D. C., Ridlova, G., Fischer, R., Mackeen, M. M., Ternette, N., et al. (2011) Comparative evaluation of label-free SINQ normalized spectral index quantitation in the central proteomics facilities pipeline, Proteomics, 11, 2790-2797, doi: 10.1002/pmic.201000800.

8. Webb-Robertson, B.-J. M., Wiberg, H. K., Matzke, M. M., Brown, J. N., Wang, J., et al. (2015) Review, evaluation, and discussion of the challenges of missing value imputation for mass spectrometry-based label-free global proteomics, J. Proteome Res., 14, 1993-2001, doi: 10.1021/pr501138h.

9. Karpievitch, Y. V., Dabney, A. R., and Smith, R. D. (2012) Normalization and missing value imputation for label-free LC-MS analysis, BMC Bioinformatics, 13, S5, doi: 10.1186/1471-2105-13-S16-S5.

10. Nagaraj, N., Kulak, N. A., Cox, J., Neuhauser, N., Mayr, K., et al. (2012) System-wide perturbation analysis with nearly complete coverage of the yeast proteome by single-shot ultra HPLC runs on a bench top orbitrap, Mol. Cell. Proteomics, 11, M111.013722, doi: 10.1074/mcp.M111.013722.

11. Wiener, M. C., Sachs, J. R., Deyanova, E. G., and Yates, N. A. (2004) Differential mass spectrometry: a label-free LC–MS method for finding significant differences in complex peptide and protein mixtures, Anal. Chem., 76, 6085-6096, doi: 10.1021/ac0493875.

12. Zhang, B., Käll, L., and Zubarev, R. A. (2016) DeMix-Q: quantification-centered data processing workflow, Mol. Cell. Proteomics, 15, 1467-1478, doi: 10.1074/mcp.O115.055475.

13. Lim, M. Y., Paulo, J. A., and Gygi, S. P. (2019) Evaluating false transfer rates from the match-between-runs algorithm with a two-proteome model, J. Proteome Res., 18, 4020-4026, doi: 10.1021/acs.jproteome.9b00492.

14. Cox, J., and Mann, M. (2008) MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification, Nat. Biotechnol., 26, 1367-1372, doi: 10.1038/nbt.1511.

15. Zhang, B., Pirmoradian, M., Zubarev, R., and Käll, L. (2017) Covariation of peptide abundances accurately reflects protein concentration differences, Mol. Cell. Proteomics, 16, 936-948, doi: 10.1074/mcp.O117.067728.

16. The, M., and Käll, L. (2019) Integrated identification and quantification error probabilities for shotgun proteomics, Mol. Cell. Proteomics, 18, 561-570, doi: 10.1074/mcp.RA118.001018.

17. Chen, S.-Y., Feng, Z., and Yi, X. (2017) A general introduction to adjustment for multiple comparisons, J. Thorac. Dis., 9, 1725-1729, doi: 10.21037/jtd.2017.05.34.

18. Kennedy-Shaffer, L. (2019) Before p < 0.05 to beyond p < 0.05: using history to contextualize p-values and significance testing, Am. Stat., 73, 82-90, doi: 10.1080/00031305.2018.1537891.

19. Bubis, J. A., Spasskaya, D. S., Gorshkov, V. A., Kjeldsen, F., Kofanova, A. M., et al. (2020) Rpn4 and proteasome-mediated yeast resistance to ethanol includes regulation of autophagy, Appl. Microbiol. Biot., 104, 4027-4041, doi: 10.1007/s00253-020-10518-x.

20. Tarasova, I. A., Tereshkova, A. V., Lobas, A. A., Solovyeva, E. M., Sidorenko, A. S., et al. (2018) Comparative proteomics as a tool for identifying specific alterations within interferon response pathways in human glioblastoma multiforme cells, Oncotarget, 9, 1785-1802, doi: 10.18632/oncotarget.22751.

21. Bubis, J. A., Levitsky, L. I., Ivanov, M. V., Tarasova, I. A., and Gorshkov, M. V. (2017) Comparative evaluation of label-free quantification methods for shotgun proteomics: LFQ methods for proteomics, Rapid Commun. Mass Spectrom., 31, 606-612, doi: 10.1002/rcm.7829.

22. Kessner, D., Chambers, M., Burke, R., Agus, D., and Mallick, P. (2008) ProteoWizard: open source software for rapid proteomics tools development, Bioinformatics, 24, 2534-2536, doi: 10.1093/bioinformatics/btn323.

23. Kong, A. T., Leprevost, F. V., Avtonomov, D. M., Mellacheruvu, D., and Nesvizhskii, A. I. (2017) MSFragger: ultrafast and comprehensive peptide identification in mass spectrometry-based proteomics, Nat. Methods, 14, 513-520, doi: 10.1038/nmeth.4256.

24. Levitsky, L. I., Ivanov, M. V., Lobas, A. A., Bubis, J. A., Tarasova, I. A., et al. (2018) IdentiPy: an extensible search engine for protein identification in shotgun proteomics, J. Proteome Res., 17, 2249-2255, doi: 10.1021/acs.jproteome.7b00640.

25. Ivanov, M. V., Levitsky, L. I., Bubis, J. A., and Gorshkov, M. V. (2019) Scavager: a versatile postsearch validation algorithm for shotgun proteomics based on gradient boosting, Proteomics, 19, 1800280, doi: 10.1002/pmic.201800280.

26. The, M., MacCoss, M. J., Noble, W. S., and Käll, L. (2016) Fast and accurate protein false discovery rates on large-scale proteomics data sets with Percolator 3.0, J. Am. Soc. Mass Spectrom., 27, 1719-1727, doi: 10.1007/s13361-016-1460-7.

27. Eden, E., Navon, R., Steinfeld, I., Lipson, D., and Yakhini, Z. (2009) GOrilla: a tool for discovery and visualization of enriched GO terms in ranked gene lists, BMC Bioinformatics, 10, 48, doi: 10.1186/1471-2105-10-48.

28. Lualdi, M., and Fasano, M. (2019) Statistical analysis of proteomics data: a review on feature selection, J. Proteomics, 198, 18-26, doi: 10.1016/j.jprot.2018.12.004.

29. Diz, A. P., Carvajal-Rodríguez, A., and Skibinski, D. O. F. (2011) Multiple hypothesis testing in proteomics: A strategy for experimental work, Mol. Cell. Proteomics, 10, M110.004374, doi: 10.1074/mcp.M110.004374.

30. Fruzangohar, M., Ebrahimie, E., and Adelson, D. L. (2017) A novel hypothesis-unbiased method for gene ontology enrichment based on transcriptome data, PLoS One, 12, e0170486, doi: 10.1371/journal.pone.0170486.

31. Gong, H., Wu, T. T., and Clarke, E. M. (2014) Pathway-gene identification for pancreatic cancer survival via doubly regularized cox regression, BMC Syst. Biol., 8, S3, doi: 10.1186/1752-0509-8-S1-S3.