БИОХИМИЯ, 2021, том 86, вып. 12, с. 1826–1839

УДК 573

Несостоявшееся интервью с Сиднеем Бреннером: превращение данных в знание, биоинформатика, Big Data и … «Is Water H2O?»

© 2021 Л.Г. Кондратьева 1,2*liakondratyeva@yandex.ru, М.В. Патрушев 1, Е.Д. Свердлов 1*edsverd@gmail.com

НИЦ Курчатовский институт, 123182 Москва, Россия

ФГБУН Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН, 117997 Москва, Россия

Поступила в редакцию 10.11.2021
После доработки 10.11.2021
Принята к публикации 10.11.2021

DOI: 10.31857/S0320972521120071

КЛЮЧЕВЫЕ СЛОВА: биоинформатика, Big Data, геном, системная биология, интервью, Сидней Бреннер.

Аннотация

Обзор представляет собой попытку объяснить некоторые непростые проблемы, связанные с попытками разобраться в механизмах функционирования организмов, в частности, с использованием коллекций Big Data (больших данных). Форма обзора – воображаемое интервью с одной из наиболее ярких фигур эпохи возникновения молекулярной генетики и биологии, уникальным учёным и философом науки Нобелевским лауреатом Сиднеем Бреннером, открывшим для науки замечательный объект исследования – прозрачного 1000-клеточного червя Caenorhabditis elegans и многое другое. Его размышления и выводы относительно неизбежного «конфликта» между быстрорастущими массивами данных (Big Data), получаемых с помощью современных технологий секвенирования, и принципиальными ограничениями («запретами»), возникающими потому, что сложные взаимодействующие системы (организмы) вследствие взаимодействий порождают непредсказуемые «возникающие» свойства, абсолютно актуальны для понимания нерешаемых проблем таких современных тенденций, как «системная биология». Помимо принципиальных ограничений, сами по себе Big Data страдают от серьёзных дефектов, среди которых наиболее явными являются скрытые ошибки и принципиально низкая воспроизводимость. Отдельно следует отметить ещё один, возможно, принципиальный барьер – неполноту данных (количество данных n ≠ all). Эту проблему демонстрируют два небольших наиболее изученных организма, Escherichia coli (1600 генов, то есть 34,6% из 4623 уникальных генов не имеют экспериментальных доказательств функционирования) и C. elegans с белками, идентифицированными примерно для 50% генов. Другой яркий пример – «искусственная» бактерия, JCVI-syn3.0, с минимальным набором генов в геноме. Из её 473 генов биологическая функция не приписана 149 (31,5%). Бреннер указывает, что преобразование данных в знания представляет собой серьёзную проблему для будущих биологических исследований. Для этой цели биологии срочно нужна теоретическая база для её унификации. При этом правильным уровнем исследований он считает клетку и предлагает проект CELLMAP, как системы для организации биологической информации. Как абсолютно честный учёный, он говорит: «Если бы я знал [как это делать], я бы делал это, а не писал о проблеме. Понять, как это делать – остаётся главной проблемой биологических наук».

Текст статьи

Пожалуйста, введите код, чтобы получить PDF файл с полным текстом статьи:

captcha

Сноски

* Адресат для корреспонденции.

Финансирование

Работа выполнена при поддержке гранта Министерства науки и высшего образования Российской Федерации, выделенного Курчатовскому геномному центру (грант № 075-15-2019-1659).

Конфликт интересов

Авторы заявляют об отсутствии конфликта интересов.

Соблюдение этических норм

Настоящая статья не содержит описания каких-либо исследований с участием людей или животных в качестве объектов.

Дополнительные материалы

Дополнительные материалы

Список литературы

1. White, J., and Bretscher, M. S. (2020) Sydney Brenner. 13 January 1927–5 April 2019, The Royal Society Publishing, doi: 10.1098/rsbm.2020.0022.

2. Crick, F. H., Barnett, L., Brenner, S., and Watts-Tobin, R. J. (1961) General nature of the genetic code for proteins, Nature, 192, 1227-1232, doi: 10.1038/1921227a0.

3. Brenner, S., Jacob, F., and Meselson, M. (1961) An unstable intermediate carrying information from genes to ribosomes for protein synthesis, Nature, 190, 576-581, doi: 10.1038/190576a0.

4. Crick, F. H. C. (1957) Nucleic acids, Sci. Am., 197, 188-203.

5. CSHL Archives repository. Preserving and promoting the history of molecular biology. Letter from Sydney Brenner to Max Perutz, URL: http://libgallery.cshl.edu/items/show/64089.

6. Sydney Brenner moves C. elegans into the limelight, Worm History, URL: https://www.hobertlab.org/how-the-worm-got-started/.

7. Brenner, S. (1963) A letter to Max Perutz, 5, June, URL: http://nemaplex.ucdavis.edu/General/Biographies/SBrenner.htm.

8. Kenyon, C. (2019) Sydney Brenner (1927-2019), Science, 364, 638, doi: 10.1126/Science.Aax8563.

9. Grens, K. (2019) Sydney Brenner, mRNA Discoverer, Dies, TheScientist, URL: https://www.the-scientist.com/news-opinion/sydney-brenner–mrna-discoverer–dies-65708.

10. Kuhn, T. S. (1962) The Structure of Scientific Revolutions: University of Chicago Press, Original Edition.

11. Friedberg, E. (2019) Sydney Brenner (1927-2019), Nature, 568, 459-460.

12. From the C. elegans server: Sydney Brenner, January 1, 2020, URL: http://nemaplex.ucdavis.edu/General/Biographies/SBrenner.htm.

13. Brenner, S. (2012) The revolution in the life sciences, Science, 338, 1427-1428.

14. Dunbrack, R. L. (2003) A scoundrel’s refuge, Nat. Struct. Mol. Biol., 10, 590-590, doi: 10.1038/nsb0803-590.

15. Brenner, S. (1998) Refuge of spandrels, Curr. Biol., 8, R669.

16. Ankeny, R. A. (2001) The natural history of Caenorhabditis elegans research, Nat. Rev. Genet., 2, 474-479.

17. Brenner, S. (1974) The genetics of Caenorhabditis elegans, Genetics, 77, 71-94.

18. Brenner, S. (2009) In the beginning was the worm, Genetics, 182, 413-415, doi: 10.1534/genetics.109.104976.

19. Sulston, J. (2002) A conversation with John Sulston, Yale J. Biol. Med., 75, 299-306.

20. C. elegans Sequencing Consortium (1998) Genome sequence of the nematode C. elegans: a platform for investigating biology, Science, 282, 2012-2018, doi: 10.1126/science.282.5396.2012.

21. Brenner, S. (1997) Massively Parallel Sequencing of Sorted Polynucleotides, Google Patents.

22. Brenner, S., Johnson, M., Bridgham, J., Golda, G., Lloyd, D. H., et al. (2000) Gene expression analysis by massively parallel signature sequencing (MPSS) on microbead arrays, Nat. Biotechnol., 18, 630-634, doi: 10.1038/76469.

23. Khrapko, K., Lysov, Y. P., Khorlin, A., Ivanov, I., Yershov, G., et al. (1991) A method for DNA sequencing by hybridization with oligonucleotide matrix, DNA Sequence, 1, 375-388.

24. Sverdlov, E., Monastyrskaya, G., Chestukhin, A., and Budowsky, E. (1973) The primary structure of oligonucleotides. Partial apurinization as a method to determine the positions of purine and pyrimidine residues, FEBS Lett., 33, 15-17.

25. Sverdlov, E., Monastyrskaya, G., Budowsky, E., and Grachev, M. (1972) A novel approach to structural analysis of oligonucleotides, FEBS Lett., 28, 231-235.

26. Müller-Hill, B. (1996) The Lac Operon: A Short History of a Genetic Paradigm, Berlin, New York, Walter de Gruyter, doi: 10.1515/9783110879476.

27. Brenner, S., Elgar, G., Sanford, R., Macrae, A., Venkatesh, B., et al. (1993) Characterization of the pufferfish (Fugu) genome as a compact model vertebrate genome, Nature, 366, 265-268.

28. Aparicio, S., Chapman, J., Stupka, E., Putnam, N., Chia, J. M., et al. (2002) Whole-genome shotgun assembly and analysis of the genome of Fugu rubripes, Science, 297, 1301-1310, doi: 10.1126/science.1072104.

29. Brenner, S. (2019) Loose Ends… False Starts, World Scientific.

30. Cobb, M. (2019) Sydney Brenner (1927-2019), Dev. Cell, 49, 493-495.

31. Brenner, S. (2006) Sydney Brenner forecasts the future, NewScientist, 15 November 2006, URL: https://www.newscientist.com/article/mg19225780-079-sydney-brenner-forecasts-the-future.

32. Buzdin, A. V., Patrushev, M. V., and Sverdlov, E. D. (2021) Will plant genome editing play a decisive role in “Quantum-Leap” improvements in crop yield to feed an increasing global human population? Plants, 10, 1667.

33. Свердлов, Е. (2006) Миражи цитируемости. Библиометрическая оценка значимости научных публикаций отдельных исследователей, Вестник Российской академии наук, 76, 1073-1085.

34. Attwood, T. K., Kell, D. B., McDermott, P., Marsh, J., Pettifer, S. R., et al. (2009) Calling International Rescue: knowledge lost in literature and data landslide! Biochem. J., 424, 317-333, doi: 10.1042/BJ20091474.

35. Batts, S. A., Anthis, N. J., and Smith, T. C. (2008) Advancing science through conversations: bridging the gap between blogs and the academy, PLoS Biol., 6, e240, doi: 10.1371/journal.pbio.0060240.

36. Lowe, D. (2010) What has bioinformatics ever done for us? Science, URL: https://www.science.org/content/blog-post/has-bioinformatics-ever-done-us.

37. Lowe, D. (2013) Farewell to bioinformatics, Science, URL: https://blogs.sciencemag.org/pipeline/archives/2013/01/30/farewell_to_bioinformatics.

38. Maljkovic Berry, I., Melendrez, M. C., Bishop-Lilly, K. A., Rutvisuttinunt, W., Pollett, S., et al. (2020) Next Generation sequencing and bioinformatics methodologies for infectious disease research and public health: approaches, applications, and considerations for development of laboratory capacity, J. Infect. Dis, 221, S292-S307, doi: 10.1093/infdis/jiz286.

39. Sakr, S., and Zomaya, A. Y. (2019) Encyclopedia of Big Data Technologies, Springer International Publishing, doi: 10.1007/978-3-319-77525-8.

40. Stephens, Z. D., Lee, S. Y., Faghri, F., Campbell, R. H., Zhai, C., et al. (2015) Big Data: astronomical or genomical? PLoS Biol., 13, e1002195, doi: 10.1371/journal.pbio.1002195.

41. Improving our understanding of genome structure and function is central to biology and medicine, URL: https://www.tugraz.at/tu-graz/services/news-stories/planet-research/einzelansicht/article/cracking-the-code-within-us-bioinformatics-of-the-human-genome/.

42. Lowe, D. (2016) The Limits of Big Data, URL: https://blogs.sciencemag.org/pipeline/archives/2016/10/21/the-limits-of-big-data.

43. Alekseenko, I. V., Pleshkan, V. V., Monastyrskaya, G. S., Kuzmich, A. I., Snezhkov, E. V., et al. (2016) Fundamentally low reproducibility in molecular genetic cancer research, Genetika, 52, 745-760.

44. IGI-Global. What is Big Data, URL: https://www.igi-global.com/dictionary/data-knowledge-and-intelligence/39008.

45. Moseley, E. T., Hsu, D. J., Stone, D. J., and Celi, L. A. (2014) Beyond open big data: addressing unreliable research, J. Med. Int. Res., 16, e259, doi: 10.2196/jmir.3871.

46. Ware, A., Janvale, G., Shaikh, F., and Harke, S. (2017) HADOOP: Solution for Big Data challenges in bioinformatics and its prospective in India, IOSR J. Comp. Eng., 51-54.

47. Hutter, H., and Moerman, D. (2015) Big Data in Caenorhabditis elegans: quo vadis? Mol. Biol. Cell, 26, 3909-3914, doi: 10.1091/mbc.E15-05-0312.

48. Hulsen, T., Jamuar, S. S., Moody, A. R., Karnes, J. H., Varga, O., et al. (2019) From Big Data to precision medicine, Front. Med. (Lausanne), 6, 34, doi: 10.3389/fmed.2019.00034.

49. Brenner, S. (2008) Data Is a “Substitute for Thinking”, URL: http://www.genomeweb.com/blog/data-substitute-thinking.

50. Brenner, S., and Sejnowski, T. J. (2011) Understanding the human brain, Science, 334, 567, doi: 10.1126/science.1215674.

51. Brenner, S. (2010) Sequences and consequences, Phil. Trans. R. Soc. Lond. Ser. B Biol. Sci., 365, 207-212, doi: 10.1098/rstb.2009.0221.

52. Koch, C. (2012) Systems biology. Modular biological complexity, Science, 337, 531-532, doi: 10.1126/science.1218616.

53. Greek, R., and Hansen, L. A. (2013) Questions regarding the predictive value of one evolved complex adaptive system for a second: exemplified by the SOD1 mouse, Prog. Biophys. Mol. Biol., 113, 231-253, doi: 10.1016/j.pbiomolbio.2013.06.002.

54. Brenner, S. (1995) Loose ends, Curr. Biol., 5, 1328.

55. Ewe, C. K., Cleuren, Y. N. T., and Rothman, J. H. (2020) Evolution and developmental system drift in the endoderm gene regulatory network of Caenorhabditis and other nematodes, Front. Cell. Dev. Biol., 8, 170, doi: 10.3389/fcell.2020.00170.

56. Halfon, M. S. (2017) Perspectives on gene regulatory network evolution, Trends Genet., 33, 436-447, doi: 10.1016/j.tig.2017.04.005.

57. Lavin, D. P., and Tiwari, V. K. (2020) Unresolved complexity in the gene regulatory network underlying EMT, Front. Oncol., 10, 554, doi: 10.3389/fonc.2020.00554.

58. Peter, I. S., and Davidson, E. H. (2009) Modularity and design principles in the sea urchin embryo gene regulatory network, FEBS Lett., 583, 3948-3958, doi: 10.1016/j.febslet.2009.11.060.

59. Ghatak, S., King, Z. A., Sastry, A., and Palsson, B. O. (2019) The y-ome defines the 35% of Escherichia coli genes that lack experimental evidence of function, Nucleic Acids Res., 47, 2446-2454, doi: 10.1093/nar/gkz030.

60. Hutchison, C. A., 3rd, Chuang, R. Y., Noskov, V. N., Assad-Garcia, N., Deerinck, T. J., et al. (2016) Design and synthesis of a minimal bacterial genome, Science, 351, aad6253, doi: 10.1126/science.aad6253.

61. Coyle, M., Hu, J., and Gartner, Z. (2016) Mysteries in a minimal genome, ACS Cent. Sci., 2, 274-277, doi: 10.1021/acscentsci.6b00110.

62. Moran, L. (2008) In the Words of Sydney Brenner, Sandwalk: Strolling with a skeptical biochemist, URL: https://sandwalk.blogspot.com/2008/09/in-words-of-sydney-brenner.html.

63. Brenner, S. (2000) Biochemistry strikes back, Trends Biochem. Sci., 25, 584.