Астрономы МГУ вывели Big Data на космический уровень, создав каталог 800 тысяч галактик.
Испокон веков люди собирают накопленный опыт в реестры, каталоги и библиотеки. К сожалению, гибель цивилизаций обычно сопровождается уничтожением книг и исчезновением языков, поэтому далеко не все знания, добытые человеком за многовековую историю, нам доступны.
Фотография одной из галактик, сделанная космическим телескопом «Хаббл». (Фото: Judy Schmidt / Flickr.com.)
Дизайн RCSED. (Фото: Иван Золотухин.)‹
›
Со Вселенной же в целом дела обстоят иначе. Сегодня нам известно довольно много о том, что происходило во время Большого взрыва, хотя первые доли секунд рождения Вселенной – до сих пор одна из самых интригующих тайн в физике. Современные телескопы позволяют заглянуть в глубину времени и увидеть, как жили самые молодые галактики – Вселенная благодаря огромному размеру и конечной скорости света является библиотекой самой себя: галактики, появившиеся первыми, находятся так далеко от нас, что мы видим их излучение только сегодня.
Впрочем, называя Вселенную библиотекой, надо помнить, что заглянуть в ее «биографию» – совсем не то же самое, что взять книгу с полки: астрофизики должны скрупулёзно собирать сведения о каждой галактике, чтобы быть в состоянии что-то сказать о прошлом и будущем Вселенной. Чтобы облегчить эту задачу и систематизировать то, что уже известно, астрофизики из МГУ и французского Национального центра научных исследований объединились и разработали новый галактический каталог RCSED (Reference Catalog of galaxy Spectral Energy Diagrams).
На сегодняшний день RCSED содержит данные о 800 тыс. галактик, об их звёздном составе и яркости в диапазоне от ультрафиолетового до инфракрасного света. Точная информация о том, на каких длинах волн «излучает» каждая галактика, позволяет определить химический состав звёзд, входящих в её состав, и космического газа, из которого рождаются новые звёзды. Описание каталога опубликовано в The Astrophysical Journal Supplement.
«Для каждой галактики мы анализируем, как она выглядит на разных длинах волн, и это дает нам материал для дальнейших исследований», – объясняет Игорь Чилингарян, астрофизик из МГУ и один из авторов каталога. «Кроме того, – добавляет его коллега Иван Катков, – представленный в RCSED анализ форм эмиссионных линий является самым подробным и точным по сравнению с данными иных каталогов».
Исследователи уделили особое внимание тому, чтобы каталогом было удобно пользоваться: запрашивая данных о конкретном объекте, нужно всего лишь ввести название и координаты небесного тела, а для доступа к нему создана специальная «Виртуальная обсерватория».
Сайт каталога помогали разрабатывать волонтеры – профессиональные разработчики и веб-дизайнеры русских IT-гигантов. «Программисты иногда устают от рутины на работе, поэтому в свободное время они делают что-то для души: например, помогают научным проектам. Мы им невероятно благодарны, они стали полноценными членами нашей команды и существенно усилили нашу работу – говорит соавтор работы Иван Золотухин, научный сотрудник Государственного астрономического института имени П. К. Штернберга (ГАИШ) МГУ. – Нам всегда интересно сотрудничать с IT профессионалами, и у нас много проектов, к которым можно подключаться, так что если вы программируете на Python или занимаетесь HTML/CSS, любите git и звезды, а также располагаете небольшим количеством свободного времени и желанием помочь международной команде ученых – пишите на адрес, указанный на странице».
«Существование RCSED стало возможным во многом благодаря применению междисциплинарных подходов работы с большими данными (big data). Привлечение IT-экспертизы и ресурсов крупных компаний и дальше позволило бы кардинально повысить объем и качество научных исследований и совершить еще не одно важное открытие в астрофизике», – продолжает Иван Катков.
Каталог представляет собой самый большой в мире однородный набор данных для галактик, который включает в себя информацию, полученную с помощью наземных и космических телескопов. Об актуальности RCSED говорит то, что он вызвал серьезный интерес к себе со стороны научного мира уже тогда, когда его только разрабатывали. В течение последних трёх лет «внешние» исследователи опубликовали порядка десяти статей по внегалактической астрономии на основе «сырого» RCSED.
Создатели каталога решили остановиться на тех данных, которые достаточно хорошо представлены в науке – потому что и преимущества и недостатки таких сведений вполне известны – поэтому пока он содержит меньше галактик, чем мог бы. Однако разработчики RCSED не намерены останавливаться на достигнутом. Есть два пути развития каталога: либо расширить выборку галактик, либо увеличить количество и качество данных по каждому объекту. Скорее всего, с поступлением новых данных выборка расширится с восьмисот тысяч до полутора или даже двух миллионов объектов.
«Полную картину можно будет увидеть лет через десять, когда будут завершены крупные обзоры типа DESI, где планируется получить спектры для 25–30 миллионов объектов», – заключил Игорь Чилингарян.
Кто знает, может быть, сосчитать все звёзды на небе – не такая уж и тяжёлая задача!