Современные научные исследования производят столько новых данных, что среднестатистический учёный не может их обработать. А компьютеры всё ещё не могут сравниться с человеческим зрением по уровню восприятия. Что делать? Привлекать добровольцев. Британский астроном Роберт Симпсон (Robert Simpson) рассказывает, как проект Zooniverse помогает миллиону волонтёров со всего мира участвовать в научной деятельности: составлять карты Млечного пути, искать экзопланеты, считать слонов и определять типы раковых клеток.

Роберт Симпсон
Астроном, веб-разработчик, сотрудник Оксфордского университета. Один из создателей проекта Zooniverse.

— Чем занимается проект Zooniverse?

— Мы создаём краудсорсинг-проекты: размещаем в свободном доступе данные, обычно это фотографии, иногда видео или звук, а затем просим добровольцев провести исследования, которые обычно отдавали в работу аспирантам. Это помогает обработать огромное количество информации с высокой скоростью, а значит, учёные могут сконцентрироваться на сложной аналитической части исследования.

— То есть, в основном, отдаёте добровольцам утомительную работу?

— Да. Но самое удивительное, что людям это нравится. Они выполняют работу, общаются друг с другом онлайн и тоже делают открытия. В этом заключается особенность Zooniverse: мы не просто хотим, чтобы кто-то делал за нас работу, мы даём возможность каждому начать своё собственное исследование, используя нашу информацию.

— Но ведь существуют компьютеры, способные выполнять очень сложные задачи. Что такого может заметить человек, чего не увидит компьютер?

— Многое. Точнее, МНОГОЕ. Один наш проект ставил перед волонтёрами задачу найти различия между спиральными и эллиптическими галактиками. В то время компьютерам такое было не под силу. На самом деле, компьютеры не могут этого сделать и сейчас, если не применить данные, которые мы собрали для обучения машин. Компьютер оказывается прав в 85% случаев. Но в оставшиеся 15% входили самые интересные объекты необычной формы или цвета, в них есть что-то слегка выходящее за рамки нормы. Люди могут распознать эти объекты, а машины — нет, но именно они представляют наибольшую ценность для науки. В сущности, компьютеры не могут делать именно те мелочи, которые нам нужны.

Есть и хорошая новость: мы можем научить компьютеры работать лучше, опираясь на ответы, полученные с помощью человека. Но мы продолжаем двигаться дальше, исследовать необычные, более сложные галактики. Поэтому проект будет продолжать свою деятельность, ведь люди всегда нужны для трудных задач.

Ещё один пример. Наш предыдущий проект «Охотники за планетами» привлекал людей для просмотра данных о световых кривых, полученных с телескопа «Кеплер». Мы смотрели на 150 000 звёзд, изучая излучаемый свет. Смысл действий был в том, чтобы заметить, как напротив звезды проходит планета, и измерить падение яркости света. Затемнение покажет величину планеты, скорость её движения по орбите — огромное количество информации. Для этого нужно просто очень долго рассматривать звезду, используя хорошие инструменты.

Вы нашли планету! Без вас мы бы не узнали о её существовании.

Сейчас НАСА и специалисты, работающие с телескопом «Кеплер», используют компьютерные алгоритмы, чтобы обрабатывать полученные данные, и за годы работы они открыли множество планет. Но наш опыт работы с информацией о галактиках говорит, что в данных из космоса может быть множество деталей, которые заметят люди и не заметят компьютеры, потому что машины запрограммированы на поиск стандартных событий. Мы нашли планеты, которые в НАСА пропустили. Некоторые из них расположены удивительным образом, их нельзя заметить с помощью органов чувств, но они существуют. Например, мы нашли одну из семи планет в системе, похожей на Солнечную. Это открытие очень важно, потому что чем больше планет вращается вокруг звезды, тем более хаотичные световые следы они оставляют.

— Каждый доброволец следит за какой-то конкретной звездой?

— Нет. Как и за галактиками, за одним объектом наблюдают сразу 10–15 человек. А мы им можем написать сообщение: «Вы нашли планету!». Такие письма очень весело отправлять. Многие эти люди остаются авторами открытий только на словах, потому что мы не можем дать планетам их имена. Но мы можем сказать: «Вы нашли планету! Без вас мы бы не узнали о её существовании».

— Какое из открытий, сделанных волонтёрами, было самым экстраординарным?

— Орбита одной из первых планет, которую мы обнаружили, проходит сразу около двух звёзд, вращающихся вокруг друг друга. А вокруг этой системы пролегает орбита ещё двух звёзд, которые тоже зависят друг от друга. Так что у планеты четыре солнца. Два из них яркие, появляются на небе одновременно, а два более тусклых вместе двигаются по кругу на периферии. И это как раз тип системы, которую не может найти компьютер.

А ещё мы нашли планету с двумя солнцами, как Татуин. Команда «Кеплера» анонсировала её открытие, мы взглянули на свои данные и поняли, что тоже её открыли, только опоздали с пресс-релизом. Так что мы находим чудесный, необыкновенный материал.

— Есть ли в проекте человек, который отвечает за анализ данных, полученных от волонтёров?

— В вопросе сортировки результатов работы мы полагаемся на статистику. Раньше мы получали средний результат по итогам 50 просмотров объекта, но теперь мы действуем умнее.

Например, проект «Снимки „Серенгети“» посвящён биологическому разнообразию и взаимодействию видов в национальном парке «Серенгети» в Африке. Исследователи хотели изучить популяции львов, гиен, гепардов и леопардов и разместили в парке 200 камер. Теперь они понимают, что количество было избыточным, но они даже не подозревали, что получат такой огромный объём данных. Камеры захвата движения срабатывали, потому что солнце всходило под определённым углом, мимо проезжали машины с туристами, ветер волновал траву. Исследователи были перегружены количеством фотографий, двое сотрудников должны были обработать более 1,5 миллионов снимков. Даже пытаться не стоило сделать это своими силами.

Я предположил, что 60% снимков были сделаны из-за движений травы. Мы решили, что если трое из пяти человек посмотрят на снимок и скажут, что на нём видна только трава, то мы просто удалим файл из системы. Постепенно мы выбросили все фотографии с растениями, оставив только снимки животных.  А дальше в дело вступила статистика. Каждую картинку просматривали в среднем 20 раз, и на основании полученной информации мы структурировали базу данных.

На стене в моём офисе висит постер с огромной фотомозаикой, на котором изображены антилопы гну (их ещё называют «бургеры для гепардов», потому что гепарды их постоянно едят). Все фото на постере были идентифицированы нашими добровольцами. Мы сделали такие же плакаты с зебрами, львами и слонами, просто чтобы повеселиться, когда поняли, что по одному щелчку мыши можем получить 17 000 фотографий слонов.

— А что необычное заметили люди в проекте, посвящённом «Серенгети»?

— В этом проекте мы просили не обращать внимания на птиц, потому что инициаторы исследования работали с млекопитающими. Так что у нас была общая кнопка для всех птиц. Но некоторые волонтёры самостоятельно разметили все фотографии с птицами, благодаря их усилиям и заинтересованности мы занесли данные по птицам в каталог, как положено, просто так.

— И эти данные могут оказаться для кого-то полезными.

— Именно. Они просто добавили ещё одну группу видов к исследованию.

Так в базе появилась категория «Пожары». В «Серенгети» они часто случаются, и люди отмечали фотографии с ними. Ещё одна забавная категория — «Люди», которые тоже встречались на изображениях. Там были рейнджеры, которые устанавливали камеры и делали пробные снимки с хлопушками. Нам пришлось однажды удалить данные из исследования, потому что туристы случайно разбили лагерь прямо напротив одной из камер.

— Стоило предупредить людей!

— Мы не могли представить, что кто-то вообще захочет установить лагерь в тех местах. Это же центр «Серенгети», там может быть опасно!

— Вы отметили, что в проекте, посвящённом изучению раковых клеток, люди рассматривали образцы тканей. Как они были получены?

— Образцы, окрашенные в определённые цвета, мы получили из Кембриджа, где их брали в ходе анонимного медицинского исследования. Наши добровольцы смотрели на изображения, которые используются для поиска раковых клеток, опухолей или размерных аномалий в тканях организма. Мы предоставили примеры для сравнения, сформировали учебный курс. Нужно просто распознавать изображения, но на такую работу аспиранты тратят половину времени, посвящённого исследованиям. Теперь они всю неделю могут заниматься только работой, и скорость подготовки их научных работ растёт.

У нас есть ещё один медицинский проект по исследованию червей. Мы наблюдаем за нематодами, откладывающими яйца в чашках Петри. Компьютер может провести множество вычислений, связанных с нематодами, но не может сказать, когда они откладывают яйца. Волонтёры просматривают видеоролики, и их задача — нажать на кнопку, как в игре, когда они видят новое яйцо. Я думаю, это отвратительное занятие, мне страшно даже смотреть на этих червей. Эти микроскопические нематоды ужасны, но они нужны для изучения рака. На червях удобно наблюдать генетические мутации, и одна из них, связанная с образованием опухолей, проявляется у определённого фенотипа. Определить его можно по способности откладывать яйца.

— Вы многое узнали о разных научных сферах, к которым могли бы никогда не прикоснуться.

— Да, и это удивительно. Однажды мы вышли за границы астрономии, к нам пришли люди с потрясающими научными историями, а мы помогли им ускорить работу. Я опубликовал статьи в журналах, которые теперь стали входить в сферу моих профессиональных знаний, которые тоже, кстати, в полном порядке.

— Один из привлекательных аспектов Zooniverse — социальная сеть. Как организовано коллективное обсуждение проектов?

— У нас есть дискуссионная площадка, которая охватывает все проекты, называется Talk. Когда волонтёр завершает классификацию объекта, мы спрашиваем, хочет ли он обсудить его. Он переходит к обсуждению, где под таким же изображением может оставить комментарий. Например, может написать: «Это очень мило». Или спросить: «А эта галактика — спиральная?» — если он не уверен. Или уточнить: «Там в углу стоит слон?». А может, заметить: «Интересно, почему у этого слона на спине три птицы?»

Этой платформой пользуются все участники системы, так что учёные могут отвечать на вопросы пользователей. Также можно посмотреть все комментарии, которые кто-то ранее оставлял к изображению. Если вы заметили что-то странное, а вместе с вами эту же странность нашли ещё 25 человек, можете начать обсуждение. Таким образом и происходят необычные открытия.

— А вы модерируете форум сообщества? Или учёные слишком заняты, чтобы отслеживать обсуждения?

— Мы позволяем волонтёрам заявлять о своём желании стать модераторами. Когда открывается новый проект, учёные выбирают модераторов. Дальше проект заботится о себе сам. Учёные отвечают на вопросы, если они не слишком перегружены. Зачастую целые группы учёных стремятся помочь людям.

Сотни добровольцев, преданных проекту, считаются авторами научных исследований, потому что посвятили им огромное количество времени и познакомились с учёными.

Учёные стараются узнать как можно больше об активных участниках проекта, которые снова и снова возвращаются к исследованиям. Учёные могут обратиться к добровольцам за особой помощью. Например, спросить: «Я веду проект по поиску червей на океанском дне, если увидишь что-то по этой теме, можешь отметить хэштегом?». Это второй уровень развития науки, основанный на отношениях, построенных на базе нашей платформы.

Всегда найдутся заинтересованные в помощи люди. И прекрасно, что мы можем оторвать людей от пустой траты времени на игры в интернете, привлекая их к исследованиям, так что они публикуются в научной периодике. Сотни добровольцев, преданных проекту, считаются авторами научных исследований, потому что посвятили им огромное количество времени и познакомились с учёными.

— К проекту может присоединиться кто угодно? Например, дети могут участвовать в нем?

— Да, я точно знаю, что одной из участниц, школьнице из Великобритании, увлеченно распределявшей по категориям миллионы галактик, на тот момент было 13 лет. Пару лет назад она приехала к нам на стажировку. Всё это получилось просто потому, что она узнала о нашем проекте. Участвовать может каждый, для регистрации нужно ввести только логин и адрес электронной почты, чтобы мы могли отследить людей, помогающих нам, и сформировать статистику.

— Кажется, люди посвящают огромное количество времени проектам Zooniverse. Вы противопоставили участие в исследованиях компьютерным играм. Но учёные заметили, что игры уменьшают стресс и боль. А есть ли что-то подобное в вашей системе? Какую награду получают волонтёры?

— На ранних стадиях развития проекта мы заметили то же самое. Почему кто-то тратит на это столько времени? Мы работаем с 2007 года. Первой задачей было распределение по категориям 900 000 галактик. Около 160 000 человек принимали участие в проекте, из них около 10 человек просмотрели и отсортировали все без исключения галактики. Они должны были затратить на это несколько месяцев, работая ежедневно. Но они это сделали! Мы удивлены, что люди вложили в проект столько усилий.

Мы опросили множество участников, предоставили им возможность давать разные ответы. Они могли ответить, что любят астрономию и интересуются Вселенной или что им нравится играть в игры. Но больше половины добровольцев говорили, что хотят способствовать развитию науки. Люди хотят быть полезными. Они принимают проект близко к сердцу и усердно работают, чтобы убедиться: Zooniverse старается повысить эффективность исследований, и каждый клик помогает науке.