Биоинформатика: геном уникальности
Новосибирская компания «Новые Программные Системы», созданная студентами, успешно разрабатывает интеллектуальное программное обеспечение для зарубежных исследовательских институтов и фармацевтических компаний.
В 2003 году студент-математик Евгений Черемушкин, помимо горного туризма увлекающийся программированием, собрал группу разработчиков программного обеспечения и организовал компанию Biorainbow. Основное направление деятельности – биоинформатика. Прицел на крупные проекты оказался оправданным. Компания работает с Гарвардом (Harvard School of Public Health), Вашингтоном (Институт Джорджа Вашингтона), основной партнер – германская компания Biobase GmbH, мировой лидер по поставкам баз данных регуляции генов.
Начиналась деятельность компании с небольших грантов, реализуемых совместно с Александром Келем, бывшим научным руководителем нескольких студентов – сотрудников Biorainbow, видным профессионалом в биоинформатике, в то время уже ставшим вице-президентом по науке компании Biobase. Потом появились полноценные контракты от Biobase на разработку программного обеспечения для пользователей биологических баз данных, произведенных этой компанией.
Сегодня компания едва успевает выполнять все заказы. С момента образования доходы увеличиваются на 50–70% ежегодно. В 2005 году Biorainbow стала лауреатом программы «Старт» Фонда содействия развитию малых форм предприятий в научно-технической сфере (Фонд Бортника). В 2007-м компания была переименована в «Новые Программные Системы» (Novel Software Systems Company), что ознаменовало новый этап ее развития. «Мы перешли от группы разработчиков к профессиональной компании на рынке разработки программного обеспечения», – объясняет директор «Новых Программных Систем» Евгений Черемушкин.
Алгоритм управления
«Мы были студентами, без какого-либо опыта разработки, приходилось все осваивать с нуля», – начинает свою бизнес-стори Евгений Черемушкин. Юридическая сторона не составляла особых сложностей, главным вопросом была организация слаженной работы коллектива. В первый год постоянной головной болью оставалась текучка кадров. «Сначала состав очень сильно менялся. В 2003 году в разное время в команду входили от трех до восьми сотрудников. Потом мы наконец нашли квалифицированных специалистов, создали ядро команды – из четырех человек. Это было в 2004-м», – рассказывает Евгений Черемушкин. Сегодня из того состава в компании работают двое: сам Евгений и Татьяна Коновалова.
Однако решением кадрового вопроса все проблемы не исчерпывались. Программисты, разрабатывающие интеллектуальные программные системы, – выходцы из научной среды, амбициозные и высокопрофессиональные люди. И нужно было сделать так, чтобы в процессе разработки, с одной стороны, они могли самовыражаться, с другой – удовлетворять требованиям заказчика. Молодая компания смогла этого добиться.
Она использовала самые передовые на тот момент технологии. Более того, в Biorainbow был создан собственный метод разработки, объединяющий две технологии программирования: Extremе Programming и Microsoft Solutions Framework. Фактически это два разных набора правил, регламентирующих работу программиста. Из них начинающие биоинформатики создали свой. Комбинация получилась очень эффективной для разработки сложных интеллектуальных программных систем. Цель – добиться быстрого и качественного выполнения заказов – была достигнута.
Как правило, компания приглашает на работу студентов. Отбираются только самые лучшие, те, кто хочет связать свою жизнь с разработкой «интересного» программного обеспечения, в том числе связанного с наукой, те, кто способны научить компьютер «думать». А таких на местном рынке с каждым днем все меньше. Поэтому Biorainbow начинает реализовывать стратегию выращивания собственных кадров. Например, в этом году будет открыта летняя школа: три-четыре студента смогут пройти стажировку в компании.
«Каждый член нашей команды должен помимо профессиональных навыков иметь желание вести исследовательскую работу. Многие сотрудники – одновременно еще и ученые, у них есть желание делать интеллектуальный продукт», – говорит Евгений Черемушкин.
Сделано в Новосибирске
Последний крупный контракт компании «Новые Программные Системы» – с Институтом Джорджа Вашингтона. Получить столь значимого заказчика оказалось делом непростым – пришлось конкурировать с индийскими и китайскими компаниями. «Сейчас в развитых странах принято привлекать к разработке ПО более дешевых и не менее способных иностранных программистов. Западные фирмы работают по принципу аутсорсинга, то есть выносят производство за границу. Простой проект компания может отдать в Индию или Китай. Если же он требует большого интеллектуального труда, как в случае с биоинформатикой, то заказчик ищет более квалифицированного, но в то же время дешевого исполнителя. И тут Новосибирск выходит на первый план: он пользуется славой интеллектуального города, города ученых. Тезисы проходящих здесь конференций попадают в руки иностранцев. В Институте Джорджа Вашингтона о нашей компании узнали как раз из тезисов BGRS – Международной конференции по биоинформатике регуляции и структуры генома, традиционно проходящей в Академгородке», – рассказывает руководитель проекта Дмитрий Штокало.
Совместный проект «Новых Программных Систем» и Института Джорджа Вашингтона – больше исследовательский, нежели просто ориентированный на разработку нового программного обеспечения. Его суть – предсказание микро-РНК в геноме человека. По разным данным, от 95 до 97% последовательности нуклеотидов считается «бросовой», «мусорной» ДНК и не используется в создании человека. То есть 3–5% – это гены, а все остальное – непонятно что. Так некоторое время полагали ученые, сегодня они склоняются к мысли о том, что эти 95–97% могут выполнять другую очень важную функцию – регуляторную. В них могут быть закодированы не гены, а другие молекулы, которые назвали микро-РНК. Ученые всего мира надеются, что их исследование откроет много секретов. Новосибирские биоинформатики надежды тоже не теряют. «Институт Джорджа Вашингтона на базе нашей компании планирует создать исследовательскую группу. Это уникально, такого нигде в мире больше нет, – говорит Евгений Черемушкин. – Наш проект станет частью другого, более крупного, и в случае успеха перерастет в международную корпорацию».
Информатика с приставкой «био»
Ядро деятельности компании «Новые Программные Системы» – биоинформатика и новое направление исследований, использующее математические и алгоритмические методы для решения задач молекулярной биологии.
Историю биоинформатики можно вести с революционного открытия структуры ДНК англичанином Фрэнсисом Криком и американцем Джеймсом Уотсоном в 1953 году. Это событие совершило переворот в биологической науке. К открытию ученых побудили скорее практические, нежели чисто научные соображения, ведь знание о том, как функционирует каждый человеческий ген, понимание механизма кодирования и регуляции производства белков – это ключ к излечению всех известных в настоящее время заболеваний. «Поставляемую ДНК информацию можно использовать для того, чтобы разрабатывать лекарство более прицельно», – рассказывает Дмитрий Штокало и объясняет, какой вклад в разработку новых лекарственных препаратов вносит компания «Новые Программные Системы». – Мы предсказываем ключевые молекулы, на которые следует воздействовать, чтобы добиться определенного эффекта: выключить «плохой» ген или включить «хороший», предсказываем некоторые молекулярные механизмы в клетке, которые должны быть задействованы, чтобы вылечить болезнь».
Этапы создания программных систем в сфере биоинформатики – обработка баз данных, поиск идеи по использованию полученной информации и написание самого программного обеспечения.
Существует несколько типов баз данных. Архивные представляют собой большую свалку, куда любой может поместить все, что захочет, а потому в них встречается и немало ошибок. Другой тип баз данных – курируемые, за истинность которых отвечают хозяева. Содержимое заполняют эксперты, проверяя информацию на достоверность. К базам данных такого типа относится, например, Biobase, где собирается информация об известных регуляторных участках генома и путей передачи сигнала. Доступ к ней у «Новых Программных Систем» бесплатный, на основе партнерства.
Программное обеспечение, созданное компанией «Новые Программные Системы», продает также Biobase. «В основном мы пишем на заказ. Для Biobase мы разрабатываем ПО, начиненное алгоритмами для «умной» обработки тех баз данных, которые они поставляют своим клиентам. Наш продукт может использоваться научными институтами либо коммерческими фармацевтическими компаниями, которые занимаются поиском и разработкой лекарственных средств», – говорит Дмитрий Штокало. Средняя стоимость производимого «Новыми Программными Системами» продукта для компании Biobase (это целый пакет – программа вместе с базами данных) составляет порядка 50 тыс. долларов за копию.
Сделать то, не зная что
Главная задача «Новых Программных Систем» сегодня – поддерживать рост и заботиться о сохранении качества своих разработок. Последнее – «самая большая хитрость» во всем производстве. «Сначала ты должен узнать, что требуется заказчику, а потом убедить его в том, что то, что ты сделал, как раз то, что ему нужно», – пытается сформулировать профессиональную «хитрость» Евгений Черемушкин. «Зачастую между заказчиком и исполнителем возникает непонимание. Разработчик обычно делает не то, что нужно заказчику, потому что тот не всегда сам знает, что хочет получить. Эту проблему надо решать», – рассуждает Евгений, уверенный в том, что понять заказчика – это область ответственности руководителя проекта.
Как понять? Ответ есть. Начинать разработку ПО следует с технического задания. На этом этапе главное – осмыслить, как заказчик в целом видит то, что ему нужно. Обычное средство достижения цели – развернутая переписка. После программист должен быстро что-нибудь написать: макет, прототип – и показать заказчику. Тогда у последнего появляются идеи, обычно – много идей, на базе которых ведется планирование, а затем и разработка программы. Далее самое необходимое – как можно чаще (раз в две недели, раз в месяц) показывать заказчику то, что получилось, и согласовывать с ним все шаги.
Компания «Новые Программные Системы» за четыре года не провалила ни одного проекта. Конфликты были, но к компромиссу приходили всегда. Умение договориться – еще одно важное качество программиста. По бытующей же в ИТ-среде статистике, в мире проваливается каждый второй проект. Дмитрий Штокало объясняет: «Обычно причины неудачи лежат на первых стадиях: при планировании, при оценке. Написать программу – почти то же самое, что построить дом. Только еще сложнее, потому что ты не знаешь, сколько раз тебе придется «достраивать». Заказчик захочет, например, не три, а четыре балкона! Поэтому нужно предвидеть возможные желания и изначально разрабатывать программу так, чтобы можно было ее модифицировать».
Евгений Черемушкин
Родился 21 апреля 1980 года. В 2004 году окончил магистратуру механико-математического факультета Новосибирского государственного университета. С 2003 года – директор компании «Новые Программные Системы». Кандидат физико-математических наук. Имеет шестилетний опыт руководства проектами по разработке программного обеспечения. Опубликовал 30 научных работ. Компания «Новые Программные Системы» работает с 2003 года на базе Института систем информатики имени А.П. Ершова СО РАН. Занимается разработкой максимально полезного интеллектуального программного обеспечения. Специализируясь в области научных разработок, компания имеет опыт успешного сотрудничества с зарубежными компаниями и исследовательскими институтами (до 2006 года – под маркой Biorainbow).
Галина Казарина, «Эксперт Сибирь», 2 июля 2007