Вы находитесь здесь: distributed.ru » Проекты распределённых вычислений » SIMAP
SIMAP
SIMilarity MAtrix of Proteins — BOINC-проект распределенных вычислений, поддерживающий в актуальном состоянии общественную базу данных сходств аминокислотных последовательностей белков. Использование всей информации, накопленной и обработанной с помощью SIMAP, абсолютно бесплатно и открыто для образовательных целей и публичных исследований.
SIMAP — совместный проект Национального исследовательского центра окружающей среды и здоровья в Нойерберге (GSF National Research Center for Environment and Health, Neuherberg) под Мюнхеном, Технического университета Мюнхена (Technical University Munich) и Научного центра жизни и питания в Вайенстефане (Center of Life and Food Science Weihenstephan) (Германия).
Белки (протеины) — универсальные «кирпичики» жизни, которые состоят из соединенных в последовательную цепочку аминокислот — аминокислотных последовательностей. Белки выполняют множество биологических функций, а изучение структуры белков (пространственной организации белковых молекул) дает ключ к пониманию механизмов их работы, является основой для разработки эффективных и безопасных лекарств.
Определить структуру всех белков экспериментальным путем (рентгеноструктурный анализ, спектроскопия ядерного магнитного резонанса) — задача слишком сложная и дорогостоящая. Число экспериментально определенных белковых структур пока не превышает 2% от общего числа важных белков. Поэтому, когда необходимо узнать структуру неизвестного белка, специалисты часто прибегают к теоретическому способу — построению молекулярной пространственной модели белка.
Моделирование на основе гомологии (сходства) белков — один из центральных методов предсказания пространственной структуры белка, основанный на «правиле 30%»: если аминокислотные последовательности двух белков (неизвестного белка и шаблона с известной структурой) совпадают более чем на 30%, то белки вероятнее всего родственны и имеют общие пространственные структуры. Статистика такова, что с помощью моделирования на основе гомологии удалось построить реалистичные модели для более половины всех белков с неизвестной структурой.
В настоящее время известны 3500 структурных семейств белков, образующих около 1000 типов пространственной укладки. Степень родства неизвестного белка к шаблонному белку, а значит и качество получаемой модели, определяется степенью идентичности аминокислотных последовательностей белков. Расшифровывать такие последовательности научились быстро, качественно и недорого. Поток информации о новых аминокислотных последовательностях растет из года в год, пополняя многочисленные базы данных, доступные специалистам. Например, число последовательностей в базе TrEMBL (версия 39.9) превышает 7.3 миллиона.
Проект SIMAP не просто накапливает данные об аминокислотных последовательностях белков. В матрице сходств SIMAP вычисляется степень родства новых последовательностей с уже существующими в базе белками. Это дает ценную информацию для проведения ряда биоинформационных исследований. Такие проекты, как Folding@home, Rosetta@home или Docking@home — являются в той или иной форме «потребителями» результатов работы подобных SIMAP баз данных.
Матрица сходств SIMAP постоянно расширяется за счет обработки новых последовательностей, получаемых из других общественных баз данных. Это создает все более значительную вычислительную нагрузку на проект, которому уже не справиться с этим за счет только внутренних ресурсов. Поэтому специалисты SIMAP обратились за помощью к участникам проектов распределенных вычислений: был создан SIMAP-клиент для платформы BOINC, реализованный на основе алгоритма FASTA, который находит идентичные участки аминокислотных последовательностей.
Подключение к проекту SIMAP
Вы тоже можете присоединиться к участию в SIMAP. Для этого скачайте последнюю версию BOINC-менеджера — это универсальная программа для участия в распределенных вычислениях. Установите BOINC: инструкцию как это сделать вы найдете в этом разделе. Запустите BOINC и войдите в режим Advanced View. Найдите в меню «Сервис» пункт «Добавить проект». В появившемся окне «Выбор проекта» отыщите SIMAP в перечне проектов или скопируйте в поле «Адрес (URL)» следующую ссылку: http://boinc.bio.wzw.tum.de/boincsimap/ После этого BOINC предложит вам создать учетную запись — введите адрес своего работающего электронного ящика и пароль. Пойдет загрузка файлов проекта, а по ее завершении начнутся вычисления. Поздравляем с присоединением к проекту SIMAP!
Не забудьте потом посетитьсвою учетную запись и стать участником одной из команд. Если у вас возникнут вопросы, то зарегистрируйтесь на нашем форуме и задайте их.