Реферат: работа по биоинформатике
Московский Государственный Университет
им. М. В. Ломоносова
Факультет биоинженерии и биоинформатики
КУРСОВАЯ РАБОТА
ПО БИОИНФОРМАТИКЕ .
Тема: идентификация белка, исследование его аминокислотной последовательности и построение филогенетического древа гомологов .
Автор: Кочмак С.А.
202 группа.
e - mail : kochmak @ belozersky . msu . ru
Кураторы: Филиппов П.П. , Сесин И.И.
Отдел сигнальных систем клетки НИИ физико-химической биологии им.А.Н.Белозерского
II семестр 2002-2003 г.
III семестр 2003-2004 г.
Содержание
1.Введение 3
1.1 Семейство аннексинов 3
1.2 Постановка задачи 4
2.Материалы и методы 4
3.Результаты 5
3.1 Идентификация белка 5
3.2 Поиск консенсусных последовательностей 5
3.3 Построение филогенетического древа 7
4.Литература 9
1.Введение .
1.1 Семейство аннексинов. Аннексины ( от греч. Annex – связывать, удерживать вместе ) — общее название семейства кальций- и фосфолипидсвязывающих белков, образующих эволюционно консервативную группу с представителями, экспрессирующимися и в растительном и в животном царствах ( на сегодняшний день известно порядка 160 белков, относимых к этому семейству, и представленных в более чем 65 видах: от грибов и протистов до растений и высших позвоночных ). Структурно аннексины характеризуются наличием 4 доменов ( 8 в аннексине VI ), которые сходны друг с другом по своим первичным и вторичным структурам, образованы пятью a-цепями и расположены симметрично (Рис. 1 ).
Рис. 1. Аннексин IV
Многие из этих доменов были закристаллизованы, и их молекулярная структура помогла выявить некоторые интересные черты архитектуры Ca2+ связывающих сайтов и центральной гидрофильной поры ( которую образуют домены ), предположительно функционирующей в качестве кальциевого канала. Наряду с консервативными доменами, все аннексины содержат в N-концевой части уникальную последовательность, определяющую их индивидуальные свойства in vivo ( например, N-концевая часть аннексина II связывает белок р11 ).
Биохимически аннексины — хорошо растворимые белки, способные к Ca2+ зависимому связыванию с биомембранами, при повышении концентрации
кальция могут образовывать тримеры. Другими лигандами аннексинов являются S100 белки, цитоскелет-ассоциированные белки, нуклеиновые кислоты и углеводы, в частности гликозаминогликаны. Полностью биологическое значение неплохо описанного in vitro Ca2+ зависимого связывания с фосфолипидами в настоящее время не понято .
Физиологическая роль многих представителей данного семейства остается неясной: предполагаемые функции включают ингибирование свертывания крови ( в том числе предотвращение образования тромбов ), регуляцию активности фосфолипазы A2, участие в эндо- и экзоцитозе, взаимодействие с элементами цитоскелета. Аннексины A2, A5 и A6 участвуют в регуляции сердечной деятельности ( хорошо известна роль кальция для сердца ). В литературе сообщалось также о связи аннексинов с процессами клеточной пролиферации, дифференцировки и трансформации; для начальных стадий апоптоза характерно увеличение их концентрации.По последним данным, представители семейства аннексинов могут быть вовлечены в клеточный ответ на стресс: аннексин А1 может выступать в роли шаперона, предотвращая температурную инактивацию глутаматдегидрогеназы. Было показано, что некоторые цитостатики индуцируют в клетках немелкоклеточного рака легкого синтез аннексина IV, который начинает концентрироваться в ядрах этих клеток. Хотя аннексины и не содержат сигнальных последовательностей для секреции, некоторые из них были обнаружены вне клеток, где они могли ингибировать миграцию нейтрофилов, выполнять функцию рецепторов для некоторых протеаз в эндотелии. Функциональные свойства всех аннексинов обусловлены наличием Ca-связывающих участков. Наконец, нарушения экспрессии, активности или локализации представителей данного семейства предположительно коррелируют с некоторыми заболеваниями ( болезней человека, связанных с мутацией в гене аннексина, не описано ): промиелоцитарной лейкемией, различными аннексинопатиями. При различных лейкемиях, меланоме и раке простаты происходит изменение экспрессии генов аннексинов ( А5, А9 ) .
1.2 Постановка задачи . В предложенной задаче было необходимо :
1) Определить не идентифицированный белок, выделенный и очищенный из сетчатки глаз быка ( BOS TAURUS )
2) Найти консенсусные последовательности, указывающие на наличие в нем ковалентных модификаций
3) Осуществить поиск гомологов и построить филогенетическое древо .
По результатам масспектрометрического анализа данный белок
был идентифицирован как аннексин IV ( синонимы: липокортин IV, эндонексин I )(Авдеева О., 202 группа ). Это первый случай обнаружения аннексина IV в сетчатке глаза. Для подтверждения результата этот белок был подвергнут протеолитическому расщеплению; из полученного гидролизата методом высокоэффективной жидкостной хроматографии (ВЭЖХ) очищены до гомогенного состояния 2 полипептидных фрагмента; путем секвенирования этих фрагментов установлена их аминокислотная последовательность :
1)AAKGGTVKA ASGFNAA
2)DEVKFLTVLCSR NRNHLLHVFD
2.Материалы и методы .
Были использованы следующие программы :
1) Blast (http://cn.expasy.org/tools/blast) – для идентификации белка и поиска его гомологов .
2) Protdist, Bionj и DrawTree из пакета программ Phylip (http://bioweb.pasteur.fr) – построение филогенетического древа гомологов .
3) RasMol ( версия 2.7.2 ) – визуализация молекулы аннексина IV.
и банки :
1) SwissProt
2) Prosite (http://kr.expasy.org/prosite) для поиска консенсусных последо-
вательностей .
3.Результаты .
3.1 Идентификация белка . Наиболее близким гомологом оказался ANX4_BOVIN ( процент сходства = 100)(рис. 2). Другие белки (с меньшим процентом сходства ) также принадлежат семейству аннексинов.При этом пептид (1) точно совпадает с N-концевой частью ANX4 (которая является вариабельной и отличает каждый отдельно взятый представитель семейства). Пептид (2)- гомологичен всему семейству аннексинов т.к. входит в состав т.н. аннексин-подобных повторов, служащих для связывания двухвалентных ионов кальция .
Рис. 2
3.2 Поиск консенсусных последовательностей . (О посттрансляционных модификациях аннексинов известно давно ). В результате обнаружены сайты фосфорилирования двух типов, гликозилирования, миристилирования и 4 аннексиновых повтора ( см. приложение ). Необходимо отметить, что данные сайты могут являться случайными последовательностями. Наличие сайтов гликозилирования и миристилирования подтверждает, что аннексин IV может является мембранным белком (т.к. обычно гликозилированы мембранные, а не цитоплазматические белки и остаток миристиновой кислоты служит для заякоривания участков белка в билипидном слое ) ( Рис. 3 ) .
Рис. 3. Аннексин IV: красным цветом выделен I аннексиновый повтор, желтым — II, зеленым — III, синим – IV; черным – ионы кальция .
Для N-концевой части аннексина (взяты 1-30 аминокислоты до первого аннексинового повтора) теоретически возможны сайты: миристилирования и 2 сайта фосфорилирования для протеинкиназы С ( для полной активации которой требуется присутствие ионов Ca2+, диацилглицерола и связь с фосфолипидами внутренней поверхности плазматической мембраны, преимущественно с фосфатидилсерином ). Экспериментально известно, что,
по крайней мере in vitro, в аннексине IV фосфорилируется остаток треонина-6.
Консенсусные последовательности :
N-glycosylation site.
Prosite access number: PS00001
Prosite documentation access number: PDOC00001
N-{P}-[ST]-{P}.
Randomized probability: 5.138e-03 .
Site: 124 to 127 NQTY. Identity.
Site: 244 to 247 NKSA. Identity.
---------------------------------------------------------------------
Protein kinase C phosphorylation site.
Prosite access number: PS00005
Prosite documentation access number: PDOC00005
[ST]-x-[RK].
Randomized probability: 1.423e-02 .
Site: 6 to 8 TVK. Identity.
Site: 21 to 23 TLR. Identity.
Site: 222 to 224 SIK. Identity.
Site: 256 to 258 SMK. Identity.
---------------------------------------------------------------------
Casein kinase II phosphorylation site.
Prosite access number: PS00006
Prosite documentation access number: PDOC00006
[ST]-x(2)-[DE].
Randomized probability: 1.482e-02 .
Site: 31 to 34 TDED. Identity.
Site: 116 to 119 TPEE. Identity.
Site: 134 to 137 SLED. Identity.
Site: 230 to 233 SFED. Identity.
Site: 262 to 265 TDDD. Identity.
Site: 273 to 276 SRAE. Identity.
Site: 302 to 305 TSGD. Identity.
---------------------------------------------------------------------
N-myristoylation site.
Prosite access number: PS00008
Prosite documentation access number: PDOC00008
G-{EDRKHPFYW}-x(2)-[STAGCN]-{P}.
Randomized probability: 1.397e-02 .
Site: 5 to 10 GTVKAA. Identity.
Site: 102 to 107 GTDEGC. Identity.
---------------------------------------------------------------------
Annexins repeated domain signature.
Prosite access number: PS00223
Prosite documentation access number: PDOC00195
[TG]-[STV]-x(8)-[LIVMF]-x(2)-R-x(3)-[DEQNH]-x(7)-[IFY]-x(7)-[LIVMF]-x(3)-[LIVMF]
-x(11)-[LIVMFA]-x(2)-[LIVMF].
Randomized probability: 7.279e-08 .
Site: 30 to 82 GTDEDAIINVLAYRSTAQRQEIRTAYKTTIGRDLMDDLKSELSGNFEQVILGM. Identity.
Site: 102 to 154 GTDEGCLIEILASRTPEEIRRINQTYQLQYGRSLEDDIRSDTSFMFQRVLVSL. Identity.
Site: 186 to 238 GTDEVKFLTVLCSRNRNHLLHVFDEYKRIAQKDIEQSIKSETSGSFEDALLAI. Identity.
Site: 261 to 313 GTDDDTLIRVMVSRAEIDMLDIRANFKRLYGKSLYSFIKGDTSGDYRKVLLIL. Identity.
(Casein kinase II – активируется циклическими мононуклеотидами фосфорилирует серин или треонин ) .
3.3 Построение филогенетического древа . Получено около 60 гомологов, аминокислотная последовательность которых была выровнена ( при этом 2 последовательности, у которых отсутствовала большая часть консервативного участка, были удалены ) (Рис. 4).
.
Рис. 4. Филогенетическое древо гомологов аннексина IV .( HUMAN — Homo sapiens; MOUSE- Mus musculus; RAT — Rattus norvegicus; CAVCU — Cavia cutleri (Guinea pig); PIG — Sus scrofa (Pig); CHICK — Gallus gallus (Chicken); CANFA — Canis familiaris (Dog); BOVIN — Bos Taurus; RABIT- Oryctolagus cuniculus (Rabbit);
COLLI — Columba livia (Domestic pigeon); XENLA — Xenopus laevis (African clawed frog; DROME — Drosophila melanogaster; HYDAT — Hydra attenuate;; DICDI — Dictyostelium discoideum (Slime mold); RODSP — Rodentia sp; FRAAN — Fragaria ananassa (Strawberry); CYNPY — Cynops pyrrhogaster (Japanese common newt); GIALA — Giardia lamblia (Giardia intestinalis).
В процессе эволюции возникли механизмы, поддерживающие внутриклеточную концентрацию кальция на строго определенном уровне, т.к. кальций является одним из важнейших вторичных мессенджеров (концентрации других двухвалентных катионов, в первую очередь магния и цинка, внутри клетки могут в тысячи раз превышать коцентрацию кальция ), и, несомненно, один из таких механизмов реализируется семейством аннексинов. К числу простейших организмов, в которых экспрессируются аннексины, относятся Giardia lamblia и Neurospora crassa, Hydra vulgaris и Dictyostelium discoideum.В настоящее время аннексины D. discoideum и N. сrassa считаются ортологами (их аминокислотные последовательности схожи на 40 % ). Вторая важнейшая группа аннексинов была описана в растениях. Аннексины растений характеризуются отсутствием вариабельной N-концевой части и Ca2+ связывающих сайтов во II и III повторах (по крайней мере в современных цветковых растениях ), что свидетельствует о различных путях эволюции аннексинов растений и животных. Аннексин из Arabidopsis thaliana обладает каталазной активностью, у аннексинов животных ферментативной активности вообще не обнаружено. Аннексины растений и беспозвоночных не имеют ортологов у млекопитающих. Аннексин А13 позвоночных рассматривается в качестве предшественника аннексина А7, А7 – аннексина А11. Анализ структуры гена аннексина А11 привел к выводу, что последний является общим предком 9 аннексинов ( А1, А2, А3, А4, А5, А6, А8, А9и А10 ). Консервативность двенадцати аннексинов млекопитающих в течение 100 миллионов лет еще раз подчеркивает их важную физиологическую роль .
4.Литература .
1) Gerke V., Моss SE. Annexins: From Structure to Function. Phisiol Rev 82 :
331-371,2002 .
2) Zanotty G., Malpeli G., Gliubich F., Folli C., Stoppini M., Olivi L., Savoia A.,
Berni R. Structure of the trigonal crystal form of bovine annexin IV. Biochem. J.
329: 101-106, 1998 .
3) Iglesias J., Morgan R., Jenkins N., Copeland N., Gilbert D., Fernandez M.
Comparative Genetics and Evolution of Annexin A13 as the founder Gene of Verterbrate Annexins .Mol. Biol. Evol.19(5):608-618, 2002 .