Twoja wyszukiwarka

MAGDALENA FIKUS
WITAMY W ERZE POSTGENOMOWEJ
Wiedza i Życie nr 4/2001
Artykuł pochodzi z "Wiedzy i Życia" nr 4/2001

Wielu sądziło, że wiedzę o mechanizmach rządzących życiem da nam rozszyfrowanie budowy genów. Tymczasem dopiero znajomość ich produktów - białek może być kluczem do rozwiązania zagadki. Ich poznawanie może jednak zająć dziesiątki lat.

Koniec XX wieku przyniósł poznanie genomów (zestawu wszystkich genów) kilkudziesięciu bakterii i kilku organizmów wyższych. Na przełomie wieków ogłoszono sekwencję DNA człowieka. W różnych porozrzucanych po świecie bazach danych gromadzi się informacje o DNA i kodowanych przez niego białkach. Genomika, nowa gałąź nauki, stawia sobie za cel uogólnianie wiedzy o budowie genomów, poszukiwanie w niej reguł i wyjątków, śledzenie historycznego rozwoju różnych życiowych procesów, ślepych i udanych dróg ewolucji, pojawiania się nowych funkcji organizmu. Porównywanie genów w obrębie tego samego i różnych gatunków umożliwia nowe spojrzenie na ewolucję. W materiale genetycznym współczesnych organizmów ukryta jest długa opowieść o życiu na Ziemi. Można wręcz mówić o molekularnych wykopaliskach. Są one tym cenniejsze, im mniej można zebrać danych ze znalezisk paleontologów. Dzięki genetyce poprawia się dziś gałązki drzew ewolucyjnych, znajduje nieoczekiwane pokrewieństwa między gatunkami. Analizując genomy, można prześledzić historię wybranego gatunku. Badania genetyczne ludności europejskiej sugerują na przykład 5 wielkich przemieszczeń ludów zarówno wzdłuż południków, jak i równoleżników.

Z porównywania DNA różnych organizmów wynika, że niektóre geny można znaleźć zarówno w genomie człowieka, jak i muszki owocowej czy rośliny rzodkiewnika. Nazywa się je genami ortologicznymi, czyli takimi, które miały kiedyś wspólnego przodka. Te wspólne elementy, pieczołowicie konserwowane przez ewolucję, często odpowiadają za koordynację najważniejszych dla życia komórki procesów. Ponieważ kod genetyczny jest uniwersalny, to podobnie zbudowane geny kodują podobne białka. Zwykło się też uważać, że podobna budowa wiąże się z pełnieniem podobnej funkcji. Analiza całych genomów wskazuje jednak na odstępstwa od tych reguł. U nicienia znaleziono np. kilka genów ortologicznych biorących udział w formowaniu oczu u bardziej złożonych organizmów. A nicienie oczu nie mają... Ludzkie geny - np. p53, odpowiedzialny za powstawanie nowotworów, czy Parkin - związany z chorobami neurodegradacyjnymi, mają swoich bliskich krewnych w DNA muchy. Nic jednak nie wskazuje, by owady cierpiały na te choroby.

Z badań różnych genomów dowiedziano się także, że w DNA danego gatunku mogą znajdować się duże rodziny podobnych do siebie genów, które nazwano paralogami. Pozwalają one lepiej przystosować się do zmieniających się wymagań środowiska. Szczególnie duże rodziny nieznacznie różniących się między sobą genów znajdują się w roślinach. Cecha ta ułatwia tym osiadłym organizmom przeżycie w razie zmian w otaczającym je świecie. W takiej sytuacji wytwarzanie nieco zmienionego białka na podstawie informacji pochodzącej z genu innego niż dotychczas może się okazać zbawienne.

Bez bioinformatyki ani rusz

Badania całych genomów wymagały ulepszenia wielu technik laboratoryjnych, bez których nie byłoby "klasycznej" inżynierii genetycznej: klonowanie genów, sterowana mutageneza, reakcja łańcuchowa polimerazy (PCR) [patrz: "Odkrywanie przeznaczenia", WiŻ nr 10/2000], sekwencjonowanie DNA wszystkie te procesy stopniowo automatyzowano. Udoskonalenia procedury pozwoliły na przyspieszenie uzyskiwania pierwotnych, "nieobrobionych" danych: oznaczenie sekwencji pojedynczego genu z kilku dni skróciło się do kilkunastu minut. Jednak końcowa obróbka informacji potrwać może jeszcze długie miesiące. Nie można przy tym zbudować całej wiedzy genetycznej, posługując się wyłącznie komputerami; ręce ludzkie wspomagane instrumentami przydadzą się także w XXI wieku.

Poszukiwanie charakterystycznych odcinków DNA, a także wszystkie analizy porównawcze są dziś niemożliwe bez sięgania do wielkich międzynarodowych baz danych i stosowania różnych programów analitycznych. Kto korzysta z nowocześniejszego oprogramowania, ten szybciej ma wyniki. Po raz pierwszy przekonano się o tym boleśnie w laboratoriach publicznych sekwencjonujących genom pałeczki okrężnicy - Escherichia coli. Laboratoria te zostały bez trudu wyprzedzone przez prywatną firmę TIGR, w której zastosowano najnowsze programy obróbki danych. Firma Celera, która "wypączkowała" z TIGR, omal nie ogłosiła pierwsza zakończenia prac nad budową genomu człowieka, programu prowadzonego od połowy lat osiemdziesiątych przez kilka laboratoriów sektora publicznego na całym świecie. "Prywatni" genetycy korzystali po prostu masowo z supernowoczesnych, zautomatyzowanych urządzeń do analizy DNA [patrz: "Oto człowiek!"] i komputerów o potężnej mocy obliczeniowej.

Bez baz danych i bioinformatyków niemożliwe byłyby też jakiekolwiek analizy całych genomów, ich struktury, odnalezienie sekwencji kodujących białka. W komputerach kreśli się ewolucyjne drzewa genów, poszukuje wspólnych przodków już nie organizmów, ale pojedynczych fragmentów DNA, znajduje i analizuje wzajemne położenie podobnych genów w różnych genomach. Bez komputerów nie obejdzie się także w nowych gałęziach biologii molekularnej: transkryptomice i proteomice.

Transkryptomika, czyli: geny to tylko początek

Informacja genetyczna jest wykorzystywana dzięki dwu procesom, których szczegóły zaczęto poznawać w końcu lat pięćdziesiątych. Pierwszym z nich jest transkrypcja - przepisanie treści genu na RNA. Przypomina to nieco wykonywanie kserokopii na podstawie oryginału: komórka, w odpowiedzi na konkretną potrzebę, może wytworzyć różną liczbę cząsteczek danego RNA, w zależności od swojego wieku albo stanu zdrowia. Drugi proces to translacja, czyli synteza białek w oparciu o matrycę RNA. Produktem translacji są białka. Nie wszystkie geny w naszym DNA są jednak zawsze aktywne. Posługując się odpowiednim oprogramowaniem, można przewidzieć, jaki będzie produkt znanego nam genu. Zazwyczaj taki zestaw RNA i białek może rzeczywiście powstać. Może, ale nie musi. Analiza rozszyfrowanego genomu prezentuje bowiem jedynie potencjalne geny, nie przesądzając o ich rzeczywistej aktywności. Trzeba dopiero udowodnić doświadczalnie, że taki potencjalny gen ulega transkrypcji i translacji. Komórki "wybierają" geny, które powinny być uruchomione w danym momencie, stosując do tego celu pewne "włączniki" i "wyłączniki". Tę rolę pełnią często tzw. białka regulatorowe i to prawdopodobnie ich różnorodność, a nie liczba genów, jest jedną z przyczyn zawędrowania człowieka na szczyty drabiny ewolucyjnej.

Biochemicy i genetycy od wielu lat, w wyniku żmudnych doświadczeń, uzyskiwali dane o aktywności pojedynczych genów. Dopiero wynaleziona w ostatnim dziesięcioleciu metoda, nazwaną metodą mikroukładów DNA lub DNA-chipów pozwala na bardzo szybkie badanie aktywności wielu genów jednocześnie [patrz: "Genetyczny mikroprocesor", WiŻ nr 2/2000].

Niestety, doświadczalne badanie transkryptomów - czyli zestawów wszystkich wytwarzanych przez komórkę typów RNA, nadal nie daje pewnej odpowiedzi na pytanie, ile i jakie białka są produkowane w wybranym momencie. RNA ulega w komórkach rozpadowi i proces ten, w odniesieniu nawet do takich samych cząsteczek, może przebiegać z różną prędkością, w zależności od warunków otoczenia. Po genomice i transkryptomice przyszedł więc czas na omówienie trzeciego pola badań genetyków XXI wieku proteomiki. Dopiero bowiem zestaw białek decyduje naprawdę o sytuacji życiowej organizmu.

Marilyn Monroe czy Jan Kowalski

Zrozumienie, w jaki sposób 10 mln nukleotydów przekształca się w żywą komórkę drożdżową, a 3 mld inaczej ułożonych nukleotydów w "boską Marilyn", wymaga przypisania genom funkcji. To z kolei oznacza konieczność zrozumienia roli i sposobu działania białek, kodowanych przez te geny. Przed tym właśnie zadaniem stanęli obecnie genetycy, którzy muszą namówić do współpracy biochemików, fizjologów, chemików, fizyków, matematyków i informatyków. Powstaje nowa dziedzina wiedzy - nazwana proteomiką. Zajmuje się ona całościową analizą wytwarzanych przez organizm białek i relacjami pomiędzy nimi. Ta nowa gałąź nauki stanowi dla badaczy jeszcze większe wyzwanie niż genomika, ponieważ białek jest więcej niż genów. Skąd ta rozbieżność? Otóż ten sam fragment DNA może kodować kilka, a nawet kilkadziesiąt różnych białek.

Jak rozszyfrować nieznane białko?

Białka zazwyczaj łączą się w grupy do wykonywania określonych zadań. Jeżeli nieznane białko człowieka wchodzi np. w skład zgrupowania białek dokonu-jącego obróbki RNA w innym organizmie, to z dużą dozą prawdopodobieństwa będzie pełniło podobną rolę w komórkach ludzkich. W tak złożonych oznaczeniach konieczne jest opracowanie nowych metod badawczych i udoskonalanie już znanych, co uważa się dziś w proteomice za problem numer jeden. Do kompleksowych badań zespołów białek używa się obecnie technik dwuwymiarowej elektroforezy, chromatografii cieczowej o wysokiej rozdzielczości i spektrometrów masowych. W tych ostatnich pokładane są największe nadzieje. Istnieją już "kombajny" sprzężone z międzynarodowymi bazami danych, łączące wszystkie te techniki. Są one jeszcze niedoskonałe i bardzo drogie (kosztują powyżej 1 mln dolarów).

Na pytania postawione przez genetykę minionego stulecia będą odpowiadały wspólnie w XXI wieku genomika, transkryptomika i proteomika. Jednak odpowiadając na jedno pytanie, zwykle kreuje się znaczną liczbę nowych. Czy jednak będziemy wiedzieć wszystko o życiu, gdy już opiszemy wszystkie cząsteczki znanych nam organizmów i ich oddziaływania?

Jak z jednego genu może powstać wiele białek?

Porównanie niektórych znanych genów

Organizm wielkość genomu (w mln nukleotydów) rok zakończenia sekwencjonowania szacunkowa liczba genów
Bakteria (H. influenzae) 1,8 1995 1740
Drożdże (S. cerevisiae) 12,1 1996 6034
Nicień (C. elegans) 97 1998 19 099
Roślina - rzodkiewnik (A. thaliana) 100 2000 25 000
Muszka owocowa (D. melanogaster) 180 2000 13 061
Mysz (M. musculus) 3000 - nieznana
Człowiek (H. sapiens) 3000 - 30 000-40 000