- 927
- 2023/04/27 - 11:30
- 45 بازدید
شرح فصل و نکات ویژه: در این فصل به پیشگویی ساختار RNA و شرح مواردی در مورد RNAها میپردازیم. پیشبینی، مدلسازی و ترسیم ساختارهای دوم RNA. پیشگویی ساختار فضایی RNA توسط سه روش قابل انجام است. در این فصل به معرفی ابزارها و بانکهای miRNAها نیز میپردازیم. 229-کار با RNA و پیشگویی ساختار آن و معرفی بانکهای miRNA برای دریافت نسخه چاپی و به روز کتاب با انتشارات دکتر خلیلی تماس بگیرید. 02166568621 از جمله[…]
شرح فصل و نکات ویژه:
- در این فصل به پیشگویی ساختار RNA و شرح مواردی در مورد RNAها میپردازیم.
- پیشبینی، مدلسازی و ترسیم ساختارهای دوم RNA.
- پیشگویی ساختار فضایی RNA توسط سه روش قابل انجام است.
- در این فصل به معرفی ابزارها و بانکهای miRNAها نیز میپردازیم.
229-کار با RNA و پیشگویی ساختار آن و معرفی بانکهای miRNA
برای دریافت نسخه چاپی و به روز کتاب با انتشارات دکتر خلیلی تماس بگیرید. 02166568621
از جمله مسائل مهمی که در زیستشناسی مولکولی ارائه شده است عبارتند از: تنظیم توالی، کشف ژن، گردآوری ژنوم، تنظیم ساختار پروتئین و RNA، پیشبینی ساختار پروتئین و RNA، پیشبینی عبارت ژن و تعاملات پروتئین- پروتئین و مدلسازی تکامل. در این بین، پیشبینی ساختار RNA از جمله مسائل جالب است که اخیرا بسیار مورد توجه قرار گرفته است. مولکول RNA از نظر زیستشناسی مولکولی مهم به شمار میآید. در واقع اطلاعات موجود در DNA، توسط این مولکول به پروتئین تبدیل میشود. یک مولکول RNA از نوکلئوتیدهای آدنین (A)، اوراسیل (U)، سیتوزین (C) و گوانین (G) ساخته شده است. ابتدا این نوکلئوتیدها با هم پیوند ایجاد کرده و تشکیل زنجیرهای میدهند که دو سر آن آزاد است، سپس نوکلئوتیدهای حاضر در زنجیره با هم پیوند هیدروژنی برقرار کرده و مولکول RNA یک ساختار فضایی به خود میگیرد که به ساختار دوم معروف است. این ساختار نحوه عملکرد مولکول را مشخص میکند و دانستن آن مساله بسیار مهمی در بیوانفورماتیک میباشد.
اولین تلاش برای پیشبینی ساختار دوم یک رشته RNA با دانستن دنباله نوکلئوتیدهایش، به سال 1978 باز میگردد. در آن زمان ناسینوف و همکارانش تلاش کردند تا به کمک یک الگوریتم برنامهریزی پویا ساختاری را بیابند که بیشترین زوجهای پیوندی را داشته باشد و در سال 1980 آن را بهبود بخشیدند. اما امروزه میدانیم ساختار طبیعی مولکول لزوما بیشترین تعداد پیوندهای ممکن را ندارد. بعد از آنها زوکر و استیگر نیز یک الگوریتم برنامهریزی پویا به نام mfold ارائه دادند که از یک مدل ترمودینامیکی برای پیوندهای هیدروژنی استفاده میکرد و با استفاده از این مدل، سطح انرژی مولکول را به پایینترین سطح ممکن میرساند.
استفاده از الگوریتمهای برنامهریزی پویا برای پیشبینی ساختار دوم RNA بسیار زمانبر میباشد، به خصوص زمانی که رشته مورد نظر طولانی باشد. برای حل این مشکل استفاده از الگوریتمهای بهینهسازی مانند الگوریتمهای ژنتیک، برای حل این مساله مورد توجه قرار گرفت. شاپیرو و ناوتا در سال 1944، بتنبورگ و همکارانش در سال 1995 و بندتی و موروستی نیز در سال 1995 از الگوریتمهای ژنتیک برای پیشبینی ساختار دوم RNA استفاده کردند. این الگوریتمها از مدلهای ترمودینامیکی سادهای برای اندازهگیری سطح انرژی مولکولها استفاده میکردند. در سال 2002 وایز و گلن الگوریتم RnaPredicae را ارائه کردند که یک الگوریتم ژنتیک بود و از مدل ترمودینامیکی پیچیدهای استفاده میکرد. در سال 2006 ماریس نیتلینگ و انگلبرت الگوریتم SetPSO را معرفی کردند. SetPSO میتواند برای مسائل بهینهسازی ترکیبی که فضای جستوجوی گسستهای دارند مناسب باشد.
1-11 ساختار اول RNA
برای RNA سه نوع ساختار تعریف شده است که به ترتیب ساختار اول، ساختار دوم و ساختار سوم نام دارند. هرکدام از این ساختارها بخشی از اطلاعات مولکول RNA را در برمیگیرند. ساختار اول یک رشته یک بعدی و ساده از حرف A، C، G و U است که به ترتیب حروف اول نوکلئوتیدهای آدنین، سیتوزین گوانین و اوراسیل میباشند. بنا به قرداد رشته RNA با ‘5 در سمت چپ رشته شروع شده و به ‘3 در سمت راست رشته ختم میشود. این ساختار فوق مولفههای سازنده مولکول را نشان میدهد و معمولا برای یافتن توالی ای خاص در رشته مورد استفاده قرار میگیرد.
تصویر 1-11: توالی یک RNA.
2-11 ساختار دوم RNA
ساختار دوم نشان دهنده جفتهای پیوندی است که بعد از فولد شدن رشته RNA به وجود میآیند. هر نوکلئوتید حداکثر میتواند با یک نوکلئوتید دیگر پیوند برقرار کند. در این نوشتار فرض بر آن است که تنها پیوندهای کانونی میتوانند تشکیل شوند، یعنی جفتهای واتسون کریک (CG و AU و همچنین معکوس آنها یعنی GC و UA) و جفت GU (و معکوس آن UG)، چراکه به وجود آمدن این جفتها بسیار محتملتر بوده و در مولکول RNA به وفور مشاهده شده است.
230-فصل یازدهم
میتوان گفت مساله پیشبینی ساختار دوم RNA، تشخیص این است که کدام پیوند در ساختار دوم شرکت میکند و کدام پیوند شرکت نمیکند. ویژگی مهم ساختار دوم این است که مولکول در این حالت دارای ثبات است، یعنی پیوندهایی در ساختار دوم ظاهر میشوند که بتوانند شکل مولکول را به حالت تعادل و ثبات در بیاورند.
1-2-11 مولفههای ساختار دوم RNA
نحوه چینش پیوند در کنار هم باعث به وجود آمدن مولفههای خاصی میشوند که عبارتند از حلقه داخلی[1]، حلقه هیرپین[2]، چند حلقه[3]، بالج[4]، رشتههای آویزان انتهایی[5] و استمها[6]. پیوندهای متوالی، پایداری ساختار را افزایش میدهند و به همین علت بسیار مهم میباشند، به این توالی پیوندها، استم یا هلیکس[7] میگویند. در تصویر 3-11 مولفهها مشخص شدهاند و در ادامه توضیح مختصری برای هرکدام ارائه شده است.
تصویر 2-11: مولفههای ساختار دوم RNA.
استم: چند جفت نوکلئوتید را که به صورت متوالی پیوند ایجاد کردهاند استم یا هلیکس مینامند. معمولا استمهای با طول بیشتر از پایداری بیشتری برخوردار هستند.
حلقه هیرپین: وقتی یک قسمتی از رشته RNA فولد شده و نواحی ابتدایی با نواحی انتهایی آن پیوند ایجاد کنند و قسمتهای میانی در هیچ پیوندی شرکت نکنند، این نوکلئوتیدها که در پیوندی شرکت نکردهاند تشکیل حلقه هیپرین میدهند.
حلقه داخلی و بالج: وقتی دو استم متوالی شکل بگیرد، نوکلئوتیدهای بین دو استم که در پیوندی شرکت نکردهاند تشکیل حلقه داخلی میدهند. وقتی نوکلئوتیدهایی که در پیوند شرکت نکردهاند تنها در یک سمت باشند، ناحیه ایجاد شده را بالج مینامند.
چند حلقه: به قسمتهایی از رشته RNA که به حداقل سه استم ختم میشوند چند حلقه گفته میشود.
تقاطع (سودونات): تقاطع یکی از مولفههای ساختار سوم RNA میباشد. این حالت در تمام مولکولهای RNA دیده نمیشوند (به تصویر 5-11 توجه کنید).
[1] Internal Loop
[2] Hairpin Loop
[3] Multi brahch
[4] Bulge
[5] Dangling ends
[6] Stem
[7] Helix
231-کار با RNA و پیشگویی ساختار آن و معرفی بانکهای miRNA
تقاطع (سودونات): تقاطع یکی از مولفههای ساختار سوم RNA میباشد. این حالت در تمام مولکولهای RNA دیده نمیشوند (به تصویر 5-11 توجه کنید).
2-2-11 نحوه نمایش ساختار دوم RNA
برای نشان دادن ساختار اول یک رشته RNA، دنبالهای از حروف که نمایانگر دنباله نوکلئوتیدهای رشته میباشند به کار میرود، اما برای نشان دادن ساختار دوم روشهای مختلفی وجود دارد از جمله نمایش پرانتز- نقطهای، نمایش فین من دایرهای، نمایش نمودار- نقطهای و نمایش ساختاری.
تصویر 3-11 : با روشهای مختلف ساختار دوم یک RNA نمایش داده شده است. تصویر بالایی با روش فین من خطی، تصویر وسط با روش فین من دایره ای و تصویر پایین با روش ساختاری نمایش داده شده است.
در تصویر 3-11، یک مولکول RNA به سه روش مختلف نمایش داده شده است. در این سه روش هر حرف نشان دهنده یک نوکلئوتید است و خطوط بین آنها نشان دهنده پیوندهای بین نوکلئوتیدها میباشند. در تصویر 4-11، نمایش ساختار دوم به روش نمودار نقطهای دیده میشود که در این روش هر زوج پیوندی با یک نقطه در سطر و ستون مربوط به نوکلئوتیدهایش مشخص شده است، همچنین در این شکل نمایش پرانتز نقطهای نیز مشخص شده است. در این روش دنباله RNA را از سمت ‘5 نوشته و در زیر آن دنبالهای از نقطه و پرانتز میگذارند که هر نقطه نشان دهنده نوکلئوتیدهای غیرپیوندی در رشته است و یک جفت پرانتز باز و بسته هم تشکیل یک زوج پیوندی را میدهند.
232-فصل یازدهم
3-11 ساختار سوم RNA
ساختار سوم نشان دهنده وضعیت مولکول RNA در فضای سه بعدی میباشد. در این حالت ممکن است نوکلئوتیدهایی از نقاط مختلف رشته با هم پیوند برقرار کنند. از جمله مولفههای ساختار سوم میتوان به کیسینگ هیرپین، بالج کانتکت و تقاطع اشاره کرد. مولفههای نام برده شده در تصویر 5-11 نشان داده شدهاند.
233-کار با RNA و پیشگویی ساختار آن و معرفی بانکهای miRNA
تصویر 5-11: مولفههای ساختار سوم. تصویر سمت راست مولفه hairpin loop bulge contact، تصویر وسط مولفه kissing hairpins و تصویر سمت چپ مولفه pseudoknot را نمایش میدهد.
4-11 مشخص کردن ساختار طبیعی مولکول RNA
پیدا کردن ساختار و ترکیب مولکولهای زیستی از اهمیت زیادی برخوردار است زیرا شکل مولکول مشخص کننده کارکرد و وظایف آن مولکول در بدن موجودات زنده میباشد. دانستن شکل این مولکولها و نحوه برهمکنش آنها بر هم در هنگام تولید ترکیبهای جدید برای مصارف دارویی و پزشکی بسیار لازم و سودمند میباشد.
یک پیشرفت بزرگ زیستشناسی در دههی 1970 شناسایی ساختارهای دو بعدی و سه بعدی RNA بود. هیجانانگیزترین مطلب دربارهی این ساختارها این است که آنها از قوانینی پیروی میکنند که بسیار آسانتر و قابل پیشبینیتر از قوانین مربوط به دنیای پروتئینها است. بسیاری از ساختارهای دوم کوتاه و بلند RNA همانند DNA از قانون استاندارد جفت شدن کریک و واتسون تبعیت میکنند.
تصویر 6-11: نمایش ساختار اول،دوم و سوم RNA.
ساختارهای دوم RNA تک رشتهای دقیقا همانند یک نوار چسب عمل میکند، این مولکول در صورتی پایدار است که تعدادی از بازهای آن که در معرض حلال هستند، از آب محافظت شوند. یک راه خوب برای حفاظت یک باز RNA از حلال، جفت شدن آن با یک باز دیگر RNA است. البته همهی ترکیبهای جفت بازی به یک اندازه قوی نیستند. برای نمونه جفت شدن گوانین با سیتوزین پایدارتر از جفت شدن آدنین با یوراسیل است.
234-فصل یازدهم
جفت شدن این بازها ساختار دوم RNA را میسازد. وقتی یک مولکول شامل دو رشتهی بلند مکمل باشد، یک ساقه (Stem) پایدار به وجود میآید. بازهای جفت نشده بین رشتههای ساقه، یک لوپ ایجاد میکنند. لازم نیست ساقهها کامل باشند بلکه میتوانند حاوی اعضای جفت نشده هم باشند.
تصویر 7-11: نمایش Helices، Loopsو Pseudoknots.
فرض ما بر این است که تمایل طبیعی مولکول RNA رسیدن به پایدارترین آرایش سه بعدی است که این کار را با روی هم قرار دادن مجموعهای مناسب از تداخلهای جفت بازی انجام میدهد. این مفهوم همان چیزی است که به عنوان مدل پایینترین سطح انرژی (lowest energy model) نامیده میشود. چنین ساختار RNA پایداری، همیشه یک ارزش انرژی منفی (مثل kcal/mol 70-( دارد. اگر بخواهید این ساختار را باز کنید باید مقداری انرژی (گرما) به کار ببرید. در مورد مولکول RNA هم مانند پروتئینها دقیقا نمیدانیم چگونه پایینترین سطح انرژی را به دست میآورد. اما میدانیم این اتفاق در سلول بسیار سریع رخ میدهد. پایداری تاخوردگی RNA به طور کامل وابسته به تعداد جفتهای GC آن نیست. پارامترهای زیادی مثل انباشتگی (stacking) جفت بازها (ایجاد ساقه پایدارتر از بقیهی ساختارها است) و اندازهی لوپها بر روی تاخوردگی موثرند. الگوریتمهای پیچیده (مثل آنچه که در برنامه mfold یافت میشود) میتوانند این اثرات ظریف را به هنگام محاسبهی یک تاخوردگی بهینه به حساب آورند.
همچنین تداخلهای سه بعدی در پایداری کلی دارای اهمیت هستند. این تداخلها شامل گرههای ساختگی یا pseudo-knotها میشوند که معمولا تداخلهای با فاصله دور بین لوپ و بقیهی قسمتهای مولکول RNA هستند. همچنین تداخلهای بین مولکول RNA با سایر عناصر شیمیایی مثل یونها، پروتئینها یا RNAهای دیگر نیز نقش مهمی در پایداری آن دارد. متاسفانه در پیشبینی تداخلهای سه بعدی مولکول RNA و اثر پروتئینها بر روی تاخوردگی مولکول RNA مشکلاتی داریم. بنابراین
235-کار با RNA و پیشگویی ساختار آن و معرفی بانکهای miRNA
وقتی ساختار دوم RNA مورد نظر را پیشبینی میکنید این پیشبینی معمولا وابسته به این فرض است که RNA در سلول به تنهایی تا خورده است. از آنجایی که این فرض تقریبا محال است، همیشه این احتمال وجود دارد که پیشبینی شما تا حدودی و یا کاملا نادرست باشد. قانون کلی این است که پایدارترین اشکال از نظر انرژی به طور منطقی به حقیقت نزدیک هستند.
اینکه یک RNA حاوی اطلاعات چه پروتئینی است که با این مولکول RNA ساخته خواهد شد کاملا به شکل فضایی آن مولکول وابسته است، در حقیقت کارکرد یک مولکول RNA را شکل فضایی آن تعیین میکند. شکل فضایی مولکول RNA را میتوان با روشهای آزمایشگاهی مانند ایکس- ری کریستالوگرافی یا NMR اسپکتروسکوپی مشخص کرد. روشهای آزمایشگاهی میتوانند شکل فضایی مولکول را با دقت بالایی نشان دهند اما علاوه بر پر هزینه بودن، زمان زیادی نیز باید صرف این کار کرد. بنابراین ترجیح بر این است که روشهای محاسباتیای یافت که بتوانند در عین سریع بودن با دقت بالایی ساختار دوم RNA را مشخص کنند.
تاکنون چهار رویکرد عمده محاسباتی برای حل این مساله ارائه شده است: 1. رویکرد مقایسهای، 2. رویکرد مینیممسازی سطح انرژی، 3. رویکرد استفاده از گرامرهای مستقل از متن و 4. رویکرد تلفیق پیشگویی کامپیوتری و روش آزمایشگاهی.
1-4-11 رویکرد مقایسهای
در حال حاضر مطمئنترین روش پیشبینی ساختار دوم RNA استفاده از رویکرد مقایسهایست. هرچند استفاده از این رویکرد تنها زمانی ممکن است که ساختار دوم حداقل یک رشته هم خانواده آن را داشته باشیم و این بزرگترین نقطه ضعف این رویکرد میباشد و باعث میشود همیشه نتوانیم از آن استفاده کنیم. رشتههای هم خانواده به رشتههایی گفته میشود که منشا و خاستگاه یکسانی دارند و تفاوتهای موجود در آنها زیاد نیست.
این روش اولین رویکردی بودکه برای حل این مساله ارائه شد. در این رویکرد، تعدادی رشته RNA هم خانواده که ساختار دوم بعضی از آنها مشخص است، همتراز شده و از نتیجه این همترازی برای تعیین ساختار دوم رشتههایی که ساختار دومشان مشخص نیست استفاده میشود. دلیل استفاده از چنین رویکردی این است که شکل فضایی مولکولهای RNA کارکردشان را تعیین میکند و طبق یکی از ویژگیهای طبیعت، معمولا ساختار حفظ میشود تا کارکرد تغییر نکند، یعنی در روند تکامل شکل فضایی این مولکولها حفظ شده است. به عنوان مثال احتمال دارد نوکلئوتیدهای یک مولکول RNA در طول نسلها بر اثر جهش و یا هر دلیل دیگری تغییر کند ولی اگر این تغییر در نوکلئوتیدها، ساختار فضایی آن را عوض نکند مشکلی در روند کلی کارکرد این مولکول RNA ایجاد نمیشود. دانشمندان با همین استدلال و با کمک گرفتن از ساختار دوم چند رشته که ساختار دومشان مشخص شده است و با تعیین میزان تشابه میان این رشتهها با رشتههایی که ساختار دوم آنها معلوم نیست، سعی میکنند ساختار دوم رشتههایی که ساختار دوم نامعلوم دارند را حدس بزنند.
236-فصل یازدهم
2-4-11 رویکرد مینیممسازی سطح انرژی
رویکرد بعدی، مینیممسازی سطح انرژی است که در آن از قوانین ترمودینامیکی حاکم بر مولکولها کمک گرفته میشود. همانطور که میدانیم هر مولکول در حالت عادی سعی میکند پیوندهای درون مولکولیای ایجاد کند که سطح انرژی خود را به پایینترین سطح ممکن برساند. با استفاده از همین نکته مدلهای مختلفی ارائه شده است. الگوریتمهایی که از این رویکرد بهره گرفتهاند سعی در پیدا کردن ساختاری دارند که انرژی کمتری دارند، الگوریتمهای ژنتیک از این جملهاند.
3-4-11 رویکرد گرامرهای مستقل از متن
رویکرد دیگر، کمک گرفتن از گرامرهای مستقل از متن است. در این رویکرد یک رشته RNA را به عنوان یک جمله از یک گرامر مستقل از متن در نظر میگیرند و با به دست آوردن اشتیاقهای مختلف آن، که نشان دهنده ساختارهای دوم متفاوت میباشد و محاسبه محتملترینشان ساختار دوم را به دست میآورند. به عنوان مثال فرض کنید گرامری به صورت زیر داشته باشیم:
در این گرامر S یک متغیر و a یک حرف است. در یک گرامر به روندی در آن با عملگرهای پی در پی، یک رشته از حروف آن گرامر تولید میشود اشتیاق گفته میشود. برای گرامرهای مستقل از متن، اشتیاق را میتوان با یک درخت اشتیاق نمایش داد. در این گرامر، عملگر نشان دهنده ایجاد یک چند حلقه است، عملگر نشان دهنده یک پیوند است و دیگر عملگرها نشان دهنده عناصری هستند که در پیوند شرکت نکردهاند. یک گرامر مستقل از متن تصادفی، گرامری است که به هر عملگر آن یک مقدار احتمال تخصیص داده شود. احتمال یک اشتیاق با ضرب کردن احتمال عملگرهایی که در آن اشتیاق استفاده شده محاسبه میشود. همانطور که میدانیم، در گرامرهای مبهم، یک رشته از حروف را میتوان با چندین اشتیاق به دست آورد. احتمال یک رشته از حروف تحت یک گرامر، حاصل جمع احتمال کل اشتیاقهایی است که آن رشته از حروف را تولید میکنند. برای یک رشته RNA، اشتیاقهای متفاوت ساختار دومهای متفاوت را نشان میدهند. در این مدل محتملترین اشتیاق نشان دهنده ساختار دومی است که به دنبال آن هستیم اما قبل از محاسبه محتملترین اشتیاق باید احتمال عملگرهای گرامر را محاسبه کرد که کار راحتی نیست و مهمترین نقطه ضعف این رویکرد میباشد.
237-کار با RNA و پیشگویی ساختار آن و معرفی بانکهای miRNA
4-4-11 رویکرد تلفیق پیشگویی کامپیوتری و روش آزمایشگاهی
در این روش معمولا نواحی تک رشته و دو رشته در RNA شناسایی میشوند و سپس توسط روشهای آزمایشگاهی مثلا برش توسط آنزیمهای مختلف که فقط RNA تک رشته و یا دو رشته را برش میدهند صحت نتیجه بدست آمده توسط کامپیوتر را در آزمایشگاه بررسی میکنند.
تصویر 10-11: رویکرد تلفیق پیشگویی کامپیوتری و روش آزمایشگاهی.
5-4-11 استفاده از mfold
Mfold اجرای الگوریتم Zuker است که پیشبینی ساختار دوم بهینه RNA از نظر سطح انرژی را امکانپذیر میکند. این برنامه مدل پیچیدهای است که بسیاری از مشخصات فیزیکی واقعی موثر در تاخوردگی RNA مثل pH، دما و ترکیب نوکلئوتیدی را به حساب میآورد.
به خاطر داشته باشید که مدل انرژی که mFold استفاده میکند از تداخلهای سه بعدی یا تداخلهای پروتئین- RNA که میتوانند تاخوردگی غیر بهینه را پایدار نمایند، صرفنظر میکند. همیشه این احتمال وجود دارد که یک پیشبینی با mFold، تاخوردگی صحیح زیستی RNA مورد نظر نباشد.
تصویر 11-11: پایگاه mfold.
238-فصل یازدهم
mFold به منظور کمک به تصمیمگیری شما، مدلهای غیر بهینه را نیز نمایش میدهد تا بتوانید دربارهی پایداری تاخوردگی بهینه قضاوت کنید. همچنین این امکان وجود دارد که mFold را مجبور کنید تا از یک تداخل درست تبعیت کند. تداخلهایی با فاصلهی دور را نمیتوانید به mFold تحمیل کنید. محدودیت طول رشته برای mFold 3000 باز است. این اندازه برای بیشتر RNAهای غیر رمزدهنده به غیر از انواع بزرگ ریبوزومی مناسب است.
تفسیر نتایج mFold
بعد از اینکه توالی مورد نظر را به mFold دادید، برنامه به جستوجوی آرایشهایی میپردازد که منجر به ساختارهای دوم با حداقل انرژی ممکن میشود. البته صحت این ساختار دوم بستگی به صحت مدل انرژی دارد؛ اگر مدل اشتباه باشد، ساختار هم اشتباه است.
قانون کلی این است که هر چه آرایش سه بعدی پیشبینی شده توسط mFold پایدارتر باشد، احتمال درست بودن این تداخل بیشتر خواهد بود. به منظور کمک به شما برای گرفتن ایدهای از ماهیت این پایداری ، صفحهی خروجی mFold چند نتیجهی مربوط به پایداری RNA مورد نظر را نمایش میدهد. در بین نتایج ارائه شده توسط نرمافزار باید به موارد زیر توجه بیشتری داشت:
ü The Energy Dot Plot: نمودار نقطهای ساقههایی را نشان میدهد که بخشی از تاخوردگی بهینه توالی مورد نظر هستند.
- تداخلهای با فاصله دور (جفتهایی که شامل نوکلئوتیدهای بسیار دور از هم میشوند) به شکل قطرهای نزدیک به گوشهی سمت راست در بالا (یا گوشهی سمت چپ در پایین) ظاهر میشوند.
- قطرهای رنگی، ساختارهای دوم غیر بهینه را نشان میدهند. محدودهی رنگی از قرمز (بهترین) تا زرد (بدترین) است.
ü The View Individual Structures: این بخش حاوی دادههای مربوط به ساختارهای متنوع محاسبه شده توسطmFold است. ساختار بهینه بالاترین ساختار است یعنی در لیست ارائه شده توسط نرمافزار در ردیف اول قرار دارد. این بخش همچنین انرژی آزاد ساختار مورد نظر را نشان میدهد. این انرژی باید تا حداقل ممکن پایین باشد. برای مولکولی که حدود 200 باز طول دارد، باید انرژی پایینتر از kcal 50- باشد که تاخوردگی گزارش شده قابل قبول باشد.
ü The Dot Plot Folding Comparisons: این بخش بسیار جالب امکان مقایسهی چندین تاخوردگی غیر بهینه را فراهم میکند. به منظور انجام این کار مراحل زیر را طی کنید:
1ـ jpg. را از منوی پایین روی Image Format انتخاب کنید.
2ـ از خط Compare Selected Foldings تمام ساختارهای جایگزینی را که میخواهید مقایسه کنید، انتخاب نمایید.
3ـ روی گزینه Do the Comparison کلیک میکنیم.
یک نمودار ظاهر میشود که این نمودار عناصر مشترک بین ساختارهای دوم پیشبینی شده با جایگزینهای غیر بهینهی انتخاب شده را نشان میدهد.
- عناصر رنگی فقط به ساقههای پیشبینی شده در ساختارهای دوم غیربهینه مربوط هستند.
- یافتن تشابه بالا بین ساختار بهینه و انواع غیربهینه احتمال صحیح بودن ساختار بهینه به لحاظ زیستی را بالا میبرد.
پیشبینیهایی که بر روی یک توالی منفرد انجام میدهید، میتواند نتایج جالبی را بدهد. به علت پدیدهی همبستگی (covariance phenomenon) زمانی که پیشبینی را براساس یک انطباق چندگانه انجام میدهید، نسبت به زمانی که پیشبینی را با یک توالی انجام میدهید، RNA در وضعیت بهتری قرار دارد.
متاسفانه برنامههای پیشبینی بر پایه انطباق چندگانه، به صورت رایگان در اینترنت موجود نیست. اما اگر شما آمادگی نصب چند نرمافزار روی کامپیوترتان را دارید (و کامپیوتر قدرتمندی هم استفاده میکنید)، میتوانید از یک نرمافزار با نام Cove استفاده کنید که از آدرس www.genetics.wustl.edu/eddy/software/#cove قابل دریافت است. همچنین میتوانید از روشهای موجود در آزمایشگاه روبین گوتل (Robin Gutell) در آدرس www.rna.icmb.utexas.edu استفاده نمایید که احتیاج به ثبت نام در سایت آن دارید.
239-کار با RNA و پیشگویی ساختار آن و معرفی بانکهای miRNA
اعمال تداخل در mFold
اگر شما دادههای تجربی دارید و میدانید که جفتبازهای خاصی در توالی RNA مورد نظر ایجاد میگردد، میتوانید این اطلاعات را در mFold اعمال نمایید. برای مثال میتوانید به mFold بگویید نوکلئوتیدهای 10، 11 و 12 به ترتیب با نوکلئوتیدهای 20، 21 و 22 تداخل میکنند. برای انجام این کار یک خط دستور در فرم تداخل mFold مینویسید که میگوید:
این دستور (F) یعنی یک تداخل را اعمال نمودهاید. این تداخل بایستی با نوکلئوتید 10 که با نوکلئوتید 22 جفت میشود، شروع گردد. همچنین این تداخل باید از شروع آن در ساقه تا 3 نوکلئوتید طول داشته باشد (نوکلئوتید 10 با 22 ، 11 با 21 و
12 با 20).
5-11 پایگاههای اطلاعاتی برای توالی RNA
1-5-11 جستوجو در پایگاههای اطلاعاتی و ژنومها برای توالی RNA
RNAهای غیر رمز کننده یک خانوادهی غنی را تشکیل میدهند که همواره اعضای جدیدی برای آنها کشف میشود. هر چه بیشتر به سازوکارهای اساسی حاکم در زندگی یک سلول پی میبریم، بیشتر متوجه میشویم که RNAهای غیر رمزکننده همه جا هستند. آنها به روندهای رونویسی، برش و اتصال (splicing)، همانندسازی و احتمالا بسیاری کارهای دیگر که ما هنوز از آنها آگاه نیستیم کمک میکنند. به نظر میرسد هر ساز و کار پایهای حیات به شدت به این RNAهای کوچک وابسته است.
متاسفانه به استثنای RNA ریبوزومی، RNAهای کوچک غیر رمزدهنده نسبتا کوتاه هستند و کمتر محافظت شده میباشند. بیشترین ویژگی مشترک آنها اغلب ساختار دوم آنها است. بنابراین پیدا کردن آنها با استفاده از روشهایی بر پایهی هومولوژی مشکل است. در ادامه روشهایی برای جستوجوی پایگاههای اطلاعاتی نه تنها براساس توالی RNAها، بلکه براساس اطلاعات مربوط به ساختارهای دوم معرفی میشوند. اگر از mFold برای پیشبینی تاخوردگی RNA استفاده کردهاید، حال میتوانید از این تاخوردگی برای جستوجوی اعضای جدید خانوادهی RNA مورد نظر بهره جویید. ابتدا در این قسمت چگونگی استفاده از tRNAscan را برای جستوجوی (فقط) tRNA شرح میدهیم. همچنین PatScan را معرفی میکنیم که روشی برای جستوجوی RNAها با ساختار دوم مورد نظر است.
2-5-11 جستوجوی tRNA در یک ژنوم
tRNAها، RNAهای غیر رمز کنندهی کوچکی هستند که سلول آنها را برای ساختن پروتئینها به کار میبرد. tRNAها یکی از بهترین نمونههای ژنهای غیر رمز دهنده با اهمیت هستند که تعیین موقعیت آنها در ژنوم مشکل میباشد. همهی باکتریها و ژنومهای یوکاریوتی tRNA دارند. متاسفانه شناسایی این ژنهای همه جا حاضر همانند RNA غیر رمز دهنده مشکل میباشد. برای شناسایی آنها روشهای بسیار پیچیدهتری از جستوجوی پایگاههای اطلاعاتی موجود مثل BLAST نیاز میباشد. تعدادی برنامهی بسیار دقیق برای پیشبینی ژنهای tRNA در یک ژنوم یوکاریوتی یا پروکاریوتی وجود دارد. یکی از پیشرفتهترین روشها را میتوانید در سایت دانشگاه واشنگتن به آدرس selab.janelia.org/tRNAscan-SE/ پیدا کنید.
240-فصل یازدهم
3-5-11 استفاده از PatScan برای جستوجوی الگوهای RNA
اگر فقط دنبال جستوجوی tRNA باشید، tRNAscan برنامهی کاملی است. با این حال اگر علاقهمند به یک خانوادهی RNA خاصی هستید و میخواهید از یک ابزار عمومیتر استفاده کنید که قادر باشید از دانش خود دربارهی ساختار دوم خانوادهی RNA مورد نظرتان هم بهره ببرید، PatScan برای این کار ایدهال خواهد بود.
4-5-11 RNA ریبوزومی
اگر برای مطالعهی تکامل نیاز به ژنی دارید که در همهی موجودات زنده وجود داشته باشد در این صورت میتوانید سرعت تکامل این موجودات را مقایسه کنید. زیستشناسان سالهای زیادی RNA ریبوزومی را به این منظور استفاده میکردند. دانشمندان زمانی که یک باکتری جدید پیدا میکنند، اولین چیزی که انجام میدهند، تعیین توالی RNA ریبوزومی آن است. در نتیجه میتوانید ببینید این باکتری در کجای درخت بزرگ فیلوژنی قرار دارد. آزمایشگاههای زیادی تمام تلاش خود را به منظور کمک به جامعهی علمی برای استفاده از توالیهای RNA اختصاص دادهاند. جدول 1-11 تعدادی از مشهورترین منابع مربوط را فهرست کرده است.
جدول 1-11: منابع توالی RNA ریبوزومی.
5-5-11 پیدا نمودن RNA غیر رمزکننده کوچک
RNAهای کوچک غیر رمزکننده کمتر در دیتا بیسهای اصلی ارایه شدهاند خوشبختانه پایگاههای جایگزین خوبی این امکان را فراهم کردهاند که به ژنهای مورد نظر دسترسی داشته باشید. در جدول زیر فهرست بخشی از این منابع آمده است.
جدول 2-11: منابع توالیهای RNA غیر رمز کننده.
6-5-11 منابع عمومی RNA
منابع عمومی RNA که معمولا به روز هستند برطرف کردن نیاز محققین را آسان کرده اند. در این لینکهای فهرست شده، میتوانید پایگاههای اطلاعاتی، نرمافزار و ارایهدهندههای شبکهای را بیابید.
جدول 3-11: منابع عمومی RNA.
241-کار با RNA و پیشگویی ساختار آن و معرفی بانکهای miRNA
6-11 miRNA و siRNA
یکی از کشفیات حیرتآور زیستشناسی در طول سالهای اخیر پدیدهای به نام تداخل RNA (RNAi یاRNA interference )
در سلولهای یوکاریوتی بود. این پدیده امکان تداخل مولکولهای کوچک RNA غیررمزدهندهی کوتاه با یک RNA رمزدهندهی بزرگتر را مطرح میکند که مانع بیان ژن مربوطه میشود. این تداخل از طریق اتصال ناشی از مکمل شدن بین RNA کوچک و بلند ایجاد میشود. به همین دلیل برخی مواقع RNAهای کوچک آنتیسنس (antisense) نامیده میشوند. در حالی که امکان تداخل RNA برای مدتها در آزمایشگاه شناخته شده بود، کشف این موضوع که طبیعت از آن به طور وسیع استفاده میکند برای همه حیرتآور مینمود. از آن زمان به بعد RNAهای کوتاه طبیعی که میتوانند ژنها را غیرفعال نمایند، در همهجا پیدا شدند. آنها اولینبار در گیاهان یافت شده و RNAهای خاموشکننده (RNAi یاsilencing RNAs ) نام گرفتند زیرا توانایی غیر فعال نمودن (خاموش کردن) ژنها را داشتند. این siRNAها محدود به گیاهان نمیشوند و هماکنون دانشمندان آنها را در اکثر سلولهای یوکاریوتی یافتهاند.
زیستشناسان هنگام جستوجو برای siRNAها موفق به پیدا نمودن RNAهای ناشناختهی کوچک دیگری شدند. زیستشناسان به آنها نام عمومی میکرو RNA (miRNA یا micro-RNA) دادند. در واقع هنوز به طور کامل هیچکس نمیداند miRNA در داخل سلول چه کاری را انجام میدهند. اگر چه دانشمندان بیان میکنند که آنها احتمالا ژنها را تنظیم میکنند. مشکل مهمتر این است که، نه تنها نمیدانیم آنها دقیقا چه کاری انجام میدهند بلکه حتی نمیدانیم چه تعداد از آنها این کار را انجام میدهند! زیرا پیدا کردن miRNAها در یک ژنوم بسیار سختتر از پیدا کردن پروتئینها است. هیچچیزی غیر از اندازهی کوچک، miRNAها را از بقیهی ژنوم متمایز نمیکند. در نتیجه هنوز از تعداد ژنهای miRNA در ژنوم انسان آگاه نیستیم. تفاوت اصلی بین siRNA و miRNAها در این است که siRNAها دو رشتهای و miRNAها تک رشتهای هستند (و معمولا به شکل تاخوردگی ساقه ـ لوپ میباشند).
در هر صورت به کمک پدیدهی تداخل RNA و امکان غیرفعال کردن اختصاصی ژنها، این RNAهای آنتی سنس کوچک یکی از پسندیدهترین ابزارهای زیستشناسان مولکولی و یکی از امیدوارکنندهترین نوآوریهای پزشکی هستند، البته به شرطی که راهی موثر و دقیق برای فرستادن این مولکولهای کوچک به هر جایی از بدن انسان در زمان لازم پیدا شود جدول زیر به شما امکان یافتن miRNAها در ژنومهای مدنظرتان را میدهد.
جدول 4-11: منابع miRNAها.
1-6-11 منابع عمومی miRNAها
بانک اطلاعاتی mirbase پایگاه جامعی از اطلاعات مربوط به توالیهای miRNAها میباشد که به آدرس mirbase.org در دسترس است.
242-فصل یازدهم
تصویر 12-11: بانک miRBase.
میتوانید جستوجویی بر اساس نام و یا کلمه خاصی در این صفحه انجام دهید. برای مثال در تصویر فوق کلمه bta-mir-181a-2 مورد جستوجو قرار گرفت که نتیجه آن را در تصویر 13-11 میبینید.
تصویر 13-11: یک نمونه رکورد بانک miRBase.
243-کار با RNA و پیشگویی ساختار آن و معرفی بانکهای miRNA
2-6-11 برسی اتصال miRNAها به mRNAها
اگر یک توالی RNA داشته باشیم و بخواهیم ببینیم که چه miRNAهایی به آن متصل میشوند و یا یک توالی از یک miRNA داشته باشیم و بخواهیم اطلاعاتی در رابطه با آن به دست بیاوریم و یا این که بخواهیم یک توالی نوکلئوتیدی miRNA را در بانک پیدا کنیم میتوانیم از ابزارهایی که در ادامه شرح داده میشوند استفاده کنیم.
microRNA Target Prediction Tools یک ابزار به منظور پیدا کردن توالیهای هدف miRNAها میباشد که از طریق آدرس http://miRecords.umn.edu/miRecords در دسترس میباشد. در جدول زیر تعدادی از ابزارهای آنلاین به منظور بررسی miRNAها لیست شده است.
244-فصل یازدهم
جدول 5-11: تعدادی از پایگاههای بررسی برسی اتصال miRNA به mRNAها.
بعد از این که محقق به تعدادی ژن دست یافت که miRNAها میتوانند روی آنها تاثیر بگذارند حال میتواند بررسی خود را بر روی این دسته ژن ادامه دهد تا اطلاعات کافی ای از عملکرد این دسته از ژنها پیدا کند. برای این کار میتواند از ابزارهای رسم شبکه بر اساس GO استفاده کند و یا میتواند از پایگاههایی مثل Enrichr به آدرس http://amp.pharm.mssm.edu/Enrichr استفاده کند تا این پایگاه با دریافت یک دسته ژن از کاربر و جستوجوی آنها در پایگاههای مختلف عملکرد آن دسته از ژنها را در فرایندهای مختلف زیستی مشخص کند. پژوهشگرانی که بر روی میزان بیان ژنها در شرایط مختلف با استفاده از روشهای مختلف از جمله میکرواری کار میکنند در نتایج خود دسته ای از ژنها را به عنوان ژنهایی که تحت شرایط خاص بیان آنها کمتر و یا بیشتر شده است را معرفی میکنند که میتوانند توسط بانکهایی همچون Enrichr به آنالیز بیشتر دادههای خود بپردازند.
3-6-11 شناسایی miRNA انسان
microRNAها گروهی از RNAهای کوتاه (حدود 22 نوکلئوتید) هستند که از ژنهای تنظیمی غیرکدشونده محسوب میشوند و در بسیاری از گونهها از جمله انسان شناسایی شدهاند و به نظر میرسد که نقش مهمی در سلامت و یا بیماری داشته باشند. مستندترین نحوهی عمل این گروه از RNAها، مهار ترجمه در پروتئینهای هدف است که از طریق اتصال آنها به mRNA هدف صورت میگیرد. miRNAها از ساختاری سنجاقسری که معیار مهمی در تشخیص آنها به شمار میرود، پردازش میشوند .
اولین (lin-4) miRNA در1993 در Caenorhabditis elegans شناخته شده و تا 7 سال تصور بر این بود که پدیدهای منحصر به فرد در کرمها و تنها مورد از نوع خود است. در سال 2000 دومین (let-7) miRNA نیز کشف شد که آن نیز همانند lin-4 در کنترل زمان نمو کرم نقش داشت و بنابراین RNAهای کوتاه موقتی[1] نام گرفتند. چند ماه بعد مشخص شد که let-7 از نظر تکاملی بسیار حفاظت شده است و در گونههای بسیاری از جمله انسان وجود دارد. در سال 2001 نیز 95 مورد جدید از چنین ژنهایی شناخته شدهاند که 58 مورد در C.elegans، 16 مورد در Drosophila melanogaster و 21 مورد مربوط به انسان بود و اصطلاح microRNA به آنها اطلاق شد.
بررسیهای ابتدایی شناسایی microRNAها مبتنی بر روشهای بیولوژیکی همسانهسازی و توالییابی بودند. در آن زمان دادهپردازی نقش محدودی داشت و تنها در حد تأیید این نکته بود که قطعات توالییابی شده بخشی از ساختار سنجاقسری معمول در miRNAها هستند. همچنین از دادهپردازی برای یافتن microRNAهایی استفاده شد که قبلاً توالی آنها در سایر گونهها شناخته و از نظر تکاملی حفاظت شده بودند، اما امکان همسانهسازی آنها در انسان وجود نداشت.
[1]. Short temporal RNA (stRNA)
245-کار با RNA و پیشگویی ساختار آن و معرفی بانکهای miRNA
این تلاشها تا اوایل 2003 به شناخت 109 microRNA در انسان منجر شد. به هر حال روشن بود که روشهای بیولوژیک برای آشکار کردن microRNAهای نادر و اختصاصی بافت محدودیت دارند. مسائل مطرح شده و همچنین در نظر گرفتن این نکته که وجه اشتراک پیشسازهای mircoRNA وجود ساختار ثانویهی سنجاقسر مانند است، سبب شکلگیری روشهای محاسباتی شد. در اوایل سال 2003 استفاده از قابلیت پیشبینی اولین الگوریتمها در این زمینه به این نتیجه منجر شد که تعداد microRNAهای مهرهداران بیش از 255 مورد نیست که اغلب آنها قبلاً شناخته شده بودند. جالب اینکه این تخمین از تعداد microRNAهای انسان در سالهای 2003 و 2004 بهطور گسترده پذیرفته شد.
در سال 2005 روش جدیدی برای شناسایی microRNAهای تشریح شد که تلفیقی از روشهای محاسباتی و بیولوژیک بود (بنتویچ و همکاران). با استفاده از این روش، 89 microRNA جدید در انسان شناخته شد که دو برابر تعدادی بود که تا آن زمان در انسان توالییابی شده بود. به این ترتیب، برای اولین بار شناسایی microRNAهای غیرحفاظت شده نیز امکانپذیر شد و همچنین شواهد محکمی بدست آمد که تعداد microRNAهای انسان بسیار بیشتر از تعدادی است که قبلاً تصور میشد. در ادامه اصول پیشبینی و ارزیابی microRNA بیان شده و چشماندازی از تلاشهای کنونی در زمینه شناسایی microRNAها تشریح میشود.
4-6-11 پیشبینی بیوانفورماتیکی microRNA
microRNAها ویژگیهای مشترکی دارند، از جمله اینکه از یک پیشساز سنجاقسری پردازش میشوند و همین امر امکان پیشبینی کامپیوتری microRNAهای جدید را فراهم میکند. هرچند هیچ یک از مشخصات (مانند انرژی آزاد یا الگوی توالی) برای آشکارسازی صحیح آنها کافی نیست. حتی زمانی که چند مورد از این مشخصات در کنار هم استفاده شوند و حدآستانهی انعطافناپذیری[1] برای آنها در نظر گرفته شود، باز هم به اندازهی کافی روشهای حساسی نیستند. با وجود این ترکیبی از چند ویژگی با وزنهای متفاوت اما مناسب از ویژگیهای مختلف، صحت قابل قبولی ایجاد میکند. پیشبینی بیوانفورماتیکی microRNAها از الگوریتمهای آموزش ماشین[2] بهره میبرد که براساس «مجموعه آموزشی[3]» از microRNAهای شناخته شده و پیشسازهای سنجاقسری مربوط به آنها تعلیم داده میشوند، بهنحویکه نتایج الگوریتم بتواند به درستی توالیهای microRNA مبنا را شناسایی کند. بهطور معمول این الگوریتمها از یک «گروه کنترل[4]» که گروه بزرگی از توالیهای سنجاقسری است و بهطور تصادفی از ژنوم انتخاب شدهاند، استفاده میکند. احتمالاً اغلب این ساختارهای سنجاقسری پیشساز microRNA نیستند. مجموعهی روشهای کنترل و آموزش، از نظر ویژگیهایی که تمایز مهمی بین microRNAهای شناخته شده از گروه کنترل بهوجود میآورند، مورد توجه قرار میگیرند. به این ترتیب الگوریتمها از ویژگیهای افتراقی برای برآورد توالیهای سنجاقسری ناشناخته استفاده میکنند و به هر توالی از نظر حد احتمال وجود یک microRNA جدید، امتیازی تعلق میگیرد.
ویژگیهای شاخص microRNAها
1- ویژگیهای ساختاری مانند طول سنجاقسر، طول سنجاقسر- لوپ، پایداری ترمودینامیکی، جفت شدن بازها، اندازه و محل جفت نشدن بازها[5] و فاصله microRNA از لوپ.
2- ویژگیهای توالی مانند محتوا و محل نوکلئوتید، ترکیب توالی، عناصر تکراری و تکرارهای معکوس و داخلی.
اغلب الگوریتمهای پیشبینیکننده، به حفاظت تکاملی توالیهای microRNA بین گونهها وابستهاند. چنین الگوریتمهایی توالیهایی را بهعنوان دادهی ورودی دریافت میکنند که بین دو گونه همولوگ هستند و روشهای مختلفی را برای پیشبینی microRNAهایی که در این دو گونه محافظت شدهاند بهکار میگیرند. این روش کمک میکند تا اشتباه مثبت کاهش پیدا کند، اما نتایج نیز به شناسایی microRNAهای حفاظت شده محدود میشود.
[1]. Rigid threshold
[2]. Machine learning algorithms
[3]. Training set
[4]. Control group
[5]. Bulge
246-فصل یازدهم
هنگامیکه microRNAهای بالقوه به روش بیوانفورماتیکی شناسایی شدند، باید بیان آنها در بافتهای مختلف یا کشت سلول (یا هر دو) ارزیابی شود. چالش پیش رو این است که اگر ارزیابی بیولوژیکی بیان microRNA پیشبینی شده را تأیید نکند، لزوماً نشاندهندهی عدم صحت بیوانفورماتیکی آن نخواهد بود، زیرا ممکن است عدم بیان microRNA مورد نظر بهدلیل عدم بیان آن در بافت مورد بررسی باشد، یا تنها در مراحل سلولی خاصی بیان شود یا فراوانی آن به حدی باشد که بیان آن توسط روش استفاده شده تشخیصپذیر نباشد. دلیل آخر بهخصوص در مورد microRNAها مشکلساز است، زیرا توالی آنها به یکدیگر بسیار شبیه است. همچنین اگر مقدار یک microRNA فراوان باشد، بیان microRNA دیگری را که بیان آن کم است و توالی مشابهی دارد، تحت تأثیر قرار میدهد.