- 886
- 2023/04/27 - 10:39
- 68 بازدید
شرح فصل و نکات ویژه: در این فصل به مبحث ترنسکریپتومیکس یعنی آنالیز دادههای بیان ژن پرداخته میشود. از جمله مباحثی که در این فصل بحث میشود شناسایی توالیهای قابل رونویسی میباشد. روشهاي سنجش ميزان بيان ژنها در این فصل شرح داده میشود. بررسی دادههای بیان ژن در این فصل شرح داده میشود. در رابطه با بهینهسازی کدونی به منظور کلونینگ در این فصل توضیحاتی ارائه میشود. پیشنهاد مطالعاتی: مجموعه ”دروس بیوانفورماتیک” دکتر شریفی زارچی” در سایت[…]
شرح فصل و نکات ویژه:
- در این فصل به مبحث ترنسکریپتومیکس یعنی آنالیز دادههای بیان ژن پرداخته میشود.
- از جمله مباحثی که در این فصل بحث میشود شناسایی توالیهای قابل رونویسی میباشد.
- روشهاي سنجش ميزان بيان ژنها در این فصل شرح داده میشود.
- بررسی دادههای بیان ژن در این فصل شرح داده میشود.
- در رابطه با بهینهسازی کدونی به منظور کلونینگ در این فصل توضیحاتی ارائه میشود.
پیشنهاد مطالعاتی:
- مجموعه ”دروس بیوانفورماتیک” دکتر شریفی زارچی” در سایت ”مکتبخونه”به آدرس maktabkhooneh.ir منبع بسیار مناسبی برای یادگیری مقدمات زبان برنامهنویسی R و همچنین آنالیز دادههای بیان ژن میباشد.
204-فصل نهم
برای دریافت نسخه چاپی و به روز کتاب با انتشارات دکتر خلیلی تماس بگیرید. 02166568621
در فصل دوم به شرح سه حوزه ژنومیکس ساختاری، ژنومیکس عملکردی و ژنومیکس مقایسه ای پرداخته شد، ترنسکریپتومیکس یکی از حوزههای ژنومیکس عملکردی به حساب میآید که در این فصل به آن میپردازیم. دو مبحث کلی در رابطه با ژنومیکس عملکردی وجود دارد اول بررسی حضور RNA میباشد و دوم بررسی میزان بیان RNAها میباشد. ترانسکریپتومیکس استفاده از منابع ژنومی به منظور مطالعات عملکردی برای شناسایی و مقایسه ژنهای بیان شونده یک ژنوم تحت شرایط مختلف محیطی، رشدی، بافتی و تکوینی ميباشد. ژنومیکس عملکردی بیشتر بر اساس تجربیات آزمایشگاهی است و روی عملکردهای ژنها در سطح کل ژنوم با استفاده از روشهای با توان بالا(High throughput) متمرکز است که بررسی همزمان همهی ژنهای سلول است. بررسی ترانسکریپتوم به درک چگونگی عملکرد مجموعههای ژنی با یکدیگر در ایجاد مسیرهای متابولیکی و تنظیمی و پیام رسانی درون سلول کمک میکند، الگوهای هم بیانی و ژنهای هم تنظیم را آشکار میسازد که این باعث تعیین عملکرد ژنها میشود. در مغز حدود ۱۵۰۰۰ ژن بيان ميشوند در حالي كه در سلول اپتليال روده كمتر از ۲۰۰۰ ژن رونويسي ميگردند. از ۸۰۰۰ ژني كه در ريشه گياه مدل آرابيداپسيس بيان ميشوند، ۹۰ درصد آنها در ساقه نيز قابل بيان هستند.
از سال 2008 INSDN (همکاری بینالمللی پایگاهةای توالیهای نوکلئوتیدی) TSA را بهعنوان پایگاه داده ترنسکریپتوم پذیرفت. TSA که مخفف Transcriptome Shotgun Assembly میباشد از طریق NCBI در دسترست میباشد و دادههای آن شامل ESTها و دادههای NGS میباشد.
تصویر 1-9: فرایند رونویسی و اسپلایسینگ.
1-9 شناسایی توالیهای ژنهاي در حال بیان
روشهاي متعددي براي شناسايي ژنهاي در حال بيان وجود دارند که در زیر برخی از آنها آورده شده است. و در ادامه این فصل روشهای شناسایی میزان بیان بحث خواهد شد
1-1-9 رونوشتهای پيشبيني شده يا (PT) Predicted transcript
مجموعه تواليهاي شناخته شده و پيشبيني شده را رونوشتهای ابراز شده يا ET ناميدهاند. در واقع، ET شامل ژنهاي شناسايي شده به روش تجربي و هم ژنهاي پيشبيني شده است. PT یا همان ژنهای پیش بینی شده توالیهایی هستند که با استفاده از نرمافزارهاي ژنياب (Gene finder) از روی توالی ژنومی پیش بینی شدهاند.
جدول 1-9: ET، EST و TC.
2-1-9 شناسه توالیهاي رونويسي شده يا (EST) Expressed sequence tag
از ESTها به وفور به عنوان منبع اطلاعات برای کشف ژنهای جدیدی که عمل آنها به طور تجربی از توالی آنها نتیجه گرفته میشود، استفاده میشود. ESTها مستعد خطا هستند اما کل کتابخانه EST میتواند اطلاعات مفیدی به ما بدهد. با همردیفی ESTها با توالیهای ژنومی اگر همسانی بین ESTها و توالیهای ژنومی پیدا شد، میتوان جایگاه ژنی، ژن رمز کننده و همچنین مرزهای اگزون و اینترونی ژن را پیدا کرد، برای انجام این مراحل میتوان از برنامه SIM4 استفاده کرد.
205-ترنسکریپتومیکس
تصویر 2-9: مراحل تولید اطلاعات EST.
يكي از بهترين و قابل اعتمادترين راههاي شناسايي واحدهاي رونويسي، استفاده از روش مشهور به تعيين شناسه تواليهاي رونويسي يا EST ميباشد. این توالیها کوتاه بوده و از یک يا هر دو انتهای هر همسانه با یکبار توالی یابی مشخص میشوند. در عمل، با استفاده از آغازگرهاي مبتني بر توالي ناقل اقدام به تعيين توالي انتهاهاي قطعه درون يك همسانه از كتابخانه cDNA ميشود كه به طور تصادفي برداشته شده است. در صورتي كه توالي داراي حداقل طول 100 bp با كمتر از ۳ درصد نوكلئوتيد نامشخص (N) باشد، آن توالي در پايگاه GenBAnk يا مشابه آن ذخيره ميشود.
پيدا شدن EST يك ژن بستگي به كتابخانه و سلول يا بافت منشاء آن دارد زيرا تحت شرايط محيطي مختلف برنامه بياني متفاوتي از ژنها در هر سلول اجرا ميشود. توالي cDNA درون همسانه به طور كامل تعيين نشده است، بلكه هدف به دست آوردن شناسهاي از واحد قابل رونويسي در ژنوم بوده و فقط بخش انتهايي (در يك و گاهي هر دو طرف قطعه cDNA ) تعيين توالي شده است. همسانهها به طور تصادفي و به تعداد چند صد هزار انتخاب ميشوند. بنابراين انتظار ميرود تعداد EST تكراري بسيار زيادي داشته باشيم.
پایگاههای ذخیره و نمایش اطلاعات ESTها
یکی از اهداف پایگاههای EST، مدیریت و یکپارچه سازی دادههای بزرگ EST تکراری است تا اینکه کیفیت اطلاعات توالی را بهبود بخشند، بنابراین میتوان از دادهها برای استنتاج cDNAهایی با طول کامل بهره برد. برای بهبود اطلاعات از الگوریتمهای مختلفی میتوان استفاده کرد و یکی از نرم افزارهایی که در این زمینه یاریرسان میباشد نرم افزار SIM4 میباشد. به فرایند خوشهبندیی که ESTهای تکراری را کاهش میدهد و مجموعهای از ESTهای شرح نویسی شده و غیر تکرای را تولید میکند، ساخت نمایه ژن (Gene index construction) میگویند.
Unigene پایگاه اطلاعاتی خوشههای EST در NCBI است. (هر خوشه با مجموعهای از توالیهای EST همپوشان است) بعد از حذف توالیهای آلوده (زائد) مثل حاملهای باکتریایی و توالیهای متصل ESTهای تمیز ایجاد میشوند.
206-فصل نهم
ESTهای تمیز برای جستوجو توسط BLAST استفاده میشوند. پایگاه Unigene از ترکیب اطلاعات dbEST، پایگاه داده mRNA GeneBank و پایگاه DNA ژنومی که به صورت کامپیوتری پیرایش یافته است ساخته شده است.
TIGR Gene Indices یک پایگاه داده EST است، ولی از روش خوشه بندی متفاوت با UniGene استفاده میکند. این برنامه از ترکیب اطلاعات dbEST،پایگاه داده mRNA GeneBank و پایگاه DNA ژنومی و خود توالیهای پایگاه TIGR استفاده میکند. فقط توالیهایی که در مقایسههای دوتایی، بیش از 95% شباهت را در بیش از چهل نوکلئوتید نشان دادهاند خوشه بندی میشوند. از برنامههای همردیفی برای نشان دادن همپوشانیها استفاده میکنند و توسط برنامههای TIGR Assembler و CAP3 با سر هم كردن توالیهايEST و ET به تواليهاي مشتركي دست مييابند كه آنها را تواليهاي توافق پيشنهادي يا TC (Tentative consensus) ناميدهاند. TC ممکن است دارای توالی کامل و یا ناقص cDNA باشد. جهتگيري توالي از نظر sense يا anti-sense بودن نامشخص است. به همين دليل، در ركورد مربوط كليه ORFهاي ممكن نشان داده ميشوند. براي راحتي كاربران، آماري ازEST و ETهاي مورد استفاده در تشكيل يك TC در انتهاي ركورد آورده ميشود.
تصویر 3-9: مراحل تولید اطلاعات TC.
3-1-9 آرايههاي مرتب (Tiling Arrays)
آرایههای مرتب یکی از انواع میکرواری میباشد و به جای کاوش برای توالی ژن شناخته شده و یا پیش بینی شده که ممکن است در طول ژنوم پراکنده باشد، آرایههای مرتب به بررسی توالیهای شناخته شده در یک منطقه به هم پیوسته میپردازد. آرايههاي مرتب در واقع يك DNA Chip از اوليگومرهاي ۲۵ نوكلئوتيدي هستند كه از تقسيم تواليهاي ژنومي به اوليگونوكلئوئيدهاي همپوشان است. هر يك از آنها نسبت به اوليگوي قبلي خود داراي ۱۳ نوكلئوتيد مشترك و ۱۲ نوكلئوتيد خاص خود است (تصویر 4-9).
تصویر 4-9: اولیگومرهای Tiling Arrays.
207-ترنسکریپتومیکس
DNA chip حاصل در معرض دو رگ سازي به cDNAهاي نشاندار مربوط به سلول يا بافت مورد مطالعه قرار ميگيرند. به اين ترتيب، اوليگوهايي كه داراي رونوشتهاي بيان شده در سلول مورد نظر هستند شناسايي ميشوند. ميزان دورگ شدن كه شاخصي از بيان ژن است نيز ثبت ميشود. با سرهم كردن اين تواليهاي دورگ شده اوليگونوكلئوتيدي ميتوان واحدهاي رونويسي با قدرت تمايز ۱۲ نوكلئوتيد را به دست آورد. شكل زیر نمونهاي از دادههاي به دست آمده به اين روش را نشان ميدهد.
تصویر 5-9: مراحل Tiling Arrays.
موسسه Salk در کالیفرنیا دادههای Tiling Arrays بسیاری از موجودات مختلف را جمع آوری نموده و این دادهها را در بانکی به آدرس http://signal.salk.edu در اختیار عموم قرار داده است(تصویر 6-9).
208-فصل نهم
تصویر 6-9: نمونهاي از دادههاي به دست آمده از بكارگيري روش آرايههاي مرتب براي شناسايي واحدهاي رونويسي و ميزان بيان هر اگزون.
4-1-9 ORFome
ORFome یا full length cDNA project به بررسی کل RNAهای سلول میپردازد. برای مثال پروژه RIKEN به بررسی تمام طول کلون cDNA مربوط به آرابیدوپسیس میپردازد. پروژههای مختلف ORFome تا به حال انجام شده است و یا در حال انجام است که برخی از مهمترین پروژهها را میتوانید در تصویر 7-9 ببینید.
تصویر 7-9: تعدادی از پروژههای ORFome.
در full length cDNA project ابتدا RNA استخراج میشود و بعد از این که ساخت cDNA از روی RNA انجام شد، توالی cDNA در وکتور کلون میشود و سپس سکئونسینگ انجام میشود که خلاصه مراحل در تصویر 8-9 آمده است.
209-ترنسکریپتومیکس
تصویر 8-9: مراحل full length cDNA project.
یک پایگاه جامع در رابطه با کلونهای cDNA در پستانداران به نام Mammalian Gene Collection (MGC) وجود دارد که تا به حال دادههای مربوط به انسان، موش، رت و گاو را در خود جای داده است و به آدرس http://genecollections.nci.nih.gov/MGC در دسترس عموم میباشد.
تصویر 9-9: پایگاه MGC.
2-9 سنجش میزان بیان ژنها
اندازه گيري بيان ژن در شرايط، بافت و يا سلولهای مختلف، به فهم و تفسير ما از فرآيند زيستي و حياتي كمك زيادي ميكند. روشهاي مختلفي با قابليتهاي متفاوتي براي سنجش ميزان بيان ژنها وجود دارند كه در زير به طور مختصر بيان شدهاند. دادههاي حاصل از اين روشها در پايگاههاي متعددي ذخيره شدهاند.
210-فصل نهم
تصویر 10-9: روشهای سنجش میزان بیان ژنها.
1-2-9 روش لكهگذاري نورترن(Northern blot)
با وجود معرفي روشهاي پيشرفته و توليد اطلاعات در مقياس انبوه، هنوز هم روش نورترن بلات معتبرترين روش براي نشان دادن اندازه رونوشت و ميزان بيان آن است. اما انجام اين روش مشكل و پرهزينه است. بنابراين اطلاعات كمي با استفاده از اين روش به دست آمده است و معمولا در مقالات ثبت شدهاند. در اين روش mRNA استخراج شده از سلول با استفاده از روش ژل الكتروفورز جداسازي شده و طي فرآيندي به غشاي نايلوني يا نيتروسلولزي منتقل ميشود. اساس این روش مشابه روش سادرن بلاتینگ است. با این تفاوت که در آن از کاغذهای فعال شده یا کاغذهای DBM، استفاده میشود. این کاغذها را میتوان به راحتی با تیمارهای شیمیایی خاصی از کاغذ صافی تهیه کرد. در این روش، به علت تک رشتهای بودن RNA و تفکیک آن بر روی ژل واسرشت کننده نیازی به مرحله مجاورت با هیدرکسید سدیم نمیباشد. سپس كاوشگر (Probe) از ژن مورد نظر تهيه و با غشاء مزبور دورگ سازي ميشود. پس از شستشوهاي پياپي براي كاهش دورگهاي غيراختصاصي، لكههاي باقيمانده حاصل از دورگسازي اختصاصي به روشهاي مختلفي آشكار سازي میشوند. باند يا باندهاي باقي مانده و ميزان تيرگي آنها نشاندهنده اندازه رونوشتها و ميزان بيان آنها در بافت مورد مطالعه است.
2-2-9 روشRT-PCR كمي (Quantitative RT-PCR)
در اکثر موارد، برای بررسی RNA، یک بررسی کیفی به تنهایی کافی نیست. یک مسئله عمومی که در بررسی بیان ژن مطرح میشود کمیسازی رونوشتهای یک ژن خاص و آشکار سازی تغییر میزان بیان آنها تحت شرایط آزمایشی مختلف است.
real-time RT-PCR امکان کمیسازی دقیق مقادیر شروع کننده از جمله cDNA و RNA هدف را فراهم میسازد. اين روش مبتني بر شناخت cDNA با استفاده از آنزيم reverse transcriptase) RT) و واكنش تكثيري PCR است. از آنجا كه تعداد مولكول تكثير شده به تعداد مولكول الگويي اوليه و بازدهي واكنشهاي RT و PCR دارد، روشهاي متعددي براي كمي نمودن اين روش ابداع شده است كه عمدتا بر اساس مقايسه نسبت به ژن ديگر يا نمونه بافتي ديگر هستند. يكي از بهترين روشها در اين گروه، روش Real time-PCR است که در آن تعداد مولكول تكثير شده در حين انجام واكنش بر اساس میزان فلورسانس محاسبه ميشود.
میزان فلورسانس در طول هر سیکل اندازه گیری میشود که شدت دینامیک واکنش را افزایش میدهد، زیرا مقدار فلورسانس متناسب با مقدار محصول PCR است. محصولات PCR را میتوان با استفاده از رنگهای فلورسانس که به DNA دو رشته ای متصل میشوند یا با استفاده از پروبهای نشاندار شده با مواد فلورسانس که ویژه توالی هستند قابل سنجش کرد. مرحله RT برای کمیسازی دقیق و صحیح، دارای اهمیت بسیاری میباشد و مقدار cDNA تولید شده باید دقیقاً نمایانگر مقدار RNA ورودی باشد. بنابراین رنج دینامیک، حساسیت و اختصاصی بودن آنزیم، اولین ملاحظاتی هستند که باید برای یک سنجش RT-PCR موفق در نظر گرفته شوند. دادههاي اين گروه از روشها تا حد زيادي با دادههاي حاصل از لكهگذاري نورترن مطابقت ميكند، گرچه طيف تغييرات قابل آشكارسازي (Dynamic range ) آن به خوبي لكهگذاري نورترن نيست.
211-ترنسکریپتومیکس
تصویر 11-9: نمودارهای نمایش دهنده شدت بیان ژنها توسط RT-PCR كمي.
3-2-9 اندازهگيري بيان ژن بر اساس تعداد(EST frequency) EST
همان طور كه در قسمت قبل آمد، در طي پروژههاي EST چند صد هزار نمونهبرداري تصادفي صورت ميگيرد. بنابراين تكرار يك EST در طي انجام پروژه با تعداد رونوشت آن ژن ارتباط مستقيم خواهد داشت. با اين منطق، در موجوداتي كه تعدادEST زيادي تعيين توالي شده است، تعداد EST هر ژن را به عنوان شاخصي از بيان آن ژن ميدانند.
4-2-9 روش آرايههاي مرتب (Tiling Arrays)
همان طور كه در قسمت قبل آمد، اين روش اخيرآ معرفي شده است. در اين روش ميزان دورگ شدن آرايههاي مرتب كه شاخصي از بيان ژن است به صورت هيستوگرامهاي كنار هم ثبت ميشود. با سرهم كردن اين تواليهاي دورگ شده اوليگونوكلئوتيدي ميتوان واحدهاي رونويسي با قدرت تمايز ۱۲ نوكلئوتيد را به دست آورد. در آينده، با تجمع اطلاعات حاصل از بكارگيري اين روش اميد ميرود بتوان ميزان بيان هر اگزون را مشاهده نمود.
تصویر 12-9:سیگنالهای مربوط به Tiling Arrays.
5-2-9 روش تجزيه و تحليل پياپي بيان ژنها يا (SAGE)
تکنیک SAGE یا serial analysis of gene expression روش قدرتمندی است که جهت آنالیز بیان ژن درمقیاسهای وسیع بکار گرفته میشود. مجموع اطلاعات SAGE مشتق شده از یک نمونهی سلولی یا بافتی تحت عنوان کتابخانهی SAGE مطرح میشود، که بازتاب فراوانی همه رونوشتها در یک نمونه در زمان مشخص میباشد. برخلاف سایر تکنیکها، روش SAGE به دانش اولیه در مورد توالیهای ژن مورد نظر نیازی ندارد، همچنین امکان آنالیز کمی و کیفی توالی هر رونوشت را در بافت یا سلول مورد نظر فراهم مینماید. این روش بر پایه جداسازی توالیهای tag از mRNA و اتصال این توالیها بصورت سریالی به هم برای فراهم نمودن توالییابی آنها میباشد. SAGE بطور گسترده در پزشکی و زیست شناسی برای آنالیز بیان ژن بکار گرفته میشود. جهت افزایش کارایی این تکنیک در شرایط بخصوص انواع تغییر یافتهای از آن با نام longSAGE، microSAGE، superSAGE و … ایجاد شده است.
212-فصل نهم
در سالهاي اخير بويژه با كمك دادهپردازي زيستي اين روش بهبود زيادي یافته و در حال رواج مجدد است. ابتدا یک RNA را استخراج کرده و با استفاده از آغازگر پلی T با بیوتین نشاندار شده به cDNA تبدیل میشود. در مرحله بعد با یک آنزیم برشی که جایگاههای زیادی را برش میدهد کار ادامه پیدا میکند و cDNAهای حاصل برش داده میشوند. چون انتهای cDNAها به بیوتین آغشته است و بیوتین میتواند به استرپتواودین متصل شود بنابراین با استفاده از ذرات پوشیده شده با استرپتواودین قطعات مورد نظر جداسازی میشود که قادرند به انتهای برش یافته قطعات بچسبند و در عین حال محل برشی نوع IIS را برای آنزیم کنار هم کننده، دارند (این آنزیم قادر است رشته DNA را 14 جفت باز دورتر از این محل برش دهد). سپس با استفاده از آنزیم برچسبدار کننده قطعات برش داده میشوند. محل برش تا 14 نوکلئوتید جلوتر از محل شناسایی است. آنگاه دو رشته به دست آمده به هم متصل شده
و برچسبهای دوگانه به وجود میآیند. سپس از آغازگرهای ویژه توالیهای اتصال دهنده A و B برای تکثیر آنها استفاده میشود. در مرحله بعد از آنزیم برشی لنگری استفاده شده و برچسبهای دوگانه جداسازی میشوند سپس برچسبهای دوگانه را به هم وصل کرده و آن را همسانهسازی و تعیین توالی میکنند. مشابه تجزیه و تحلیل دادههای میکرواری دادههای SAGE را میتوان تجزیه و تحلیل کرد.
SAGEMP ¬ ابزار جستوجو برای قطعات SAGE.
SAGEX Profiler ¬ دو کتابخانه را با هم مقایسه میکند درباره ژنهای خاموش شده و بیان شده.
SAGE Gene ¬ جور کردن قطعات SAGE حاصل از آزمایشها را با ژنهای شناخته شده ممکن میسازد.
6-2-9 روش سکوئنسینگ NGS
توالی یابی RNA که به توالی یابی شاتگانی کل ترانسکریپتوم[1] نیز معروف است تکنولوژی ای است که با بهرهگیری از تواناییهای توالی یابی تکنولوژی next-generation sequencing برای بدست آوردن تصویری کلی از حضور و مقدار RNA از ژنوم در یک بازه زمانی خاص استفاده میکند. پیشرفتهای اخیر در NGS باعث شده که بازه پوشش توالی یابی نوکلئوتیدهایDNA و همچنین مقدار نمونه ورودی برای توالی یابی افزایش پیدا کند. این پیشرفتها توالی یابی رونوشتهای RNA سلول را تسهیل میکند و به ما این امکان را میدهد که رونوشتهای برش خورده[2] ژن، تغییرات پس از رونویسی، همجوشی ژنها[3]، جهشها و پلی مورفیسم تک نوکلئوتیدی[4] و در نهایت تغییرات در بیان ژن را بررسی کنیم. دادههای مربوط به دادهای بیان ژن با تکنیک NGS نیز در پایگاه GEO یافت میشود.
[1] Whole Transcriptome Shotgun Sequencing (WTSS)
[2] Spliced
[3] gene fusion
[4] single-nucleotide polymorphism
213-ترنسکریپتومیکس
تصویر 14-9: روند انجام توالی یابی RNA.
7-2-9 روش ريزآرايه (Microarray)
یکی از مراحل مهم تنظیم بیان ژن در مرحله ساخت mRNA از روی DNA و یا همان رونویسی است، از این رو تخمین میزان کمی mRNA در سلول بسیار اهمیت دارد. برای این منظور فناوریهای زیادی پا به عرصه ظهور گذاشت که یکی از مهمترین آنها فناوری میکرواری[1] میباشد که انقلابی در عرصه زیستشناسی مولکولی ایجاد نمود. به طور ساده میکرواری عبارت است از فناوری بررسی فعالیت هزاران ژن و یا پروتئین در یک سطح کوچک مانند یک لام. تشخیص تفاوت بیان ژنها در خلال شرایط آزمایشگاهی، بیولوژیکی و کلینیکی به عنوان یکی از موضوعات اصلی در آزمایشهای میکرواری میباشد. علاوه بر این، فناوری میکرواری میتواند در جهت امور دیگر مانند مقایسه ژنوم سالم با بیمار و تشخیص سندرومهای ژنتیکی و تشخیص تعداد زیادی از عوامل پاتوژن در روی یک چیپ میکرواری مورد استفاده قرار گیرد.
جدول 2-9: دسته بندی انواع میکرواری.
تکنولوژی میکرواری را میتوان به دو بخش کلی تقسیم نمود، بخش اول مراحل آزمایشگاهی این تکنیک میباشد که شامل: ساخت چیپ میکرواری، استخراج mRNA و ساخت cDNA از روی آن و همزمان نشان دار کردن آن با یک رنگ فلورسانس، مراحل هیبریداسیون، شستشو و خشک کردن چیپ و در نهایت اسکن کردن چیپ میکرواری میباشد. بخش دوم شامل آنالیز دادههای حاصل از آزمایش به کمک نرم افزارها و بانکهای اطلاعاتی موجود میباشد. این دو بخش، لازم و ملزوم یکدیگر بوده و باید سعی شود که به درستی انجام شود چرا که در غیر این صورت نتیجه مناسبی از آزمایش حاصل نخواهد شد. با توجه به متنوع بودن فرمتها و انواع مختلف چیپهای میکرواری، در بخش آنالیز دادههای میکرواری الگوریتمها و تکنیکهای آنالیزی زیادی ارائه شده است.
ريزآرايه يكي از پر كاربردترين روشهاي توليد اطلاعات انبوه (High throughput) مربوط به ميزان بيان ژن در پروژهاي عملكرد ژنومها بوده است. اساس اين روش همان دورگسازي DNA بر روي پايه جامد (غشاء يا لام ميكروسكوپي) ميباشد. به اين ترتيب كه ابتدا DNA ژنهاي مورد نظر را با استفاده از روبات در مقياس ميكروني روي لام لكهگذاري ميكنند. DNA معمولا cDNAهاي تكثير شده توسط PCR است.
[1] gene fusion
[1] single-nucleotide polymorphism
[1] Microarray technology
214-فصل نهم
تصویر 15-9: نمایی از مراحل انجام میکرواری.
در مرحله بعد cDNAهاي نشاندار بر مبناي mRNA استخراج شده از بافتهاي مورد مطالعه با استفاده از مواد فلوروسانت تهيه ميشود. پس از دورگ سازي مولكولهاي نشاندار با آرايهها چندین مرتبه شستشو انجام میشود و سپس ميزان درخشش لكههاي متصل به مولكولهاي نشاندار اختصاصي توسط يك اسكنر دقيق ثبت ميشود. سپس ميزان روشني هر لكه توسط نرمافزار محاسبه ميشود. تجزيه وتحليل آماري بعدي نشان خواهد داد ميزان بيان هر ژن در مقايسه با ساير ژنها و در مقايسه با نمونهي بافتي ديگر چقدر تغيير كرده است. لازم به ذکر است برخلاف میکرواریهایی که برای بررسی میزان بیان ژنها بهکار میروند در تکنیک CGH array هدف بررسی تغییرات ژنومی (حذف و اضافه شدگی جزئی یا کامل کروموزمها) نسبت به ژنوم رفرنس میباشد که امروزه در بررسیهای سیتوژنتیک بسیار پرکاربرد شده است. از نقاط قوت CGH array نسبت با روشهای قدیمی سیتوژنتیک تفکیک بیشتر و از نقاط ضعف آن ناتوانی در شناسایی جابهجاییهای متعادل در کروموزومها میباشد.
در آزمایشگاههای PGD (تشخیص ژنتیکی پیش از لانهگزینی) که فقط یک یا دو سلول از جنین سه تا پنج روزه به منظور بررسی سلامت ژنتیکی در اختیار دارند بهترین روش CGH array میباشد زیرا همچون کاریوتایپ نیاز به کشت سلول ندارد و میتوان در طی دو روز با میزان DNA کم آزمایش را انجام داد و جنین 5 یا 6 روزه را در صورت صحت سلامت ژنتیکی به مادر انتقال داد. اندیکاسیون اصلی انجام این تست برای افراد دارای سقط مکرر و یا دارای سابقه چند بار انجام روشهای کمک باروری ناموفق میباشند. از دیگر استفادههای این تست میتوان به آزمایش روی سلولهای بهدست آمده از جنین سقط شده یا هر منبع دیگر از سلولهای زنده و غیر زنده اشاره کرد.
با توجه به حجم انبوه دادههای میکرو اری در پایگاههای تحت وب، بسیاری از پژوهشگران علاقه مندند تا به آنالیز این دادهها بپردازند. در مرحله اول با ورود به آدرس www.ncbi.nlm.nih.gov/geo/ و با جستوجوی شماره مطالعه که معمولا در مقالات ثبت میشود و یا جستوجوی متنی در بانک GEO میتوان فایل خام دادههای میکرواری مربوط به یک مطالعه را دانلود کرد. فرمت فایلهای حاوی دادههای خام میکرواری “.CELL” میباشد. در پوشهای که دانلود میشود چند فایل وجود دارد که مربوط به دادههای کنترل و بیمار میباشند که پژوهشگر باید اطلاعات آزمایش را که در پایگاه GEO وجود دارد را مطالعه کند تا بتواند به صورت صحیح دادهها را مورد بررسی قرار دهد.
نرم افزار EXPRESSION CONSOLE برای نرمال کردن دادهها به کار میرود و توسط این نرم افزار فایلهای الصاقیLibrary و annotation را دانلود میکنیم و با فایل اصلی همراه میکنیم. بعد از یک آنالیز اولیه و نرمال کردن دادهها تمام اطلاعات را با یکدیگر ادغام میکنیم و خروجی TXT از نرم افزار میگیریم. برای ادامه آنالیزها میتوانید از نرم افزار Flexarray mcgill استفاده کنید. فایلی که توسط نرم افزار قبلی ساختیم را میتوانیم در این نرم افزار اجرا کنیم. در این مرحله نرم افزار مشخصات آزمایش را از ما میخواهد که باید مشخص کنیم چه دادههایی مربوط به کنترلها و چه دادهایی مربوط به بیماران بودهاند. با استفاده از این نرم افزار میتوان آنالیزهای آماری متنوعی را انجام داد. علاوه بر نرمافزارهایی که توضیح داده شد یک نرم افزار غیر رایگان به نام CLC Genomics وجود دارد که تمام کارهای مربوط به آنالیز را انجام میدهد. خوشبختانه ابزارهای آنلاین زیادی برای آنالیز دادههای بیان ژن وجود دارند که از طریق اینترنت قابل دسترس میباشند.
215-ترنسکریپتومیکس
9 معرفی وبسایت Enrichr
در بسیاری از مطالعات ترنسکریپتومیکس محقق به تعدادی mRNA بر میخورد که بیان بالا و یا پایینی در سلول مورد نظر، در شرایطی خاص داشتهاند. در ادامه کار محقق میتواند مطالعات بیشتری را بر روی این دسته ژن ادامه دهد تا اطلاعاتی در رابطه با عملکرد این دسته از ژنها پیدا کند مثلا میتواند از ابزارهای رسم شبکه بر اساس GO و یا فاکتورهای دیگر استفاده کند و یا میتواند از پایگاههایی مثل Enrichr به آدرس http://amp.pharm.mssm.edu/Enrichr استفاده کند تا این پایگاه با دریافت یک دسته نام ژن از کاربر و جستوجوی آنها در پایگاههای مختلف عملکرد آن دسته از ژنها را در فرایندهای مختلف زیستی مشخص کند. پژوهشگرانی که بر روی میزان بیان ژنها در شرایط مختلف با استفاده از روشهای مختلف از جمله میکرواری کار میکنند در نتایج خود دسته ای از ژنها را به عنوان ژنهایی که تحت شرایط خاص بیان آنها کمتر و یا بیشتر شدهاند را معرفی میکنند که میتوانند توسط ابزارهایی همچون Enrichr به آنالیز بیشتر دادههای خود بپردازند.
Enrichr ورودی را که یک دسته نام ژن میباشد را در دسته بندیهای مختلف بررسی میکند، دسته بندیهای این پایگاه شامل Pathways، Ontologies، Disease/Drugs، Cell Types و Transcription میباشد. هر دسته بندی شامل چندین پایگاه میباشد که Enrichr ورودی را با بانک هر پایگاه میسنجد و محتملترین موارد را اعلام میکند. در تصویر 16-9 در دستهبندی Pathways نتایج پایگاه KEGG را مشاهده میکنید که نشان میدهد تعداد قابل توجهی از ژنهایی که در مطالعه ما بیان بالایی داشته اند مربوط به مسیر cytokine cytokine receptor interaction میباشند.
4-9 معرفی وبسایت coxpresdb
وبسایت coxpresdb وبسایتی بسیار مفید به منظور پیدا کردن ژنهایی است که با ژن مورد مطالعه شما بیان بالا و یا پایینی خواهند داشت. این وبسایت شامل دادههای میکرو اری پایگاه GEO میباشد و مورد جستوجوی شما را در تمام نمونههای موجود در این پایگاه جستوجو میکند. دسترسی به این پایگاه توسط آدرس coxpresdb.jp قابل دسترس است. شما میتوانید با وارد کردن نام ژن مورد نظرتان در جعبه جستوجو و کلیک بر روی گزینه جستوجو صفحه نتایج را مشاهده کنید. در صفحه نتایج نام موجودات مختلف به تفکیک و جدولهایی در زیر آنها قرار میگیرد که میتوانید بر روی Coexpressed gene list کلیک کنید و ژنهایی که با ژن شما بیان بالا و یا پایینی دارند را مشاهده کنید.
5-9 GEO (The Gene Expression Omnibus)
يكي از بهترين مکانهاي ذخیره مجموعه دادههای ابراز ژن GEO است كه در مركز اطلاعاتی NCBI قرار دارد. در این پایگاه اطلاعات بیان ژنها با استفاده از روش ریزآرایه و سایر روشهای بررسی که توسط آزمايشگاههاي مختلفي تولید شده است ذخیره شده و در دسترس عموم قرار میگیرد. دادههای ریز آرایه موجود شامل دادههای خام و پردازش شده است. برای استفاده از این دادهها نرم افزارها و سخت افزارهای متعددی طراحی شده است. دادههای ارسال شده به GEO در پایگاه اطلاعاتی و به سه شکل platform، Sample و Series ذخیره شده و به صورتهای DataSet و Profile به کاربران نمایش داده میشود.
216-فصل نهم
تصویر 17-9: نمایش ورودی و خروجی اطلاعات در پایگاه GEO.
6-9 معرفی تعدادی از بانکها و ابزارهای پر کاربرد در ترنسکریپتومیکس
ArrayExpress: پایگاهی در EBI میباشد که دادههای ژنومیکس عملکردی را در خود ذخیره کرده است و پایگاه مناسبی برای دانلود دادههای خام و مقایسه بیان ژنهای متفاوت در بافتهای مختلف میباشد.
تصویر 18-9: نماد پایگاه ArrayExpress.
CGAP[1] : وظیفهی آن کشف آناتومی مولکولی سلولهای سرطانی میباشد. در حقیقت این ابزار، پروفایلهای بیان ژن را به وسیلهی مقایسهی الگوهای بیان ژنی در سلولهای نرمال، پیش سرطانی و بدخیم بافتها مختلف ارائه میدهد.
UniGene DDD[2]: ابزاری است که با استفاده از یک آزمون آماری، پروفایلهای بیان ژن کتابخانههای cDNA مورد نظر را مقایسه میکنند. به کمک این ابزار ژنهایی که سطوح بیانشان به طور معناداری از یک بافت به بافت دیگر متفاوت باشد، شناسایی میشوند.
PCR الکترونیکی[3] : این ابزار اجازهی جستوجوی STSها (به عنوان نشانه یا راهنما[4] در انواع مختلفی از نقشههای ژنومی) در توالی DNA مورد نظر را میدهد. منبع UniSTS حاوی تمام اطلاعات در زمینهی نشانگر STS از قبیل توالی آغازگر، طول محصول، اطلاعات نقشه و اسامی دیگر آن است.
Model Maker: امکان ایجاد توالی mRNA از روی توالی ژنوم را فراهم میکند. در حقیقت با کمک این ابزار میتوان برای ساخت یک مدل ژنی دلخواه و یا ویرایش مدل از راه انتخاب یا حذف اگزونهای مورد نظر بهره جست.
[1]-The cancer gGenome Anatomy Project
[2]-UniGene digital differential display
[3]-Electronic PCR
[4]-Landmark
217-ترنسکریپتومیکس
ORF Finder: این برنامه ORFهای ممکنه در یک توالی DNA را به وسیلهی قرار دادن کدونهای شروع و پایان مشخص مینماید. همچنین توالی آمینواسیدی استنباط شده را میتوان با استفاده از ابزار BLAST در NCBI بررسی کرد.
SAGEmap: ابزاری برای انجام آزمونهای آماری برای تجزیه و تحلیلهای مختلف دادههای SAGE[1] میباشد. با وارد کردن یک توالی تقاضا در منبع SAGEmap، میتوان فهمید که آیا قطعات SAGE در توالی وجود دارد یا خیر.
Spidey: همردیفی یک و یا بیش از یک توالی mRNA را با یک توالی ژنومی فراهم میکند. این برنامه همچنین ساختار اگزون / اینترون را تعیین خواهد کرد.
تصویر 19-9: نماد پایگاه Spidey.
Splign: برای محاسبهی همردیفیهای cDNA با DNA ژنومی براساس یک نوع ویژه از الگورتیم نیدلمن و وانچ به همراه ابزار BLAST عمل میکند.
تصویر 20-9: نماد پایگاه Splign.
Vec Screen: ابزاری برای شناسایی قطعات یک توالی اسید نوکلئیکی (که ممکن است حاصل یک حامل، لینکر یا سازگارساز باشد)، قبل از تجزیه توالی است.
Viral Genotyping Tool: یک برنامه مبتنی بر شبکه است، که ژنوتیپ توالیهای نوکلئوتیدی ویروسهای نوترکیب و غیرنوترکیب را مشخص میکند. این برنامه با کمک BLAST مقایسهی یک توالی ورودی را با مجموعهای از توالی منبع (با ژنوتیپهای شناخته شده) انجام میدهد. ژنوتیپهای منبع از قبل برای پاتوژن ویروس شامل HIV-1، هپاتیت C و هپاتیت B و همچنین پولوویروسها[2] مشخص و در دسترس هستند.
پورتالBIO GPS : یک منبع مفید در زمینه میزان بیان ژنها میباشد که در کنار این اطلاعاتی در مورد ژنها در اختیار کاربران قرار میدهد. در تصویر 21-9 میزان بیان ژن TNF در بافتهای مختلف به نمایش گذاشته شده است.
تصویر 21-9: یک نمونه رکورد پورتال BIO GPS.
[1]-Serial Analysis of Gene Expression
[2]-Poliovirus
218-فصل نهم
7-9 پدیده ترجیح کدونی
هنگامیکه فراوانی ذاتی کدهای ژنتیکی کشف شد دانشمندان درباره نقش جهشهای همنام (مترادف) سرگردان شده بودند، قاعده اصلی بیولوژی مولکولی حاکی از آن بود که جهشهای مترادف (آنهایی که آمینواسید کدگذاری شده را تغییر نمیدهند) هیچ اثری روی توالی پروتئین حاصله ندارند و در نتیجه هیچ اثری روی علمکرد سلولی، تکامل یا کارایی ارگانیسمی ندارند. با این وجود، در اکثر ژنومهای توالییابی شده، کدونهای مترادف با فراکانس برابری استفاده نمیشوند. این پدیده که codon usage bias نامیده میشود هماکنون از طریق تاثیراتش بر روی پروسههای متنوع از پردازش RNA گرفته تا ترجمه و فولدینگ پروتئین بهعنوان عامل مهمی در بیان ژن و عملکرد سلولی شناخته شده است.
کدونهای مختلفی که منطبق با آمینواسید یکسان میباشند بهعنوان مترادف در نظر گرفته میشوند، با این حال tRNAهای مطابق با آنها ممکن است میزانشان در سلول و در نتیجه سرعتی که در آنها بهوسیله ریبوزوم شناسایی میشوند نیز متفاوت باشد. همچنین توالی نوکلئوتیدی متفاوت برای یک پروتئین ممکن است منجربه تولید mRNAهایی با ساختار ثانویه و پایداری متفاوت شود، که ممکن است ترجمه و حتی تاخوردگی پروتئین را تحت تأثیر قرار بدهد. اکثر توالی DNA کدکننده پروتئین از کدونهای هممعنی با فرکانسهای بسیار متفاوتی استفاده میکنند. اولین گزارشات در مورد ترجیح کدونی به چهار دهه قبل برمیگردد. کلارک (1970) و بعداً ایکومورا (1981) و آکاشی (1994) پیشنهاد کردند که مصرف کدونی برای انطباق با استخر tRNA ارگانیسم سازش پیدا کردهاند. تفاوتهای مشاهده شده در codon bias بین گونهها نتیجه نیروهای تکاملی متفاوتی میباشند که این نیروها روی انتخاب کدونها عمل میکنند. مصرف کدونی نه تنها بین ارگانیسمها بلکه در ژنوم یک ارگانیسم هم میتوانند به میزان زیادی متفاوت باشند. در برخی مواد این پدیده میتواند به شدت قوی باشد مثلاً برخی گونهها مثل Thermus thermophiles از برخی کدونها تقریباً بهطور کامل اجتناب میکنند.
اثرات سازش کدونی بر سطوح بیان پروتئین هترولوگ نوترکیب
مطالعات زیادی در مورد اثرات کدونهای نادر بر بیان هترولوگ در E.coli انجام شده است. این مطالعات نشان داده است که وجود قطعاتی از کدونهای نادر AGA یا AGG موجب توقف حرکت ریبوزوم و برش mRNA، تغییر چارچوب ریبوزومی یا استفاده از آمینواسید اشتباه در طی ترجمه میشوند. کدونهایی که بهوسیله tRNAهای نادر خوانده میشوند ممکن است سرعت طویل شدن رشته پلی پپتیدی را تا چند برابر کاهش دهند. در ضمن قطعاتی از کدونهای AGG نزدیک محل اتصال ریبوزوم (RBS) میتواند با ایجاد مانع در مرحله شروع، ترجمه پروتئین را کاهش دهد.
بهطور کلی، هر چه میزان کدونهای نادر در ژن بیشتر باشد، احتمال کمتری وجود دارد که پروتئین هترولوگ در سطح خوبی بیان شود. وجود کدونهای نادر در بخش انتهایی N، سطح بیان پروتئین را به شدت کاهش میدهد. بنابراین یک راهحل معمول برای بهبود بیان این است که کدونهای نادر در ژن هدف طوری تغییر داده شوند که با الگوی ترجیح کدونی در میزبان بیانی هماهنگتر باشند. تکنیکهایی که برای این منظور استفاده میشوند از مراحل site – directed mutagenesis تا سنتز دوباره کل ژن را شامل میشوند.
با استفاده از نرمافزار DNA2.0 و روش ترجمه معکوس، تمام توالی کدونی محاسبه و بهترین توالی جهت بیان در میزبان بیانی مورد نظر را میتوان بهدست آورد. این نرمافزار با استفاده از الگوریتمهای مناسب کدونهای نادر را جایگزین و ساختارهای mRNA مشکلساز در رونویسی و ترجمه را برطرف میکند و با این روش عمل بهینهسازی کدونی (codon optimization) را انجام میدهد.