- 952
- 2023/04/28 - 11:25
- 217 بازدید
شرح فصل و نکات ویژه: در این فصل به معرفی الگوریتمها و ابزارهایی که میتوان در پیشگویی ساختاردوم و سوم پروتئینها استفاده کرد میپردازیم. همواره پیشگویی با خطاهایی روبرو است. اما مسئله مهم این است که اگر اطلاعاتی از ساختار پروتئین مورد نظر داشته باشیم بهتر از این است که در مورد ساختار آن چیزی ندانیم. تلاش برای درک ساختار پروتئینها باعث شده است تا روشها و ابزارهای پیشگویی مداوم به روز شوند و ابزارهای قویتری در[…]
شرح فصل و نکات ویژه:
- در این فصل به معرفی الگوریتمها و ابزارهایی که میتوان در پیشگویی ساختاردوم و سوم پروتئینها استفاده کرد میپردازیم.
- همواره پیشگویی با خطاهایی روبرو است. اما مسئله مهم این است که اگر اطلاعاتی از ساختار پروتئین مورد نظر داشته باشیم بهتر از این است که در مورد ساختار آن چیزی ندانیم. تلاش برای درک ساختار پروتئینها باعث شده است تا روشها و ابزارهای پیشگویی مداوم به روز شوند و ابزارهای قویتری در اختیار محققین قرار گیرد.
248-فصل دوازدهم
برای دریافت نسخه چاپی و به روز کتاب با انتشارات دکتر خلیلی تماس بگیرید. 02166568621
پروتئینها ماكرومولکولهايي هستند كه تمام اعمال مهم در ارگانيسمها را انجام میدهند از جمله اين اعمال انجام واكنشهاي بيوشيميايي، انتقال مواد غذايي و تشخيص و انتقال پيامها است. بنابراين ژنها خزانه اطلاعات و پروتئینها ماشينهاي حيات میباشند. پروتئینها از بهم پيوستن اسيدهاي آمينه توسط پيوندهاي پپتيدي به صورت يك زنجيره بوجود ميآيند. پروتئینها از نظر طول زنجيره (از 30 تا بيش از 000/30 اسيد آمينه) و همچنين ترتيب قرار گرفتن اسيدهاي آمينه، با هم متفاوت هستند. پروتئين پيش از بدست آوردن ساختار سه بعدي نهايي از يك ساختار منظم به نام ساختار دوم گذر میكند.
پروتئینهايي كه ما در طبيعت مشاهده میكنيم از طريق انتخاب طبيعي تكامل يافته اند، تا عملي خاص را انجام دهند. عملكرد پروتئینها به ساختارفضايي آنها بستگي دارد. اسيدهاي آمينه كه با ترتيبي خاص كنار هم قرار گرفته اند (ساختار اول) با پيچ و تاب[1] خوردن در رو و كنار يكديگر زير واحدهايي را میسازند (ساختار دوم) كه با استفاده از آنها ساختار فضايي پروتئين ساخته میشود (ساختار سوم) و حتي گاه چند واحد اينچنيني با قرار گرفتن در كنار هم ساختمان عظيمتري (ساختمان چهارم) را بوجود میآورند. توالی آمینواسیدی یا ساختار اولیه یک پروتئین را نخستین بار فردریک سانگر 1953 برای انسولین تعیین کرد. ساختار سه بعدی یا ساختار سوم را نخستین بار جان کندرو در 1960 با استفاده از پراش پرتو x بلورهای پروتئین برای میوگلوبین شرح داد و همچنین روش پراش اشعه x را ماکس پروتز تکمیل کرد.
اگر هر آنچه از اهميت و عملكرد پروتئینها ميدانيم را وابسته به ساختمان فضايي آن بدانيم، براي درك فعاليتهاي زيستي پروتئینها علاقمنديم كه قادر به شناختن يا پيشگويي ساختمان سه بعدي از روي توالي اسيدهاي آمينه باشيم. با وجود تلاشهاي قابل ملاحظه در طول سالهاي گذشته هنوز اين امر ميسر نيست و مسأله چگونگي تاخوردن توالي اسيدهاي آمينه به ساختمان فضايي پروتئين حل نشده باقي مانده است.
1-12 ساختمان پروتئینها
ساختمان پروتئینها بطور تجربي بوسيلة تكنيكهاي بلور نگاري[2] پرتوي ايكس و رزنانس مغناطيسي هسته[3] تعيين میشود. در طول 30 سال گذشته ساختمان بيش از 14000 پروتئين شناخته شده است و توالي بيش از 600000 پروتئين مشخص شده است. اين موضوع حجم زيادي از اطلاعات را فراهم آورده است كه میتوان با استفاده از آنها اصول بنيادي ساختمان پروتئینها را استنتاج كرد.
اين اصول درك چگونگي ايجاد ساختمان پروتئینها، رابطة ساختمان و عمل و اساس ارتباط خويشاوندي بين پروتئینها را آسان كرده است. علم ساختمان پروتئين در مرحلة شناسايي و طبقه بندي است كه در اين مرحله ما ميتوانيم اجزاي شاخص و الگوها را در پروتئینهايي كه ساختمان سه بعدي آنها تعيين شده است مشخص كنيم.
در زنجیر اسیدهاي آمینه ي موجود در یک توالی سه نوع پیوند وجود دارد که در طول زنجیره تکرار میشود. این سه نوع پیوند به شرح زیر میباشند:
پیوند ω: پیوند بین گروه آمین یک اسید آمینه با گروه کربوکسیلیک اسید آمینه مجاورش را پیوند امگا گویند. این پیوند دارای رزونانس و خصوصیات یک پیوند دوگانه است و از آنجا که پیوند دوگانه توانایی چرخش را ندارد این پیوند نمیتواند هر زاویه پیوندی را ایجاد کند.
پیوند ψ: پیوند بین کربن مرکزی هر اسید آمینه (کربن الفا) با گروه کربوکسیلیک مجاورش را زاویه سای گویند.
پیوند Φ :پیوند بین کربن مرکزی هر اسید آمینه (کربن آلفا) با گروه آمین مجاورش را زاویه فی گویند.
اولين نتايج ساختماني بلور نگاري روي پروتئینهاي كروي در 1958 براي ميوگلوبين گزارش شد و مانند يك شوك به كساني كه اميدوار بودند پروتئين ساختماني ساده داشته باشد و داراي اصول عمومي شبيه به ساختمان ساده DNA دو رشته اي باشد، وارد شد. جان كندرو [4]پس از تعيين ساختمان ميوگلوبين اين نااميدي در مورد پيچيدگي ساختمان پروتئین را با جملات زير بيان كرد : “شايد قابل توجه ترين ويژگي ملكول، پيچيدگي آن و فقدان تقارن باشد كه از هر آنچه كه بوسيلة تئوري ساختمان پروتئين پيش بيني میشد پيچيده تر است.”
امروزه روشن است كه اين بي نظمي براي پروتئینها – بدليل اعمال بسيار متنوعشان – لازم است. ذخيرة اطلاعات و انتقال آنها از DNA ضرورتاً خطي است و ملكولهاي DNA با محتواي اطلاعاتي مختلف ساختمان كلي يكساني دارند.
[1] Folding
[2] Crystallography
[3] NMR
[4] John Kendrew
249-پیشگویی ساختار دوم و سوم پروتئین
بر عكس پروتئینها بايد بوسيلة هزاران ملكول متفاوت در سلول بوسيلة ميانكنشهاي ساختمان سوم تشخيص داده شوند كه اين موضوع مستلزم آنست كه ساختمان پروتئینها متنوع و غير منظم (فاقد نظمي ساده) باشد. علي رغم اين نياز ويژگيهاي منظمي در ساختمان پروتئینها وجود دارد كه مهم ترينشان ساختمان دوم آنها میباشد.
مارپيچ آلفا از عناصر كلاسيك ساختمان پروتئين است كه اولين بار در 1951 توسط پائولينگ[1] توصيف شد. او پيشگويي كرد كه اين ساختمان بايد پايدار و از نظر انرژتيك در پروتئين مناسب باشد. مارپيچ آلفا در پروتئين وقتي پيدا میشود كه دريك قطعه از توالي، همگي زواياي φ و ψ تقريباً 60- و 50- داشته باشند. در مارپيچ آلفا در هر دور 6/3 واحد اسيدآمينه دارد با پيوندهاي هيدورژني بين گروه كربونيل باقيمانده n وگروه آمينو باقيمانده n+4. بنابراين همة گروههاي آمينو و كربونيل به استثناي اولين آمينو و آخرين كربونيل در انتهاهاي مارپيچ با هم پيوند هيدروژني دارند. در نتيجه انتهاهاي مارپيچ آلفا قطبي هستند و اغلب در سطح پروتئين يافت میشوند.
تصویر 2-12: مارپيچ آلفا. اتمهاي اكسيژن و نيتروژن زنجيره اصلي در مارپيچ آلفا با يكديگر پيوند هيدروژني دارند.
مارپيچهاي آلفا كه در پروتئینها مشاهده میشوند اغلب راستگرد هستند. گاهگاهي قطعات كوچك (3 تا 5 باقيمانده) از مارپيچهاي آلفا چپگرد مشاهده میشود. همة پيوندهاي هيدروژني در يك مارپيچ آلفا در يك جهت هستند به دليل آنكه واحدهاي پپتيدي در يك جهت در طول محور مارپيچ دنبال هم قرار گرفتهاند.
اثر كلي يك دو قطبي خالص براي مارپيچهاي آلفا اين است كه يك بار مثبت جزئي درانتهاي آمينو و بار منفي جزئي در انتهاي كربوكسي مارپيچ آلفا دارد اين بار براي جذب ليگاندهاي با بار مخالف و ليگاندهاي با بار منفي بهويژه آنهايي كه داراي گروه فسفات هستند و معمولاُ به انتهاي نيتروژن مارپيچ آلفا وصل میشوند اثر دارد.
ديده شده است كه زنجيرههاي جانبي مختلف تمايل[2] ضعيف اما معيني براي حضور در مارپيچ آلفا يا عدم حضور در آن دارند. بنابر اين آلانين، گلوتاميك اسيد، لوسين و متيونين تشكيل دهندههاي خوب مارپيچ آلفا هستند در حاليكه پرولين، گلايسين، تايروزين و سرين از اين نظر بسيار ضعيف هستند.چنين تمايلاتي براي هر تلاش اوليه براي پيشگويي ساختمان دوم از توالي اسيدهاي آمينه نقطه مركزي هستند اما به اندازه كافي قوي نيستند كه باعث یک پيشگويي دقيق شوند.
[1] Pauling
[2] preference
250-فصل دوازدهم
عموميترين مكان براي مارپيچهاي آلفا در ساختمان پروتئين در طول سطح خارجي پروتئين است كه يك سمت از مارپيچ به طرف حلال و سمت ديگر به طرف آبگريز داخلي پروتئين است. بنابراين با 6/3 اسيدآمينه در هر دور تمايلي براي زنجيرههاي جانبي به تغيير از آبگريز به آبدوست با تناوب سه يا چهار اسيد آمينه[1] وجود دارد. هر چند اين گرايش بعضي مواقع در توالي اسيدهاي آمينه ديده میشود اما به اندازه كافي براي پيشگويي ساختمان به تنهايي كافي نيست. زيرا اسيد آمينههايي كه به سمت محلول هستند میتوانند آبگريز باشند و به علاوه مارپيچهاي آلفا میتوانند بطوركامل در داخل پروتئين يا كاملاً در معرض حلال باشند. همانطور که در شکل زیر مشاهده میکنید انواع مختلفی از هلیکس وجود دارد.آلفا هلیکسی که به صورت معمول میشناسیم 4.13 هلیکس میباشد، یک هلیکس دیگر به نام 3.10 هلیکس نیز وجود دارد که نازکتر و بلندتر از آلفا هلیکس معمول میباشد.
تصویر 3-12: انواع مارپيچ آلفا. سمت راست pi helix، وسط 3.10 helix و سمت چپ alpha helix.
دومين عنصر ساختماني اصلي كه در پروتئینهاي كروي پيدا میشود صفحات بتا هستند. اين ساختمان از تركيب چندين منطقه زنجير پلي پپتيدي ساخته شده است – بر خلاف مارپيچ آلفا كه از يك منطقه پيوسته ساخته شده است. اين مناطق، رشتههاي بتا، معمولاً 5 تا 10 اسيد آمينه طول دارند. اين رشتههاي بتا در مجاور يكديگر رديف ميشوند (شكلهاي 5 و6) بهطوريكه پيوندهاي هيدروژني میتوانند بين گروههاي كربونيل يك رشته بتا و گروههاي آمین روي رشته مجاور و بر عكس تشكيل شوند. صفحات بتا كه از چندين رشته بتا تشكيل ميشوند چين خورده[2] هستند و اتمهاي كربن آلفا به ترتيب بالا و پايين صفحه صفحات بتا وجود دارند. زنجيرههاي جانبي هم از اين الگو پيروي ميكند. و در طول يك رشته بتا آنها بطور متناوب بالا و پايين صفحه بتا قرار ميگيرند.
رشتههاي بتا به دو طريق میتوانند براي تشكيل صفحات چين خورده با هم ميانكنش داشته باشند يا به حالت صفحه موازي همسو[3] و يا به حالت موازي ناهمسو[4] مشاهده میشوند. چگونگي برقراري پيوندهاي هيدروژني در هر يك از اين دو نوع، الگويي اختصاصي و قابل تشخيص دارد.
[1] residue
[2] Pleated
[3] Parallel
[4] anti parallel
251-پیشگویی ساختار دوم و سوم پروتئین
تصویر 4-12: نمایی از صفحات بتا موازي ناهمسو و همسو.
3-1-12 سلسله مراتب ساختماني پروتئینها
بيوشيميست دانماركي لانگ[1] اصطلاحات ساختمان اول[2]، دوم [3]و سوم [4]را براي تأكيد بر سلسله مراتب ساختماني در پروتئینها وضع كرد. ساختمان اول توالي اسيدهاي آمينه يا به عبارت ديگر آرايش اسيدهاي آمينه در يك زنجيره پليپپتيد خطي است. دو پروتئين مختلف كه تشابه معنيداري در ساختمان اول داشته باشد گفته میشود كه با يكديگر همولوگ هستند و بنابراين توالي DNA آنها نيز مشابه است. باور عمومي بر اين است كه دو پروتئين همولوگ از نظر تكاملي نيز بهم مرتبط هستند و از يك ژن اجدادي مشترك تكامل يافتهاند.
ساختمان دوم بطور عمده از رشتههاي بتا و مارپيچ آلفا ساخته شده است. تشكيل ساختمان دوم در يك منطقه محلي از زنجيره پليپپتيدي تا حدي بوسيله ساختمان اول تعيين میشود. تواليهاي آمينواسيدي خاصي براي رشتههاي بتا يا مارپيچ آلفا مناسب است و بقيه براي تشكيل مناطق حلقه مناسب هستند. عناصر ساختمان دوم معمولاً خودشان را در شكل موتيفهاي ساده آرايش ميدهند. موتيفها بوسيلة چفت شدن[5] زنجيرههاي جانبي مارپيچهاي آلفا يا رشتههاي بتاي مجاور و نزديك بهم تشكيل ميشوند.معمولاً چندين موتيف براي تشكيل ساختارهاي فشرده كروي [6] – كه دمین[7] ناميده ميشوند – با هم تركيب ميشوند.
اصطلاح ساختمان سوم را به عنوان يك اصطلاح مشترك هم براي طريقه آرايش موتيفها به ساختمانهاي دمِين و هم براي راهي كه يك زنجيره پليپپتيدي به چندين دمِين تا[8] ميخورد بكار ميبريم. در همة مواردي كه مشاهده شده، نشان داده شده است كه اگر توالي اسيدهاي آمينه در دو دمِين در پروتئینهاي مختلف همولوژي داشته باشند، اين دمِينها ساختمان سوم مشابه دارند.
مولكولهاي پروتئيني كه فقط يك زنجيره اصلي دارند پروتئینهاي تك رشته اي[9] ناميده ميشوند. اما تعداد زيادي از پروتئینها ساختمان چهارم [10] دارند كه از چند زنجيره پروتئين مشابه كه در يك ملكول چند زنجيره اي [11] تجمع يافتهاند
[1] Kui linderstrom lang
[2] primary
[3] secondary
[4] tertiary
[5] packing
[6] Compact globular
[7] domain
[8] fold
[9] monomeric
[10] quaternary
[11] Multimeric
252-فصل دوازدهم
تشكيل شدهاند. اين زيرواحدها میتوانند بطور مستقل يا با اثر تعاوني روي يكديگر بطوريكه فعاليت يك پروتئين وابسته به فعاليت زير واحد ديگر باشد عمل كنند.
واحد بنيادي ساختمان سوم دمین است. يك دمین بعنوان يك زنجيره پليپپتيد يا قسمتي از يك زنجيره پليپپتيدي تعريف شده است كه میتواند بطور مستقل به ساختمان سوم پايدارتا بخورد. دمینها همچنين واحدهاي فعاليت هستند. اغلب، به دمینهاي مختلف يك پروتئين عملكردهاي مختلف نسبت داده میشود.
تصویر 5-12: سلسله مراتب ساختماني پروتئینها.
2-12 روشهای تجربی تعیین ساختار پروتئین
کشف ساختار سوم و چهارم یک پروتئین راهنمای بسیار مهمی برای تعیین کارکرد این پروتئین است. از روشهای معمول میتوان به پراش اشعه ایکس و تشدید مغناطیسی هسته اشاره کرد. تاشدگی پروتئین فرایندی فیزیکی است که در آن پلیپپتید به ساختار سهبعدی مشخصی پیچیده میشود. هر پروتئین از یکی پلیپپتید آغاز میشود. پلیپپتید زنجیرهای از اسیدهای آمینه هستند که در آغاز هیچ ساختار سهبعدی مشخصی ندارند (سمت چپ شکل روبهرو). ولی هر اسید آمینه در زنجیره میتواند ویژگیهای شیمیایی خاصی داشته باشد؛ مثلاً آبدوست (هیدروفیل) یا آبگریز (هیدروفوب) یا باردار باشد. اسیدهای آمینه به خاطر این ویژگیها با یکدیگر و با محیط سلول برهمکنش میکنند و سرانجام ساختار سهبعدی ویژهای را که همان ساختار اصلی پروتئین است به خود میگیرند (سمت راست تصویر 5-12). این ساختار را ترتیب زنجیرهی اسیدهای آمینه تعیین میکنند. سازوکار تاشدگی پروتئین هنوز کاملاً شناخته نشده است.
اسیدهای آمینه ازیک گروه آمین و یک گروه کربوکسیل و یک زنجیرهی جانبی ساخته شدهاند وبا پیوندهای کوالانسی به هم متصلند. پیوند کوالانسی بین اسیدهای آمینه بسیار محکم است به طوری که امکان جابجایی و چرخیدن به اتمهای N-H و C=O را نمیدهد، اما سایر پیوندها دارای استحکام کمتری بوده و امکان چرخیدن برایشان وجود دارد. این ویژگی باعث میشود پروتئینها خاصیت انعطاف پذیری پیدا کنند و بتوانند تا بخورند.
253-پیشگویی ساختار دوم و سوم پروتئین
پروتئینها در اثر تا خوردگی شکل فضایی را ایجاد میکنند که دارای کمترین انرژی است. وقتی پروتئین تا میخورد پیوندهای ضعیف غیر کوالانسی به تثبیت تا خوردگی کمک میکنند. این پیوندها عبارتند از: پیوند یونی، پیوند هیدروژنی، برهمکنشهای واندروالس و نیروهای آب گریز. همانطور که گفته شد زنجیره جانبی متصل به اسیدهای آمینه میتوانند قطبی یا غیر قطبی باشند. وقتی پروتئین در آب سیتوزولی قرار میگیرد زنجیرههای جانبی آب گریز تمایل دارند بصورت یک مجموعه در درون مولکول پروتئین قرار بگیرند تا حداقل تماس با مولکولهای قطبی آب را داشته باشند و اثر تضعیف کننده آنها بر پیوندهای هیدروژنی آب حداقل باشد. از طرف دیگر زنجیرههای جانبیای که قطبی هستند تمایل دارند که در روی سطح مولکول پروتئین قرار بگیرند و با مولکولهای آب و یا سایر مولکولها پیوند هیدروژنی ایجاد کنند. بنابراین خاصیت آب گریزی زنجیرههای جانبی در تعیین شکل پروتئین نقش اساسی دارد.
در اثر تا خوردن، پروتئینها شکل نهایی پیدا میکنند که یکتا و دارای کمینه انرژی است. تمامی اطلاعات لازم برای تا خوردن پروتئین در توالی اسیدهای آمینه آن نهفتهاست. زیرا این توالی منحصر به فرد محل قرارگیری زنجیرهای جانبی را تعیین کرده وشکل نهایی پروتئین را تعیین میکنند. تا خوردن پروتئین در درون سلول یکی از فرایندهای حیاتی زیستی است. در اثرتا خوردن نامناسب تجمعاتی ایجاد میشود که میتواند به بافت سلول آسیب برساند. برخی از بیماریهای عصبی مانند آلزایمر و بیماری هانتینگتون در اثر بد تا خوردن پروتئین در بافتهای عصبی ایجاد میشوند. در فرایند تا خوردن، پروتئین مسیرهایی را از نظر سطح انرژی طی میکند. در ابتدا پروتئین یک رشتهی فاقد ساختار مشخص با انتروپی بالاست. ضمن فرایند تا خوردن اتمهای ستون فقرات پروتئینی با ایجاد انواع پیوندهای مناسب یا نا مناسب با سایر اتمهای ستون فقرات پروتئینی ویا زنجیره جانبی باعث تغییر در سطح انرژی پروتئین میشوند.
فرایند تا خوردن که درآن پروتئین از حالت تا نخورده به حالت نهایی میرسد را میتوان از دیدگاه آماری بررسی نمود. میتوان به جای یک پروتئین که فرایند تا خوردن را با تعداد زیادی پیکربندی ممکن از نظر انرژی تجربه میکند یک مجموعه از همه پیکر بندیهای ممکن انرژی در نظر گرفت و تعداد حالتهایی که در آن انرژی مقدار خاصی است را بدست آورد و برای آن سیستم آنتروپی را محاسبه نمود و به این ترتیب انرژی آزاد گیبس را به دست آورد. حالت نهایی سیستم در کمینه انرژی اتفاق میافتد. بررسی سیستم از نظر اماری به ما این امکان را میدهد که فرایند تا خوردن را با جزئیات شبیه سازی کنیم و این فرایند را بهتر بشناسیم.
پارادوکس لوینتال
یکی از مباحث جالب درتا خوردن پروتئین، مسئله زمان تا خوردن است. مدت زمان لازم برای این فرایند در درون سلول از مرتبه ثانیهاست. نخستین بار لوینتال با محاسبه پارامتر سرعت واکنش از رابطه آرنیوس مدت زمان لازم برای تا خوردن پروتئین را محاسبه کرد. وی این زمان را با در نظر گرفتن تمامی مسیرهای ممکن انرژی انجام داد و جوابی که بدست آورد یک عدد نجومی بود. لوینتال نتیجه گرفت که در فرایند تا خوردن پروتئین، همه مسیرهای ممکن انرژی طی نمیشوند و مسیر ویژهای برای تا خوردن وجود دارد.
تعیین ساختار سهبعدی پروتئین به طور تجربی بسیار دشوار است. ولی در مورد ترتیب زنجیرهی توالیهای هر پروتئین معمولاً اطلاعات موجود است. پژوهشگران میکوشند روشهای زیستفیزیکی گوناگون را به کار بگیرند تا ساختار سهبعدی نهایی را از روی دنبالهی اسیدهای آمینه پیشبینی کنند. بسیاری از پروتئینها برای کار حتماً باید ساختار سهبعدی درست خود را دارا باشند. معمولاً اگر پروتئینی نتواند به ساختار درست خود تا شود، غیرفعال میشود.
3-12 پيشگويي ساختمان پروتئینها
داشتن اطلاعات درباره جزئيات ساختمان سه بعدي يك پروتئين براي توسعه درك عملكرد آن ضروري است. متاسفانه در مقايسه با تعداد بسيار زياد تواليهاي شناخته شده، ساختمان تعداد كمي از پروتئینها شناخته شده است. با رشد بيشتر شكاف بين تواليها و ساختمانهاي شناخته شده، نياز به توسعه روشهاي پيشگويي ساختمان كه قابل اعتماد باشند افزايش يافتهاست. بويژه براي پروتئینهايي كه تعيين ساختمان آنها بطريق تجربي ممكن نباشد و پروتئيني با توالي مشابه با آن كه ساختمانش شناخته شده باشد نيز يافت نشود. بعلاوه روشهاي پيشگويي موفق، به روشن شدن رابطه بين توالي اسيدهاي آمينه و ساختمان پروتئینها كمك ميكند و میتواند به طراحي پروتئینهاي جديد و مهندسي آنها كمك كند.
254-فصل دوازدهم
1-3-12 طبقه بندي ساختمانهاي پروتئيني
رشد روز افزون ساختمان پروتئینهای شناخته شده،یافتن یک شمای کلی از ساختمانهای مختلف، یافتن مشابهتها و همینطور به منظور بهترشدن روشهای پیش گویی بهترین راهکار طبقه بندی ساختمانهای پروتئینی میباشد مثلا براساس يك توجه ساده به موتيفهاي متصل بهم، Michael Levitt و Cyrus Chotia يك طبقهبندي از ساختمانهاي پروتئيني استخراج كرده و ساختمان دمینها را به سه گروه اصلي طبقهبندي كردند. a دمينها، bدمينها وa/b دمينها. در ساختمانهاي a، هسته [1]بطور انحصاري از مارپيچهاي a ساخته شده است. در ساختمانهاي b هسته از صفحات b موازي ناهمسو تشكيل شده و معمولاً دو صفحه b برروي يكديگر چفت[2] شدهاند. ساختمانهاي a/b از تركيبي از موتيفهاي b-α-b ساخته شدهاند كه يك صفحه b موازي که غالباً همسو میباشد بهوسیلهی مارپیچهای a احاطه شده است.
تصویر 6-12: طبقه بندي ساختمانهاي پروتئيني.
بعضي از پروتئینها از تركيبي از موتيفهاي b و α جدا از هم ساخته میشوند و معمولاً این ترکیبات يك صفحه كوچك b موازي ناهمسو در يك قسمت از دمِين كه در برابر تعدادي از مارپيچهاي α چفت شده است تشكيل ميدهند که اين ساختمانها را ميتوان متعلق به چهارمين گروه كوچكي بنام b+ α در نظر گرفت. علاوه براين گروهها، تعدادي از پروتئینهاي كوچك هستند كه غني از پيوندهاي ديسولفيدي يا اتمهاي فلزي هستند و يك گروه خاص را تشكيل ميدهند. به نظر ميرسد ساختمان اين پروتئینها از حضوراين فلزات يا ديسولفيدها به شدت تأثير ميگيرد و اغلب همانند نسخههاي به هم ريخته اي[3] (غيرطبيعي) از پروتئینهاي عادي تر بنظر ميرسند.
طبقه بندیها یا همان کلاسیفیکیشنهای متعددی برای پروتئینها وجود دارد که هر کدام از این طبقهبندیها بر اساس یک اصولی بنا شده است. مثلا بانک اطلاعاتی SCOP بر اساس چشم محقق استوار است و ساختمانها را طبقه بندی نموده و ارتباط تکاملی و ساختمانی را نمایش میدهد. SCOP توسط Murzin و همکارانش در سال 1995 ایجاد شد. سطوح طبقهبندی در SCOP به شرح CLASS, FOLD, SUPERFAMILY, FAMILY میباشد که در تصویر 7-12 نمایش داده شده است.
[1] Core
[2] pack
[3] distorted version
255-پیشگویی ساختار دوم و سوم پروتئین
تصویر 7-12: کلاسیفیکیشن بانک اطلاعاتی SCOP .
با توجه به این که طبقه بندیهای مختلفی برای پروتئینها وجود دارد در جدول 1-12 تعدادی از مهمترین بانکها و نحوه طبقه بندی آنها و شرحی در رابطه با انواع طبقه بندیها آورده شده است.
جدول 1-12: انواع طبقه بندی پروتئینها.
256-فصل دوازدهم
ادامه جدول 1-12: انواع طبقه بندی پروتئینها.
257-پیشگویی ساختار دوم و سوم پروتئین
دلايل پيشگويي كلاس ساختاري پروتئینها
در طي دهه اخير پيشگويي كلاس ساختاري پروتئینها با روشهاي گوناگون به دلايل زير بسيار مورد توجه بوده است:
1 – مفاهيم كلاس ساختاري پروتئینها بر اساس محتواي ساختار دوم در يك پروتئين از نقطه نظر تجربي و تئوري بسيار مفيد میباشد.
2 – كلاس ساختاري يك پروتئين بيان كننده ساختار كلي آن پروتئين است كه میتواند در بهبود مطالعات ساختماني پروتئين موثر باشد.
3 – با داشتن كلاس ساختاري پروتئینها میتوان دقت پيشگويي ساختار دوم آنها را از روي رديف اسيدهاي آمينه بطور قابل توجهي بهبود بخشيد.
4 – با اطلاعات بدست آمده از كلاس ساختاري پروتئين میتوان تعداد ساختارهاي احتمالي را در روش كمينه كردن انرژي جهت تعيين ساختار سوم يك پروتئين محدود كرد.
5 – علاوه بر نقش مهم كلاس ساختاري پروتئين در بهبود محاسبات ضرايب آبگريز (تعيين سطح در دسترس پروتئين)، میتوان ارتباط آن را با خواص گوناگون پروتئين مثل قرار گرفتن در اجزاء خارج يا داخل سلولي و يا فعاليت زيستي (آنزيم بودن يا نبودن) ذكر كرد.
2-3-12 روشهای پیشگویی ساختار دوم
بیش از بیست روش مختلف برای پیشگویی ساختار دوم وجود دارد. اساس این روشها بر این است که، توالیها موضعی (مثل ساختمان دوم) هستند. این روشها از کارآیی بالا برخوردار نیستند. برخی از این روشها عبارتند از:
- Chou- Fasman and GOR methods
- NN models
- Nearest neighbor Methods
- HMMs
258-فصل دوازدهم
1-2-3-12 روش چو- فاسمن
این روش مبتنی بر محاسبه پارامترهای پیکربندی از روی فراوانیهای مشاهده شده اسیدهای آمینه در پروتئینها با ساختمان تعیین شده میباشد. در این روش به عنوان پارامتر کنفورماسیونی اسیدهای آمینه iام برای پیکربندی x به صورت زیر تعریف میشود.
تعداد مشاهده شده اسید آمینه iام در حالت پیکربندی x، تعداد کل اسیدهای آمینه iام، تعدا مشاهده شده اسیدهای آمینه در حالت پیکربندی X و N تعداد کل اسیدهای آمینه بانک اطلاعاتی میباشد. این الگوریتم بر اساس جستوجوی هستههایی با طول 4 تا 6 اسید آمینه و سپس رشد آن از دو طرف مبتنی است. دقت این روش در حدود 51 درصد است.
جدول 2-12: خصوصیات روش پیشگویی Chou-fasman.
2-2-3-12 روش گور
در این روش، رشتهای از اسیدهای آمینه یک زنجیره پلیپپتیدی را به عنوان پیغامی که به وسیله فرآیند تاشدگی به پیغام دیگری (رشتهای از حالتهای پیکربندی) ترجمه میشود در نظر گرفته میشود. این روش بر اساس تئوری اطلاعات به روش پیشگویی گور معروف است. دقت این روش 63 درصد است.
3-2-3-12 روشهای تشابه ترکیب
اساس این روش آن است که پپتیدهای مشابه دارای ساختمانهای دوم یکسانی هستند. این روشها از لحاظ تعریف و نمرهدهی تشابه، متفاوت هستند. این روشها از طول 11 تا 17 اسید آمینهای استفاده میکنند و پیشگویی آنها بر اساس بیشترین نمره شباهت میباشد. به کمک مقیاس اطمینان است. صحت این روش 21درصد است.
4-2-3-12 شبکههای عصبی و روش شناسایی الگوها
در این روش به اسیدآمینه مربوط به توالی، کدی داده میشود که لایه ورودی را میسازند. ورودیها در یک لایه معروف به لایه پنهان در یک وزن یا فاکتور اتصال به ازاء هر حالت پیکربندی ضرب میشوند و یک فاکتور جدید به عنوان خروجی را ارائه میدهد و خروجيها تفسیر میشوند. دقت این روش 50 تا 60 درصد است.
پایگاههای بسیاری به منظور پیشگویی ساختار دوم پروتئینها موجود میباشند که برخی از آنها در جدول 3-12 آمده است. بسیاری از پایگاهها به علت حجم زیاد مراجعات توالی را از کاربر دریافت میکنند و بعد از مدتی نتیجه را از طریق ایمیل برای کاربر ارسال میکنند.
259-پیشگویی ساختار دوم و سوم پروتئین
جدول 3-12: پایگاههایی به منظور پیشگویی ساختار دوم پروتئین.
پایگاههای بسیاری به منظور پیشگویی ساختار دوم پروتئینها موجود میباشند که برخی از آنها در جدول 3-12 آمده است. بسیاری از پایگاهها به علت حجم زیاد مراجعات توالی را از کاربر دریافت میکنند و بعد از مدتی نتیجه را از طریق ایمیل برای کاربر ارسال میکنند.
جدول 3-12: پایگاههایی به منظور پیشگویی ساختار دوم پروتئین.
260-فصل دوازدهم
3-3-12 روشهای پیشگویی ساختار سوم
رشد سریع اطلاعات مربوط به توالیهای پروتیئنی در مقایسه با ساختارهای پروتئینی، بیانگر نیاز روزافزون به روشهای دیگری در تعیین ساختار سوم پروتئینها است. تعیین ساختار سوم پروتئین با روشهای تجربی وقتگیر، پرهزینه و در مواردی غیرممکن است. استفاده از روشهای تئوری پیشگویی ساختار که تنها با کمک توالی یا ساختار اولیه پروتئین اقدام به محاسبه و پیشگویی ساختار پروتئین میکند، یکی از ابزارهای نوین در مطالعه پروتئینهاست.
پیشگویی ساختار سه بعدی پروتئینها براساس سه روش اصلی انجام میشود:
1-3-3-12 مدل سازی همولوژیکی
اساس پیشبینی توسط مدل سازی همولوژیکی این است که توالی پروتئین با یک یا تعداد بیشتر پروتئین با ساختار شناخته شده شباهت داشته باشد. این روش، مدل سازی مقایسهای (CA) نیز نامیده میشود بر اساس این واقعیت که پروتئینهایی با توالیهای مشابه، ساختارهای مشابه دارند. این روش بر آن اساس که، پروتئینهای یک خانواده، بیشتر توالیهای آمینو اسیدی شان حفاظت شده است، آسان میباشد. چرا که وقتی ساختار یک پروتئین از یک خانواده به وسیلهی آزمایش تعیین شود، اعضای دیگر آن خانواده میتوانند بر اساس تطابق شان با ساختار شناخته شده مدل سازی شوند. دقت پیش گویی با این روش به میزان تشابه بین توالی پروتئین هدف و ساختارهای الگو بستگی دارد. مشکل عمده مدل سازی همولوژیکی پیدا کردن توالی هدفی است که به عنوان الگو استفاده میشود. تقریبا 57% همهی توالیهای شناخته شده حداقل یک دمین دارند که به یک پروتئین با ساختار شناخته شده وابسته میباشد.
بر اساس اصول فوق، منطقی است که پروتئینهای هومولوگ ساختارهای بسیار شبیه به هم را به خود بگیرند. از آنجا که یک فولد پروتئین از نظر تکاملی بسیار حفظ شدهتر از توالی آمینو اسیدی آن است، یک توالی هدف میتواند با دقت و صحت بالایی با توجه به یک الگو مربوط که از روی تطبیق توالیهای آمینواسیدی آنها با هم به دست آمده است، مدلسازی شود. چنانچه الگو و هدف، توالیهای مشابهی داشته باشند، همولوژی مدلینگ بسیار دقیق خواهد بود.
261-پیشگویی ساختار دوم و سوم پروتئین
جدول 4-12: معرفی برخی از سرورهای مدل سازی همولوژیکی.
2-3-3-12 تکنیک AB initio
در این روش سعی میشود تا مدل ساختار سه بعدی پروتئین تنها با استفاده از توالی و بررسی نیروها ایجاد گردد و از اطلاعات ساختاری موجود استفاده نمیشود. AB initio method، همچنین روش De-novo (مدلسازی ابتدا به ساکن) و یا
Free modeling techniques نامیده میشود. اصطلاح AB initio method در ابتدا اشاره به روشهایی داشت که برای پیشبینی ساختار پروتئین انجام میشد و از دانستههای آزمایشگاهی مربوط به ساختار استفاده نمیکرد. بعدها این اصطلاح با به وجود آمدن روشهایی بر اساس فراگمنتها مبهم شد، چرا که این روشها براساس این واقعیت به کار میروند که گر چه ما نمیتوانیم همهی فولدهای استفاده شده در بیولوژی را ببینیم، احتمالا قادر خواهیم بود تقریبا همهی زیر ساختارها را ببینیم. در این روش فرض میشود که کمترین انرژی آزاد در طول عمر پروتئین میبایست در دسترس باشد و تلاش میشود تا این مقدار کم را به وسیله بررسی بسیاری از کانفورماسیونهای ممکن پروتئین به دست آورند.
AB initio method به دو کلاس عمده تقسیم میشود:
الف) AB initio method به وسیلهی اطلاعات پایگاه داده
ب) AB initio method بدون اطلاعات پایگاه داده
اگر چه روشهای این گروه از لحاظ کامپیوتری بسیار پیچیده و هنوزفاقد دقت هستند، به چند دلیل به طور مداوم استفاده میشوند و گسترش مییابند. اولا این که در برخی از موارد حتی یک ساختار همولوگ وابسته خیلی دورهم ممکن است در دسترس نباشد. در این موارد ab initio تنها روش میباشد. دوما این که ممکن است ساختارهای جدیدی کشف شوند که به وسیلهی روشهایی که اساس شان مقایسهی ساختارهای شناخته شده است قابل شناسایی نباشند.
بر اساس مدل AB initio شکل فضایی مولکول به گونهای است که به حداقل سطح انرژی برسد (استفاده از قوانین شیمی، فیزیک و ترمودینامیک). روشهای ابتدا به ساکن یا de novo- به دنبال ساختن مدلهای سه بعدی برای پروتئین از روی توالی آن، بر اساس اصول فیزیکی به جای استفاده از ساختارهای تعیین شده قبلی هستند. برای شبیهسازی فرآیند تا خوردن پروتئینها روشهای گوناگون وجود دارند از جمله روشهای استوکستیک که برای جستوجوی راه حل، به عنوان نمونه global optimization یک پارامتر انرژی مناسب را به کار میبرند.
262-فصل دوازدهم
3-3-3-12Threading و تشخیص Fold
این روشfold recognition و3D- 1D flod recognition نیز نامیده میشود. همچنین در بعضی منابع «بندکش» ترجمه شده است. این روش یک رویکرد حد واسط دو روش قبلی است که هم از تشابه توالی در صورت وجود و هم از اطلاعات مربوط به تطابقهای ساختاری استفاده میکند. هدف این روش تطابق توالی هدف با ساختار شناخته شده در کتابخانهای از فولدها میباشد. در این روش توالی آمینواسیدی پروتئینی که ساختار آن شناخته شده نیست، بر علیه یک بانک اطلاعاتی از ساختارهای تعیین شده پویش میشود و در هر مورد، یک پارامتر امتیازدهی برای تعیین میزان همخوانی توالی با ساختار استفاده میشود و مدلهای سه بعدی محتمل پیشنهاد میگردد.
در مقایسه با میلیونها توالی پروتئین موجود تنها تعداد کمی Protoin Folds موجود است. این بدین معناست که ساختارهای پروتئین از توالی پروتئین محافظت شدهتر هستند. در نتیجه بسیاری از پروتئینها میتوانند بدون اینکه مشابهت توالی داشته باشند، پینخوردگی مشابهی داشته باشند.
جدول 5-12: معرفی برخی از سرورهای متد fold recognition
به دلیل طرفداران زیاد پیشبینی ساختار پروتئین به وسیلهی روشهای کامپیوتری، جوامع علمی تلاشهای زیادی را در حل مشکلات مختلف و محدودیتهای هر کدام از این روشها دارند. بر همین اساس با توجه به تصویر 8-12 میبینید یک روند کلی برای پیشگویی ساختار سوم پروتئینها تدوین شده است.
263-پیشگویی ساختار دوم و سوم پروتئین
تصویر 8-12: روند کلی پیشبینی ساختار پروتئین.
در رابطه با Threading و تشخیص فولد الگوریتمها میتوانند در دو گروه قرار گیرند. الگوریتمهای Pairwice energy (Threading) و الگوریتمهای Profile (Foldrecognition). این الگورتیمها بهترتیب تحت عنوان مدل سازی مقایسهای و پیشگویی ساختمان سوم به وسیله کنار هم قرار دادن عناصر ساختمان دوم نیز شناخته میشوند که در زیر شرح داده شدهاند.
4-3-3-12 مدلسازی مقایسهای
از تشابه توالی پلیپپتیدهایی با ساختمان (ساختار نه توالی) مشابه استفاده میشود. بر این اساس پروتئینها با توالی مشابه، شکل فضایی شبیه به هم پیدا میکنند. این روش، از ساختارهای از قبل تعیین شده به عنوان نقطه شروع و یا الگو استفاده میکند. اساس این روش را knowledge- based میدانند یعنی بر اساس اطلاعات ساختاری موجود در ساختار یک پروتئین طبیعی که به روشهای تجربی تعیین ساختار شده است، ساختاری برای پروتئین مورد نظر پیشگویی میشود. در این روش برای رسیدن به کمینه سطح انرژی آزاد یک پروتئین با ساختار ناشناخته و توالی معلوم، از نمونه طبیعی که از نظر توالی با آن پروتئین شباهت قابل قبولی داشته باشد استفاده میشود. این الگوریتم Pairwise energy نیز نامیده میشوند.
5-3-3-12 پیشگویی ساختمان سوم به وسیله در کنار هم قرار دادن عناصر ساختمان دوم (profile Method)
در این روش شکل تقریبی ساختمان سوم از کنار هم قرار دادن ساختمانهای دوم به طریق مختلف ایجاد میشود که با قرار دادن شرط نهایی، فقط برخی از این ساختمانها پذیرفته میشوند. در این روش از عبارات کمی که در مورد نیروهای مختلف موجود در ساختارهای پروتئینی بیان گردیده است باید انرژی پتانسیل کل یک پروتئین در یک کانفیگوراسیون مشخص محاسبه شود. در حقیقت تلاش اصلی، یافتن یک عبارت خوب برای انرژی پتانسیل یک پروتئین به صورت تابعی از موقعیت همه اتمهای آن است.
در این روش یک پروفایل برای گروهی از ساختارهای پروتئینی مرتبط ساخته میشود. پروفایل ساختاری با منطبقسازی ساختارها برای باقیماندههای متناظر تولید میشود. سپس از اطلاعات آماری این باقیماندههای انطباق یافته برای ساخت پروفایل استفاده میگردد. پروفایل شامل امتیازهایی است که تمایل هر یک از بیست اسیدآمینه را برای قرار گرفتن در هر یک از موقعیتهای پروفایل توصیف میکند. امتیازهای پروفایل شامل اطلاعات انواع ساختارهای دوم، میزان قرارگیری در معرض حلال، قطبیت و آبگریزی اسیدآمینهها است. برای پیشگویی فولد ساختاری یک توالی ناشناخته، توالی درخواستی ابتدا برای حضور ساختارهای دوم، دسترسی به حلال و قطبیت پیشگویی میشود. سپس از اطلاعات پیشگویی شده برای
264-فصل دوازدهم
مقایسه با پروفایلهای تمایلی فولدهای ساختاری مشخص، برای یافتن فولدی که بهترین پروفایل پیشگویی شده را ارائه میدهد، استفاده میشود.
به دلیل آنکه Threading و تشخیص فولد، هومولوگهای ساختاری را بدون آنکه کاملاً به شباهتهای توالی وابسته باشند، تشخیص میدهند، نشان داده شده است که نسبت به PSI-BLAST حساسیت بیشتری را در یافتن روابط تکاملی دور دارا میباشند.
4-3-12 ارزیابی کیفیت پارامترهای ساختاری مدل ساخته شده
معمولاً بعد از پیشگویی ساختار سوم یک پروتئین بهمنظور ارزیابی کیفیت پارامترهای ساختاری مدل ساخته شده نمودار راماچاندرا برای الگو و پروتئین هدف ترسیم میشود. نمودار راماچاندران وضعیت مجاز هر زاویه را برای ساختارهای پروتئین را نشان میدهد و با نامهای Ramachandran plot یا plot ψ] و [φ شناخته میشود.
هر گاه محور Xها با φ و محور Y با ψ مشخص میشود و مقادیر ψ و φ هر کدام از اسیدهای آمینه شرکت کننده در ساختار پروتئینها را مشخص کنیم، نقشهای ایجاد میشود که بهنام نقشه ساختمان فضایی یا نمودار راماچاندران معروف است. بهعبارتی هر اسید آمینهای مجموعه از مقادیر این دو زاویه را به خود اختصاص میدهد و هیچ دو اسید آمینهای نقش دقیقاً یکسانی ندارند و مثل اثر انگشت در انسان خاص همان اسید آمینه هستند.
تصویر 9-12: تصویری از نمودار راماچاندرا.
4-12 داکینگ مولکولی
تکنیک محاسباتی میباشد که میتواند برهمکنش بین دو مولکول را پیشگویی کند. این تکنیک بهطور عمده شامل الگوریتمهایی مانند دینامیک مولکولی، شیبهسازی مونت کارلوو، روش جستوجو براساس بررسی قطعات و … میباشد. مطالعات داکینگ مولکولی در تعیین بر همکنش بین دو مولکول، برای پیدا کردن بهترین جهتگیری یک لیگاند در یک کمپلکس با حداقل انرژی بهکار برده میشود نتایج بهدست آمده توسط یک تابع درجهبندی آماری تجزیه و تحلیل میشود، این تابع درجهبندی آماری برای محاسبه انرژی انترکشن آن را به مقادیر عددی به نام درجه داکینگ تبدیل میکند. نتایج بهدست آمده از داکینگ شامل اشکال 3 بعدی از لیگاند متصل شده به ماکرومولکول میباشد که میتوان با ابزارهای مشاهدهگر مانند pymol و rasmol مشاهده کرد و میتوان در بهدست آوردن بهترین حالت از لیگاند برای اینترکشن با ماکرومولکول به ما کمک کند.
فرآیند داکینگ شامل سه فاز اصلی است. فاز یک، مرحله نمونهگیری، شامل ایجاد کانفورماسیونهای مختلف لیگاند و بررسی جهتگیری آنها نسبت به جایگاه فعال رسپتور است. وقتی انعطافپذیری رسپتور هم مد نظر باشد، فاز نمونهگیری شامل تغییرات کانفورماسیونی رسپتور نیز میشود. در فاز دوم، مرحله امتیازدهی، تمایل اتصل لیگاند به رسپتور تخمین زده میشود. وقتی که داکینگ در جستوجوی مجازی ترکیبات یک کتابخانه مجازی مورد استفاده قرار میگیرد، ترکیبات براساس حالت با بهترین امتیاز رتبهبندی میشوند. امتیاز اختصاص یافته به هر حالت بر اساس ارزیابی تابع امتیازدهی که اغلب انرژی آزاد اتصال لیگاند – رسپتور را نشان میدهد بهدست میآید. در اکثر موارد
265-پیشگویی ساختار دوم و سوم پروتئین
نرمافزارهای داکینگ سادهترین حالت نمایش رسپتور را با صرفنظر از انعطافپذیری آن و همچنین نادیده گرفتن مولکولهای حلال با هدف کاهش حجم محاسبات بهکار میبرند.
یکی از روشهای اندازهگیری کارایی الگوریتم داکینگ مولکولی، بررسی قدرت نرمافزار در پیشبینی نحوه اتصال لیگاند کریستالوگرافی به همان رسپتور است که از طریق تعریف ریشه میانگین مربعات انحراف از حالت گریستالوگرافی اندازهگیری میشود. اگرچه کیفیت دستهبندی براساس RMSD در مورد مولکولهای کوچک و بزرگ مشکلساز است، این روش بهطور گسترده به عنوان معیاری برای تعریف موفقیت با شکست الگوریتم داکینگ بهکاربرده میشود. معیار دوم برای سنجش کارایی الگوریتم داکینگ مولکولی توانایی آن در پیشبینی تمایل لیگاندهای مختلف (انرژی آزاد پیوند شدن) است. چون مقیاس امتیازدهی داکینگ معمولاً در محدوده دادههای تجربی نیست، اغلب ارتباط بین امتیاز داکینگ xi و دادههای تجربی yi با استفاده از ضریب ارتباطی پیرسون CP بیان میشود. روش دیگر برای ارزیابی نتایج جستوجوی مجازی، منحنی مشخصه عملکرد سیستم یا منحنی عملیاتی دریافت کننده (ROC) است که بهطور گسترده در زمینههای مختلف بهکار برده میشود.
همانطورکه در بالا توضیح داده شد مرحله آخر داکینگ مولکول آنالیز نتایج شامل محاسبه انرژی پیوند، Kd و RMSD میباشد. خطای جذر میانگین مربعات یا انحراف جذر میانگین ((RMSD) root- mean- square deviation) یا
((RMSE) root – mean- square error) تفاوت میان مقدار پیشبینی شده توسط مدل یا برآوردگر آماری و مقدار واقعی میباشد. RMSD یک ابزار خوبی است برای مقایسه خطاهای پیشبینی توسط یک مجموعه داده است و برای مقایسه چند مجموعه داده کاربرد ندارد. همچنین این تفاوتهای مجزا را ماندهها مینامند و خطای جذر میانگین مربعات برای جمعآوری آنها در یک عدد کاربرد دارد.
شیب نمودار RMSD بیان کننده پایدار بودن مدل در طول زمان شیبهسازی (10 نانو ثانیه) است. هر چه این شیب به صفر نزدیکتر باشد مدل شبیهسازی شده پایدارتر و هر چه شیب به تدریج افزایش یابد و یا نوسان زیادی داشته باشد مدل، ناپدارتر خواهد بود. در رابطه با نموداری که در تصویر 10-12 مشاهده میکنید هیچ ناپایداری در زمان شبیهسازی مشاهده نشده است.
نمودار دیگری که روند صحیح فرآیند شبیهسازی را نشان میدهد نمودار انرژی است که در تصویر 11-12 مشاهده میکنید. برخلاف نمودار RMSD کاهش شیب نمودار انرژی بیانگر کیفیت بهتر شبیهسازی است چرا که انرژی کمتر در حالت پایدار بیشتر حاصل میشود. تغییرات انرژی در این نمودار پس از کاهش در ابتدای فرآیند در باقی مسیر یا نوسان ثابتی همراه بوده و بنابراین مدل ساخته شده در طول زمان شبیهسازی پایدار میباشد. بازه نوسان به مقدار 002/0 تا 003/0 کیلوژول بر مول قابل قبول است. در نمودار انرژی که در تصویر 11-12 مشاهده میکنید بازه نوسان کمتر از مقداری است که اشاره شد.
تصویر 10-12: نمودار RMSD برای مدلهای ساخته شده در GROMACS.
266-فصل دوازدهم
تصویر 11-12: نمودار انرژی پروتئین شبیهسازی شده در طول 10 نانو ثانیه.