هوش مصنوعی DeepMind جهشی عظیم در حل ساختارهای پروتئینی دارد



شبکه هوش مصنوعی (AI) که توسط فرزندان هوش مصنوعی گوگل DeepMind ساخته شده ، جهشی عظیم در حل یکی از بزرگترین چالش های زیست شناسی – تعیین شکل سه بعدی پروتئین از توالی اسیدهای آمینه آن – ایجاد کرده است.

برنامه DeepMind که AlphaFold نام دارد ، در یک چالش پیش بینی ساختار پروتئین دو ساله به نام CASP ، اختصار ارزیابی انتقادی پیش بینی ساختار ، از 100 تیم دیگر بهتر عمل می کند. نتایج در تاریخ 30 نوامبر ، در ابتدای کنفرانس – که عملاً در سال جاری برگزار شد – اعلام شد ، که به ارزیابی تمرین می پردازد.

جان مولت ، زیست شناس محاسباتی در دانشگاه مریلند در کالج پارک که برای بهبود روشهای محاسباتی برای پیش بینی دقیق ساختارهای پروتئینی ، در سال 1994 بنیانگذار CASP شد ، گفت: “این یک معضل بزرگ است.” “به یک معنا ، مشکل حل شده است.”

توانایی پیش بینی دقیق ساختارهای پروتئینی از توالی اسیدهای آمینه ، مزیت بزرگی برای علوم زیست پزشکی و پزشکی است. این امر به طور قابل توجهی سرعت تلاش برای درک عناصر سازنده سلول ها را فراهم می کند و امکان شناسایی سریعتر و پیشرفته دارو را فراهم می کند.

AlphaFold در جدول آخرین CASP قرار گرفت – در سال 2018 ، اولین سال شرکت DeepMind در لندن. اما امسال ، شبکه آموزش تجهیزات عمیق بالاتر از سایر تیم ها بود و به گفته دانشمندان ، عملکرد بسیار حیرت انگیزی داشت که می تواند نوید انقلابی در زیست شناسی باشد.

آندری لوپاس ، زیست شناس تکاملی در موسسه توسعه زیست شناسی ماکس پلانک در توبینگن آلمان ، که کار تیم های مختلف در CASP را ستود ، گفت: “این یک تغییر در بازی است.” AlphaFold قبلاً به او كمك كرده است تا بتواند ساختار پروتئینی را پیدا كند كه آزمایشگاه وی را برای مدت یك دهه گیج كرده است و انتظار دارد كه روش كار و مسائلی را كه با آن سر و كار دارد تغییر دهد. “این دارو را تغییر می دهد. این تحقیق را تغییر می دهد. این مهندسی زیستی را تغییر می دهد. این همه چیز را تغییر خواهد داد. “

در برخی موارد ، پیش بینی های ساختار AlphaFold از آنچه با استفاده از “استاندارد طلا” روش های تجربی مانند کریستالوگرافی اشعه ایکس و در سال های اخیر ، میکروسکوپ الکترونی الکترونیکی (cryo-EM) تعیین شده است ، قابل تشخیص نیست. دانشمندان می گویند AlphaFold ممکن است دیگر نیازی به این روشهای وقت گیر و گران از بین نبرد ، اما هوش مصنوعی امکان مطالعه موجودات زنده را به روشهای جدید فراهم می کند.

مشکل ساختار

پروتئین ها عناصر سازنده زندگی هستند که مسئول بیشتر آنچه در سلول ها اتفاق می افتد هستند. نحوه کار و عملکرد پروتئین توسط شکل سه بعدی آن تعیین می شود – “ساختار یک عملکرد است” یک اصل از زیست شناسی مولکولی است. پروتئین ها تمایل دارند بدون کمک و تنها با رعایت قوانین فیزیک ، شکل بگیرند.

برای دهه ها ، آزمایش های آزمایشگاهی اصلی ترین راه برای به دست آوردن ساختارهای پروتئینی خوب بوده است. اولین ساختار کامل پروتئین ها ، با شروع تکنیکی که در آن پرتوهای X به پروتئین های متبلور شلیک شده و نور پراش یافته به مختصات اتمی پروتئین تبدیل می شود ، تعیین می شود. کریستالوگرافی اشعه ایکس سهم شیر از ساختارهای پروتئینی را ایجاد کرده است. اما طی دهه گذشته ، Cryo-EM در بسیاری از آزمایشگاه های زیست شناسی ساختاری به ابزاری مطلوب تبدیل شده است.

مدت هاست که دانشمندان از خود می پرسیدند که چگونه اجزای تشکیل دهنده یک پروتئین – مجموعه ای از اسیدهای آمینه مختلف – پیچ و خم های شکل نهایی آن را ترسیم می کنند. محققان گفتند ، تلاش های اولیه استفاده از رایانه برای پیش بینی ساختارهای پروتئینی در دهه 1980 و 1990 عملکرد ضعیفی داشته است. ادعاهای زیاد در مورد روش های مقالات منتشر شده هنگامی از بین می روند که دانشمندان دیگر آنها را روی پروتئین های دیگر استفاده کنند.

مولت CASP را راه اندازی کرد تا سخت گیری بیشتری را در این تلاش ها ایجاد کند. این رویداد تیم ها را به چالش کشید تا ساختارهای پروتئینی را که با استفاده از روش های آزمایشی حل شده بودند اما ساختارهای آنها علنی نشده بود ، پیش بینی کنند. مولت این آزمایش را – که وی آن را یک مسابقه نمی نامد – با پیشرفت قابل توجه در زمینه ، که برای ادعاهای بیش از حد نیاز به زمان دارد ، اعتبار می داند. او می گوید: “شما واقعاً می دانید چه چیزهایی امیدوار کننده به نظر می رسد ، چه عواملی م worksثر است و چه چیزهایی برای دور شدن از آنها لازم است.”

اجرای DeepMind در سال 2018 بر روی CASP13 بسیاری از دانشمندان این حوزه را که مدتهاست یکی از سنگرهای گروه های کوچک دانشگاهی است ، شوکه کرد. جینبو سو ، زیست شناس محاسباتی در دانشگاه شیکاگو ، ایلینوی ، می گوید ، اما رویکرد او بسیار شبیه به سایر تیم هایی است که AI را اجرا می کنند.

اولین تکرار AlphaFold از روش AI که به عنوان آموزش عمیق در داده های ساختاری و ژنتیکی شناخته می شود ، برای پیش بینی فاصله جفت اسیدهای آمینه در یک پروتئین استفاده کرد. در مرحله دوم ، كه به هوش مصنوعی اشاره نمی كند ، AlphaFold از این اطلاعات برای ایجاد یك مدل “اجماع” در مورد آنچه كه پروتئین باید باشد ، استفاده می كند.

تیم تلاش کرد تا این روش را ایجاد کند ، اما در نهایت به دیوار برخورد کرد. Jumper می گوید ، بنابراین او تغییر را ایجاد کرد و یک شبکه هوش مصنوعی ایجاد کرد که شامل اطلاعات اضافی در مورد محدودیت های فیزیکی و هندسی بود که نحوه جمع شدن پروتئین را تعیین می کند. آنها همچنین وظیفه دشوارتری را برای خود تعیین کرده اند: شبکه به جای پیش بینی ارتباط بین اسیدهای آمینه ، ساختار نهایی توالی پروتئین هدف را پیش بینی می کند. جامپر می گوید: “این سیستم بسیار پیچیده تری است.”

دقت شگفت انگیز

CASP برای چندین ماه انجام می شود. پروتئین های هدف یا بخشی از پروتئین ها به نام دامنه – در مجموع حدود 100 – به طور منظم ترشح می شوند و تیم ها چندین هفته فرصت دارند تا پیش بینی های ساختاری خود را ارائه دهند. سپس تیمی از دانشمندان مستقل پیش بینی ها را با استفاده از معیارهایی ارزیابی می کنند که میزان تشابه پروتئین پیش بینی شده با ساختار تعیین شده توسط آزمایش را ارزیابی می کنند. ارزیابان نمی دانند چه کسی پیش بینی می کند.

لوپاس گفت ، پیش بینی های AlphaFold تحت نام “گروه 427” بود ، اما دقت حیرت انگیز بسیاری از ضبط شده های آنها ، آنها را متمایز می کند. “من تصور کردم که AlphaFold است. وی گفت: “بیشتر مردم دارند.”

برخی تخمین ها از دیگران بهتر است ، اما تقریباً دو سوم از نظر کیفیت با ساختارهای تجربی قابل مقایسه هستند. در برخی موارد ، مولت می گوید ، مشخص نبود که آیا اختلاف بین پیش بینی های AlphaFold و نتیجه آزمایش خطای پیش بینی است یا مصنوعی از آزمایش.

مولت گفت ، پیش بینی های AlphaFold با ساختارهای آزمایشی تعیین شده توسط تکنیکی به نام طیف سنجی تشدید مغناطیسی هسته ای منطبق نیستند ، اما این ممکن است به نحوه ترجمه داده های خام به یک مدل بستگی داشته باشد. این شبکه همچنین تلاش می کند ساختارهای جداگانه را به صورت مجتمع ها یا گروه های پروتئینی مدلسازی کند ، در نتیجه تعاملات با سایر پروتئین ها شکل آنها را مخدوش می کند.

به طور کلی ، تیم گفت که ساختارها امسال دقیق تر از آخرین CASP ساختارها را پیش بینی کرده اند ، اما بسیاری از پیشرفت ها را می توان به AlphaFold نسبت داد ، از نظر اهداف پروتئینی که تقریباً دشوار تلقی می شوند ، بهترین نتایج سایر تیم ها معمولاً در مقیاس دقت پیش بینی 100 نمره 75 را کسب می کنند ، در حالی که AlphaFold در همان اهداف حدود 90 را کسب می کند.

مولت گفت ، در حدود نیمی از تیم ها “خلاصه یادگیری” را در خلاصه ذکر کردند و رویکرد خود را جمع بندی کردند ، و اظهار داشت که هوش مصنوعی تأثیر زیادی در این زمینه دارد. بیشتر آنها از تیم های دانشگاهی بودند ، اما مایکروسافت و شرکت فناوری چینی Tencent نیز به CASP14 پیوستند.

محمد آلکورایشی ، زیست شناس محاسباتی در دانشگاه کلمبیا در نیویورک و یکی از شرکت کنندگان CASP ، مشتاق است جزئیات عملکرد AlphaFold را در این رقابت بررسی کند و درباره نحوه کار سیستم اطلاعات بیشتری کسب کند ، وقتی تیم DeepMind از رویکرد خود در اول دسامبر رونمایی کرد. او می گوید – اما بعید است – كه برداشت راحت تر از حد معمول اهداف پروتئینی در كارآیی نقش داشته است. ایده قوی AlQuraishi این است که AlphaFold تحول آفرین خواهد بود.

“من فکر می کنم انصاف است که بگوییم این امر برای حوزه پیش بینی ساختار پروتئین بسیار مخرب خواهد بود. من گمان می کنم بسیاری از این رشته را ترک خواهند کرد ، زیرا مشکل اصلی احتمالاً حل شده است “. “این یک پیشرفت درجه یک است ، مطمئناً یکی از مهمترین نتایج علمی زندگی من است.”

ساختارهای سریعتر

پیش آگهی AlphaFold به تعیین ساختار پروتئین باکتریایی که آزمایشگاه لوپاس سالهاست در تلاش است آن را تجزیه کند ، کمک کرد. تیم لوپاس پیش از این داده های پراش اشعه ایکس خام را جمع آوری کرده بود ، اما تبدیل این مدل های مشابه Rorschach به یک ساختار به اطلاعاتی درباره شکل پروتئین نیاز دارد. ترفندهای به دست آوردن این اطلاعات و همچنین سایر ابزارهای پیش بینی ناموفق بوده اند. لوپاس گفت: “مدل مدل 427 پس از گذشت یک دهه از تلاش همه چیز ، در عرض نیم ساعت ساختار ما را به ما تحویل داد.”

دمیس حسابیس ، بنیانگذار و مدیر عامل شرکت DeepMind ، می گوید این شرکت قصد دارد AlphaFold را مفید کند تا دانشمندان دیگر بتوانند از آن استفاده کنند. (پیش از این ، جزئیات کافی در مورد نسخه اول AlphaFold را برای سایر دانشمندان منتشر کرده بود تا این روش را تکرار کند.) ممکن است AlphaFold روزها طول بکشد تا یک ساختار پیش بینی کننده شامل تخمین های قابلیت اطمینان مناطق مختلف پروتئین ارائه شود. خاصبیس که کشف دارو و طراحی پروتئین را از کاربردهای بالقوه خود می داند ، افزود: “ما تازه در حال فهمیدن هستیم که زیست شناسان چه چیزی را دوست دارند.”

در اوایل سال 2020 ، این شرکت پیش بینی هایی را برای ساختار تعداد انگشت شماری از پروتئین های SARS-CoV-2 منتشر کرد که هنوز به طور آزمایشی مشخص نشده اند. پیش بینی DeepMind در مورد پروتئینی به نام Orf3a در نهایت بسیار شبیه به آنچه بعدا توسط Cryo-EM تعیین شد ، گفت: استیفن براون ، متخصص مغز و اعصاب مولکولی در دانشگاه کالیفرنیا ، برکلی ، که تیم او این ساختار را در ژوئن منتشر کرد. وی افزود: “آنچه آنها توانسته اند انجام دهند بسیار چشمگیر است.”

تأثیر در دنیای واقعی

بعید است AlphaFold آزمایشگاههایی مانند بروهاون را که از روشهای تجربی برای حل ساختارهای پروتئینی استفاده می کنند ، تعطیل کند. اما این می تواند به این معنی باشد که داده های آزمایشی با کیفیت پایین تر و آسان تر برای جمع آوری تمام تلاش برای به دست آوردن یک ساختار خوب است. برخی از برنامه ها ، مانند تجزیه و تحلیل پروتئین تکاملی ، رشد خواهند کرد زیرا سونامی داده های ژنومی موجود اکنون می تواند به طور قابل اعتماد به ساختار تبدیل شود. لوپاس گفت: “این به شما اجازه می دهد نسل جدیدی از زیست شناسان مولكولی س questionsالات پیشرفته تری را بپرسند.” “این به تفکر بیشتر و خط کشی کمتر نیاز دارد.”

“جانت تورنتون” ، زیست شناس ساختاری در آزمایشگاه زیست شناسی مولکولی اروپا – انستیتوی بیوانفورماتیک اروپا در هینکستون ، انگلستان و ارزیاب سابق CASP ، گفت: “این مشکلی است که من فکر کردم تا آخر عمر حل نخواهد شد.” او امیدوار است که این روش بتواند به روشن شدن عملکرد هزاران پروتئین حل نشده در ژنوم انسان کمک کند و تغییرات ژنی ایجاد کننده بیماری را که در افراد متفاوت است ، معنا کند.

عملکرد AlphaFold همچنین نقطه عطفی برای DeepMind است. این شرکت به دلیل داشتن هوش مصنوعی برای تسلط بر بازی هایی مانند Go بیشتر مشهور است ، اما هدف طولانی مدت آن توسعه برنامه هایی با توانایی دستیابی به هوش گسترده و شبیه انسان است. حسابیس گفت: مقابله با چالش های مهم علمی مانند پیش بینی ساختار پروتئین ، یکی از مهمترین کاربردهایی است که هوش مصنوعی وی می تواند انجام دهد. “من فکر می کنم این مهمترین کاری است که ما از نظر تأثیر واقعی انجام داده ایم.”

این مقاله با مجوز تکثیر می شود و اولین بار در تاریخ 30 نوامبر سال 2020 منتشر شد.


منبع: khabar-dirooz.ir

دیدگاهتان را بنویسید

Comment
Name*
Mail*
Website*