چگونه می توان هوش مصنوعی را دموکراتیک تر کرد



امسال ، GPT-3 ، یک مدل زبان بزرگ که قادر به درک متن ، پاسخ به س questionsالات و تولید نمونه های جدید نوشتاری است ، مورد توجه رسانه های بین المللی قرار گرفت. این مدل که توسط OpenAI ، یک سازمان غیرانتفاعی مستقر در کالیفرنیا و ایجاد سیستم های هوش مصنوعی با اهداف عمومی ، راه اندازی شده است ، توانایی چشمگیری در تقلید از نوشتن انسان دارد ، اما اندازه بسیار زیاد آن به همان اندازه قابل توجه است. برای ساخت آن ، محققان 175 میلیارد پارامتر (نوعی واحد محاسباتی) و بیش از 45 ترابایت متن را از Common Crawl ، Reddit ، Wikipedia و منابع دیگر جمع آوری کردند ، سپس آن را در روندی آموزش دادند که صدها واحد پردازش را طی هزاران ساعت به طول انجامید.

GPT-3 روند گسترده تری را در هوش مصنوعی نشان می دهد. یادگیری عمیق ، که در سالهای اخیر به تکنیک غالب برای ایجاد هوش مصنوعی جدید تبدیل شده است ، از حجم گسترده ای از داده ها و قدرت محاسباتی برای تأمین مدل های پیچیده و دقیق استفاده می کند. این منابع در دسترس محققان شرکتهای بزرگ و دانشگاههای نخبه است. در نتیجه ، یک مطالعه توسط دانشگاه وسترن نشان می دهد که هوش مصنوعی “دموکراتیزه” شده است: تعداد محققانی که می توانند به پیشرفت های پیشرفته کمک کنند در حال کاهش است. این گروه افرادی را که قادر به تعیین رهنمودهایی برای تحقیق در مورد این فناوری کلیدی هستند ، عواقب اجتماعی به همراه دارد. حتی ممکن است به برخی از چالش های اخلاقی پیش روی توسعه هوش مصنوعی ، از جمله نقض محرمانه بودن ، تعصب و تأثیر مدل های بزرگ بر محیط زیست کمک کند.

برای مقابله با این مشکلات ، محققان در تلاشند بفهمند که چگونه می توان با کمتر کار بیشتری انجام داد. یکی از این پیشرفت های اخیر “کمتر از یک” نامیده می شود – یادگیری LO-shot ، توسعه یافته توسط ایلیا سوهولوتسکی و ماتیاس شونلاو از دانشگاه واترلو.[Office1] [RK2] اصل آموزش LO-shot این است که هوش مصنوعی باید بتواند در مورد اشیا the موجود در جهان بیاموزد بدون اینکه برای هر یک از آنها مثالی بزند. این مانع بزرگی برای سیستم های مدرن هوش مصنوعی است که اغلب برای یادگیری تشخیص اشیا often به هزاران مثال نیاز دارد. از طرف دیگر ، مردم معمولاً می توانند از نمونه های موجود چشم پوشی کنند تا اشیای جدید و بی سابقه ای را تشخیص دهند. به عنوان مثال ، هنگامی که چهره های مختلفی به او نشان داده می شود ، کودک می تواند به راحتی مثال ها را تشخیص دهد و ارتباطات بین ارقام نشان داده شده به آنها و شکل های جدید را تشخیص دهد.

تیم ابتدا این نوع آموزش را از طریق فرایندی به نام تقطیر نرم معرفی کرد. یک پایگاه داده تصویری که توسط انستیتوی ملی استاندارد و فناوری نگهداری می شود ، موسوم به MNIST ، که شامل 60،000 نمونه از ارقام ثبت شده از 0 تا 9 است ، در پنج تصویر تقسیم شد که ویژگی های اعداد مختلف را با هم ترکیب می کند. پس از نشان دادن تنها این پنج مثال ، سیستم دانشگاه واترلو توانست دقیقاً 92 درصد از تصاویر دیگر را در پایگاه داده طبقه بندی کند.

تیم در آخرین مقاله خود این اصل را گسترش داد تا نشان دهد که ، از لحاظ تئوری ، تکنیک های LO-shot به هوش مصنوعی اجازه می دهد تا با دادن مجموعه ای کوچک از داده ها ، حتی دو مثال ، به طور بالقوه یاد بگیرند که هزاران شی را از هم متمایز کنند. این یک پیشرفت بزرگ نسبت به سیستم های یادگیری عمیق سنتی است ، جایی که تقاضای داده با نیاز به تمایز اشیا more بیشتر رشد می کند. در حال حاضر ، مجموعه داده های کوچک LO-shot باید به دقت طراحی شوند تا خصوصیات طبقات مختلف شی را تقطیر کنند. اما سوهولوتسکی با مشاهده ارتباطات بین اشیایی که قبلاً در مجموعه داده های کوچک موجود گرفته شده است ، می خواهد این کار را بیشتر توسعه دهد.

به چندین دلیل اجازه دادن به هوش مصنوعی برای یادگیری با داده های بسیار کم اهمیت دارد. اول اینکه ، با مجبور کردن سیستم در کلاسهایی که ندیده است ، خلاصه کردن روند یادگیری واقعی را بهتر انجام می دهد. با ساختن انتزاعاتی که ارتباطات بین اشیا را به دست می آورد ، این روش احتمال تعصب را نیز کاهش می دهد. در حال حاضر ، سیستم های یادگیری عمیق قربانی تعصبات ناشی از ویژگی های نامناسب در داده هایی می شوند که برای یادگیری استفاده می کنند. یک نمونه مشهور از این مشکل این است که هوش مصنوعی سگها را هنگام نمایش تصاویر سگها در یک محیط برفی به عنوان گرگ طبقه بندی می کند – همانطور که بیشتر تصاویر گرگها آنها را در نزدیکی برف نشان می دهد. امکان تنظیم مجدد موضوع جنبه های تصویر به جلوگیری از این خطاها کمک می کند. بنابراین ، کاهش نیاز به داده ها باعث می شود که این سیستم ها کمتر در معرض این نوع سوگیری قرار بگیرند.

در مرحله بعد ، هرچه داده های گسترده تری که باید مورد استفاده قرار بگیرند ، انگیزه کمتری برای نظارت بر افراد برای ساخت الگوریتم های بهتر وجود دارد. به عنوان مثال ، روش های تقطیر نرم در تحقیقات پزشکی AI ، که مدل های آن را با استفاده از اطلاعات حساس بهداشتی آموزش می دهد ، تحت تأثیر قرار گرفته است. در مقاله اخیر ، محققان از تقطیر نرم در تصاویر اشعه ایکس تشخیصی بر اساس مجموعه کوچکی از داده های محرمانه استفاده کردند.

سرانجام ، اجازه دادن به هوش مصنوعی برای یادگیری با داده های کمتر به دموکراتیک سازی حوزه هوش مصنوعی کمک می کند. با هوش مصنوعی کوچکتر ، دانشگاه می تواند مرتبط باقی بماند و از خطر اسقاط اساتید توسط صنعت جلوگیری کند. آموزش LO-shot نه تنها با کاهش هزینه های آموزش و نیازهای داده ای ، موانع ورود را کاهش می دهد ، بلکه انعطاف پذیری بیشتری را در ایجاد مجموعه داده های جدید و آزمایش رویکردهای جدید برای کاربران فراهم می کند. با کاهش زمان صرف شده برای مهندسی داده و معماری ، محققانی که می خواهند از هوش مصنوعی استفاده کنند می توانند زمان بیشتری را با تمرکز بر روی مشکلات عملی که هدف آنها حل است ، صرف کنند.


منبع: khabar-dirooz.ir

دیدگاهتان را بنویسید

Comment
Name*
Mail*
Website*