ه هوش مصنوعی مولد نوعی فناوری هوش مصنوعی است که میتواند انواع مختلفی از محتوا از جمله متن، تصویر، صدا، گرافیک، ویدئوهای با کیفیت بالا و دادههای مصنوعی را تولید کند.البته این فناوری کاملاً جدید نیست. هوش مصنوعی مولد در دهه ۱۹۶۰ در چتباتها معرفی شد. اما تا سال ۲۰۱۴، و پیش از معرفی شبکههای مولد تخاصمی یا GAN که اختصار عبارت (Generative Adversarial Network) و نوعی الگوریتم یادگیری ماشین است، مورد توجه قرار نداشت. پس از آن بود که این نوع هوش مصنوعی توانست تصاویر، ویدئوها و صداهای افراد واقعی را به صورت قانعکنندهای واقعی خلق کند.
هوش مصنوعی مولد چگونه کار میکند؟
هوش مصنوعی مولد با یک درخواست شروع میشود که میتواند به شکل متن، تصویر، ویدئو، طرح، نتهای موسیقی یا هر ورودی قابل پردازش توسط سیستم هوش مصنوعی باشد. پس از آن الگوریتمهای مختلف هوش مصنوعی در پاسخ به درخواست، محتوای جدید را تحویل میدهند.این قابلیت جدید از یک طرف فرصتهایی را ایجاد کرده است که شامل دوبله بهتر فیلم و ایجاد محتوای آموزشی غنی است. ولی از طرف دیگر نگرانیهای مربوط به دیپفیکها – تصاویر یا ویدئوهای جعلی دیجیتالی – و حملات مضر امنیت سایبری به کسب و کارها را به دنبال داشت.
یکی از اولین نمونههای هوش مصنوعی مولد چت ربات Eliza بود که توسط جوزف وایزنبام در دهه ۱۹۶۰ ایجاد شد. البته این پیادهسازیهای اولیه به دلیل پیروی از رویکرد مبتنی بر قوانین، محدودیت واژگان، اتکای بیش از حد به الگوها و عدم امکان سفارشیسازی با کاستیهایی مواجه بود.
تاریخچه هوش مصنوعی مولد
با کمک این نوع هوش مصنوعی، مدلها چندوجهی میشوند، به این معنی که میتوانند چندین حالت (مانند متن و تصویر) را در یک زمان پردازش کنند. چنین قابلیتی حوزههای کاربردی آنها را گسترش میدهد و موارد استفاده آنها را متنوعتر میکند.
هوش مصنوعی مولد قابلیت تولید محتوا دارد و از سال ۲۰۲۲ به میزانی باورنکردنی با افزایش محبوبیت مواجه شده است. هوش مصنوعی مولد یا Generative AI به عنوان «فناوری سال» معرفی شده و استارتآپهای فعال در این زمینه توسط بسیاری از VCها مورد توجه و پشتیبانی قرار گرفتهاند.
هوش مصنوعی مولد
محتوا را در انواع مختلف رسانه، از جمله متن، گرافیک و ویدئو تولید کنند. این اساس کار ابزارهایی مانند Dall-E است که به طور خودکار تصاویر را از توضیحات متنی ارائه شده ایجاد میکند یا از تصاویر داده شده برای ایجاد زیرنویس متنی کمک میگیرد.
پیشرفت سریع در مدلهای زبانی به اصطلاح بزرگ یا LLMها (مدلهایی با میلیاردها یا حتی تریلیونها پارامتر) عصر جدیدی را گشوده است که در آن مدلهای هوش مصنوعی مولد میتوانند متون جذاب بنویسند، تصاویر واقعی و حتی کمدیهای سرگرمکننده خلق کنند.