هوش مصنوعی Sora چیست؟ باید ببینید تا باور کنید!

حمیدرضا قنبریها به روز رسانی: مرداد ۲۴, ۱۴۰۳

شرکت OpenAI که خالق چت جی‌پی‌تی است، دنیای فناوری را یک بار دیگر شگفت‌زده کرد؛ اما این‌بار با یک تولید کننده ویدیو به نام «هوش مصنوعی Sora».

Sora می‌تواند ویدیوهایی شگفت‌انگیزی بسازد که بسیار واقعی به نظر می‌رسند. شاهد این ادعا، برخی از نمونه‌هایی است که قبلا منتشر شده‌؛ واقعا تشخیص آن‌ها از فیلم‌های واقعی بسیار سخت است.

در این مقاله، با من همراه شوید تا علاوه‌بر تماشای ویدیوهای شگفت‌انگیزی که هوش مصنوعی sora ساخته، باهم هر اطلاعاتی که تا امروز درباره سورا منتشر شده از تاریخ انتشار عمومی تا نحوه عملکرد و امکانات آن را بررسی کنیم.

فهرست مطالب

هوش مصنوعی Sora چیست؟

هوش مصنوعی Sora مدلی مبتنی بر تبدیل متن به ویدئو است که به نظر من این بخش از ماجرا، دقیقا جالب‌ترین مورد این هوش مصنوعی است. خود من آخری باری که با یک تیم تولید ویدیوی تبلیغاتی همکاری داشتم، جدا از هزینه ساخت آن، شاهد زحمات و دردسرهای زیاد گروه بودم، اما فکر اینکه ساخت چیزی شبیه همان ویدیو فقط با نوشتن متن امکان‌پذیر شود، واقعا شبیه یک شوخی باورنکردی است.

اگر فکر می‌کنید که من بزرگنمایی می‌کنم، خودتان همه این چند نمونه ویدیویی که سورا ساخته را تماشا کنید:

هوش مصنوعی sora می‌تواند صحنه‌های پیچیده با شخصیت‌های متعدد، انواع حرکات خاص همراه با جزئیات دقیق سوژه و همچنین پس‌زمینه‌ای طبیعی ایجاد کند.

OpenAI

به گفته شرکت OpenAI، این مدل نه تنها آنچه را که کاربر به صورت متنی از آن درخواست کرده را می‌فهمد، بلکه چگونگی وجود آن موارد در دنیای فیزیکی را نیز درک می‌کند.

البته سورا به جز تولید یک ویدیو با متن، می‌تواند یک تصویر ثابت را از کاربر دریافت کرده و آن را به یک ویدیوی زنده با جزئیاتی دقیق تبدیل کند. جالب اینجاست که سورا حتی می‌تواند یک ویدیو با فریم‌های از دست رفته را نیز بازسازی کند!

سورا چگونه کار می‌کند؟

ابتدا هوش مصنوعی sora یک ویدیو اولیه تولید می‌کند و به تدریج با حذف نویز در طی مراحل مختلف، آن را تغییر و بهبود می‌دهد.

عمکرد شبکه عصبی سورا، مبتنی بر ترانسفورمر است. مدل ترانسفورمر نوعی مدل یادگیری عمیق است که می‌تواند داده‌هایی مانند متن یا گفتار را با استفاده از مکانیزمی به نام «attention» یا توجه، پردازش کند.

این مکانیزم به مدل اجازه می‌دهد تا روی مرتبط‌ترین بخش‌های ورودی و خروجی تمرکز کرده و روابط بین آن‌ها را بیاموزد؛ یعنی دقیقا به همان روش ChatGPT عمل می‌کند که می‌توانید در مقاله چت‌جی‌پی‌تی (ChatGPT) چیست؟ بیشتر با آن آشنا شوید. مدل‌های ترانسفورمر بسیار قدرتمند و کارآمد هستند و به طور گسترده برای پردازش زبان طبیعی و سایر وظایف استفاده می‌شوند.

Sora با تجزیه فیلم‌ها و تصاویر به قطعات کوچک به نام Patch کار می‌کند. با متحد کردن نحوه نمایش داده‌ها، ترانسفومر روی گستره وسیع‌تری از داده‌های بصری، آموزش داده می‌شود و راحت‌تر از آن‌ها یاد می‌گیرد.

از سورا برای چه کارهایی می‌توان استفاده کرد؟

می‌توانید از Sora برای موارد زیر استفاده کنید:

ایجاد محتوای ویدیویی یا تصویری مبتنی بر متن
ساخت صحنه‌هایی از وقایع تاریخی
معرفی محصول برای مشاغل مختلف
تولید ویدیو در حوزه‌های سرگرمی، تبلیغاتی، همراه با جلوه‌های سینمایی

پرامپت این ویدیو(برگردانده شده از انگلیسی): یک زن شیک پوش در خیابانی در توکیو که پر از نئون درخشان و تابلوهای متحرک شهری است قدم می‌زند. او یک کاپشن چرمی مشکی، یک لباس قرمز بلند و چکمه‌های مشکی پوشیده و یک کیف پول مشکی به همراه دارد. عینک آفتابی و رژ لب قرمز دارد. او با اعتماد به نفس و معمولی راه می‌رود. خیابان خیس و منعکس کننده، به طوری که جلوه‌ای آینه‌ای از نورهای رنگارنگ ایجاد می‌کند. در اطراف نیز، عابران بسیاری در حال پیاده‌روی هستند.

در حال حاضر چه کسانی می‌توانند به سورا دسترسی داشته باشند؟

هوش مصنوعی Sora توسط محققانی که مسئول اطمینان از ایمن بودن آن (از نظر مورد سواستفاده قرار گرفتن) و ارزیابی «خطرات احتمالی» هستند، در حال بررسی است.

OpenAI می‌گوید که به گروه کوچکی از هنرمندان، فیلم‌سازان و طراحان نیز دسترسی به Sora داده شده است؛ اما متأسفانه، فعلا هیچ نشانه‌ای مبنی بر اینکه چه زمانی می‌توانیم برای استفاده از هوش مصنوعی sora ثبت نام کنیم، وجود ندارد.

چه زمانی سورا در دسترس عموم قرار می‌گیرد؟

متاسفانه در حال حاضر تاریخ انتشاری برای Sora وجود ندارد. تمام محتوایی که تا به حال در اینترنت پخش شده است، از پست‌های وبلاگ OpenAI بیرون آمده. جالب اینجاست که OpenAI حتی نشانه‌ای مبهم از زمانی که سورا ممکن است به طور عمومی در دسترس قرار گیرد، ارائه نداده.

چرا OpenAI درباره انتشار سورا سخت‌گیری می‌کند؟

شرکت OpenAI هنوز از میزان آزمایش‌های انجام شده در رابطه با مورد سواستفاده قرار گرفتن هوش مصنوعی sora راضی نیست و می‌خواهد اطمینان بیشتری راجع به این موضوع کسب کند.

خب واقعیت این است که چنین روندی واقعا منطقی و عقلانی است. با توجه به مسائل اخلاقی بی‌شماری که درباره هوش‌مصنوعی وجود دارد، نیاز به احتیاط بیشتری خواهد بود.

شرکت اوپن ای‌آی می‌گوید: «پیش از در دسترس قرار دادن هوش مصنوعی sora، چندین گام ایمنی مهم را انجام خواهیم داد. ما با تیم‌های ویژه‌ای مثل متخصصان در زمینه‌های اطلاعات نادرست، محتوای خشونت‌آمیز، نفرت‌ پراکنی و سوگیری، کار می‌کنیم تا بدون هیچ ملاحضه‌ای این مدل هوش مصنوعی، مورد بررسی و آزمایش قرار بگیرد.»

OpenAI همچنین می‌گوید که در حال ایجاد یک طبقه‌بندی است که می‌تواند ویدیوهای تولید شده با هوش مصنوعی Sora را تشخیص دهد. به نظر می‌رسد، این گام مشابهی است که پس از راه‌اندازی ChatGPT انجام شد.

این شرکت یک طبقه‌بندی برای تشخیص متن‌های تولید شده توسط چت‌جی‌پی‌تی، راه‌اندازی کرد؛ اما بعدا به دلیل غیرقابل اعتماد بودن آن، تعطیل شد. یعنی وقتی آزمایش می‌کردیم تا ببینیم آیا می‌تواند سرقت ادبی ChatGPT را تشخیص دهد، حتی قادر به کشف محتوای تولید شده توسط خودش هم نبود.

امتیازی به این نوشته بدهید