هوش مصنوعی Sora چیست؟ باید ببینید تا باور کنید!
شرکت OpenAI که خالق چت جیپیتی است، دنیای فناوری را یک بار دیگر شگفتزده کرد؛ اما اینبار با یک تولید کننده ویدیو به نام «هوش مصنوعی Sora».
Sora میتواند ویدیوهایی شگفتانگیزی بسازد که بسیار واقعی به نظر میرسند. شاهد این ادعا، برخی از نمونههایی است که قبلا منتشر شده؛ واقعا تشخیص آنها از فیلمهای واقعی بسیار سخت است.
در این مقاله، با من همراه شوید تا علاوهبر تماشای ویدیوهای شگفتانگیزی که هوش مصنوعی sora ساخته، باهم هر اطلاعاتی که تا امروز درباره سورا منتشر شده از تاریخ انتشار عمومی تا نحوه عملکرد و امکانات آن را بررسی کنیم.
هوش مصنوعی Sora چیست؟
هوش مصنوعی Sora مدلی مبتنی بر تبدیل متن به ویدئو است که به نظر من این بخش از ماجرا، دقیقا جالبترین مورد این هوش مصنوعی است. خود من آخری باری که با یک تیم تولید ویدیوی تبلیغاتی همکاری داشتم، جدا از هزینه ساخت آن، شاهد زحمات و دردسرهای زیاد گروه بودم، اما فکر اینکه ساخت چیزی شبیه همان ویدیو فقط با نوشتن متن امکانپذیر شود، واقعا شبیه یک شوخی باورنکردی است.
اگر فکر میکنید که من بزرگنمایی میکنم، خودتان همه این چند نمونه ویدیویی که سورا ساخته را تماشا کنید:
هوش مصنوعی sora میتواند صحنههای پیچیده با شخصیتهای متعدد، انواع حرکات خاص همراه با جزئیات دقیق سوژه و همچنین پسزمینهای طبیعی ایجاد کند.
OpenAI
به گفته شرکت OpenAI، این مدل نه تنها آنچه را که کاربر به صورت متنی از آن درخواست کرده را میفهمد، بلکه چگونگی وجود آن موارد در دنیای فیزیکی را نیز درک میکند.
البته سورا به جز تولید یک ویدیو با متن، میتواند یک تصویر ثابت را از کاربر دریافت کرده و آن را به یک ویدیوی زنده با جزئیاتی دقیق تبدیل کند. جالب اینجاست که سورا حتی میتواند یک ویدیو با فریمهای از دست رفته را نیز بازسازی کند!
سورا چگونه کار میکند؟
ابتدا هوش مصنوعی sora یک ویدیو اولیه تولید میکند و به تدریج با حذف نویز در طی مراحل مختلف، آن را تغییر و بهبود میدهد.
عمکرد شبکه عصبی سورا، مبتنی بر ترانسفورمر است. مدل ترانسفورمر نوعی مدل یادگیری عمیق است که میتواند دادههایی مانند متن یا گفتار را با استفاده از مکانیزمی به نام «attention» یا توجه، پردازش کند.
این مکانیزم به مدل اجازه میدهد تا روی مرتبطترین بخشهای ورودی و خروجی تمرکز کرده و روابط بین آنها را بیاموزد؛ یعنی دقیقا به همان روش ChatGPT عمل میکند که میتوانید در مقاله چتجیپیتی (ChatGPT) چیست؟ بیشتر با آن آشنا شوید. مدلهای ترانسفورمر بسیار قدرتمند و کارآمد هستند و به طور گسترده برای پردازش زبان طبیعی و سایر وظایف استفاده میشوند.
Sora با تجزیه فیلمها و تصاویر به قطعات کوچک به نام Patch کار میکند. با متحد کردن نحوه نمایش دادهها، ترانسفومر روی گستره وسیعتری از دادههای بصری، آموزش داده میشود و راحتتر از آنها یاد میگیرد.
از سورا برای چه کارهایی میتوان استفاده کرد؟
میتوانید از Sora برای موارد زیر استفاده کنید:
- ایجاد محتوای ویدیویی یا تصویری مبتنی بر متن
- ساخت صحنههایی از وقایع تاریخی
- معرفی محصول برای مشاغل مختلف
- تولید ویدیو در حوزههای سرگرمی، تبلیغاتی، همراه با جلوههای سینمایی
پرامپت این ویدیو(برگردانده شده از انگلیسی): یک زن شیک پوش در خیابانی در توکیو که پر از نئون درخشان و تابلوهای متحرک شهری است قدم میزند. او یک کاپشن چرمی مشکی، یک لباس قرمز بلند و چکمههای مشکی پوشیده و یک کیف پول مشکی به همراه دارد. عینک آفتابی و رژ لب قرمز دارد. او با اعتماد به نفس و معمولی راه میرود. خیابان خیس و منعکس کننده، به طوری که جلوهای آینهای از نورهای رنگارنگ ایجاد میکند. در اطراف نیز، عابران بسیاری در حال پیادهروی هستند.
در حال حاضر چه کسانی میتوانند به سورا دسترسی داشته باشند؟
هوش مصنوعی Sora توسط محققانی که مسئول اطمینان از ایمن بودن آن (از نظر مورد سواستفاده قرار گرفتن) و ارزیابی «خطرات احتمالی» هستند، در حال بررسی است.
OpenAI میگوید که به گروه کوچکی از هنرمندان، فیلمسازان و طراحان نیز دسترسی به Sora داده شده است؛ اما متأسفانه، فعلا هیچ نشانهای مبنی بر اینکه چه زمانی میتوانیم برای استفاده از هوش مصنوعی sora ثبت نام کنیم، وجود ندارد.
چه زمانی سورا در دسترس عموم قرار میگیرد؟
متاسفانه در حال حاضر تاریخ انتشاری برای Sora وجود ندارد. تمام محتوایی که تا به حال در اینترنت پخش شده است، از پستهای وبلاگ OpenAI بیرون آمده. جالب اینجاست که OpenAI حتی نشانهای مبهم از زمانی که سورا ممکن است به طور عمومی در دسترس قرار گیرد، ارائه نداده.
چرا OpenAI درباره انتشار سورا سختگیری میکند؟
شرکت OpenAI هنوز از میزان آزمایشهای انجام شده در رابطه با مورد سواستفاده قرار گرفتن هوش مصنوعی sora راضی نیست و میخواهد اطمینان بیشتری راجع به این موضوع کسب کند.
خب واقعیت این است که چنین روندی واقعا منطقی و عقلانی است. با توجه به مسائل اخلاقی بیشماری که درباره هوشمصنوعی وجود دارد، نیاز به احتیاط بیشتری خواهد بود.
شرکت اوپن ایآی میگوید: «پیش از در دسترس قرار دادن هوش مصنوعی sora، چندین گام ایمنی مهم را انجام خواهیم داد. ما با تیمهای ویژهای مثل متخصصان در زمینههای اطلاعات نادرست، محتوای خشونتآمیز، نفرت پراکنی و سوگیری، کار میکنیم تا بدون هیچ ملاحضهای این مدل هوش مصنوعی، مورد بررسی و آزمایش قرار بگیرد.»
OpenAI همچنین میگوید که در حال ایجاد یک طبقهبندی است که میتواند ویدیوهای تولید شده با هوش مصنوعی Sora را تشخیص دهد. به نظر میرسد، این گام مشابهی است که پس از راهاندازی ChatGPT انجام شد.
این شرکت یک طبقهبندی برای تشخیص متنهای تولید شده توسط چتجیپیتی، راهاندازی کرد؛ اما بعدا به دلیل غیرقابل اعتماد بودن آن، تعطیل شد. یعنی وقتی آزمایش میکردیم تا ببینیم آیا میتواند سرقت ادبی ChatGPT را تشخیص دهد، حتی قادر به کشف محتوای تولید شده توسط خودش هم نبود.