از این پس ChatGPT می‌بیند، می‌شنود و صحبت می‌کند

دیروز (سوم مهر) شرکت OpenAI با بروز‌رسانی هوش مصنوعی چت جی پی تی ، تغییرات بزرگی در آن ایجاد کرد. حالا این چت بات هوش مصنوعی قادر است تا دقیقا مثل یک ربات مجهز به هوش مصنوعی، رفتار کند.

توانایی ChatGPT در شنیدن، دیدن و صحبت کردن

شرکت اوپن‌ای‌آی در حال ارائه نسخه جدیدی از این سرویس است که به شما امکان می‌دهد تا از این چت بات هوش مصنوعی نه تنها با تایپ جملات در یک کادر متنی، بلکه با صحبت کردن یا آپلود یک تصویر، درخواست خود را مطرح کرده و سوال بپرسید.

طبق گفته اوپن‌ای‌آی، ویژگی‌های جدید تا دو هفته آینده برای افرادی که از سرویس پولی چت‌جی‌پی‌تی استفاده می‌کنند، فعال می‌شود. به‌علاوه دیگر افرادی که از سرویس رایگان استفاده می‌کنند هم به زودی این قابلیت را دریافت خواهند کرد.

بیشتر بخوانید: کامل ترین لیست افزونه های چت جی پی تی و کاربرد هر یک

سرویس جدید چت‌جی‌پی‌تی چگونه عمل می‌کند؟

بخش چت صوتی بسیار آشنا است: شما روی دکمه‌ای ضربه می‌زنید و سوال خود را بیان می‌کنید، ChatGPT آن را به متن تبدیل کرده و به مدل زبانی بزرگ (LLM) می‌دهد، پاسخ را دریافت می‌کند، سپس آن را به گفتار تبدیل کرده و پاسخ را با صدای بلند بیان می‌کند.

این درست مثل صحبت با الکسا یا دستیار صوتی گوگل است؛ اما اوپن‌ای‌آی امیدوار است که به لطف فناوری زیربنایی بهبود یافته خود، پاسخ‌های چت جی‌پی‌تی، بهتر باشد.

به نظر می‌رسد که اکثر دستیارهای صوتی، بر LLM ها تکیه می‌کنند که همین موضوع باعث می‌شود تا اوپن‌ای‌آی نسبت به سایرین جلوتر باشد.

مدل Whisper اوپن‌ای‌آی کارهای گفتار به نوشتار زیادی را انجام می‌دهد و حالا این شرکت در حال ارائه یک مدل جدید تبدیل متن به گفتار است که می‌تواند صدای انسان‌مانندی را فقط از متن و چند ثانیه نمونه گفتار، تولید کند.

توانایی در تقلید صدا

شما می‌توانید صدای ChatGPT را از بین پنج گزینه صدای مختلف انتخاب کنید، اما به نظر می‌رسد این مدل پتانسیل بسیار بیشتری دارد. به عنوان مثال، اوپن‌ای‌آی با Spotify کار می‌کند تا پادکست‌ها را به زبان‌های مختلف ترجمه کند و جالب است که صدای شخصی که در پادکست صحبت می‌کند را تقلید کرده و دقیقا با همان صدا ترجمه را انجام می‌دهد.

البته کاربردهای جالب زیادی برای صداهای مصنوعی وجود دارد و اوپن‌ای‌آی می‌تواند بخش بزرگی از این صنعت را در دست بگیرد.

خطرات صدای مصنوعی 

این واقعیت که می‌توان صدای مصنوعی با کیفیتی را تنها با چند ثانیه صدای نمونه ساخت، درها را برای انواع موارد استفاده غیراخلاقی و مشکل‌ساز نیز باز می‌کند. این شرکت در یک پست وبلاگی با اعلام این ویژگی‌های جدید می‌گوید: «این قابلیت‌ها خطرات جدیدی را هم ایجاد می‌کنند، مانند پتانسیل جعل هویت افراد یا ارتکاب کلاهبرداری».

اوپن‌ای‌آی می‌گوید این مدل دقیقا به همین دلیل برای استفاده گسترده در دسترس نیست. این بسیار کنترل شده و محدود به موارد استفاده‌های خاص خواهد بود.

جستجوی تصویری چت جی پی تی 

در عین حال، جستجوی تصویری ChatGPT کمی شبیه به لنز گوگل است. شما از هر چیزی که به آن علاقه دارید و برایتان سوالی ایجاد کرده عکس می‌گیرید، سپس چت جی‌پی‌تی سعی می‌کند آنچه را که در مورد آن می‌پرسید بررسی کرده و بر اساس آن پاسخ دهد.

همچنین می‌توانید از ابزار طراحی برنامه برای کمک به شفاف‌سازی درخواست خود استفاده کنید، سوالات را به زبان بیاورید یا تایپ کنید تا با تصویر همراه شوند. اینجاست که ماهیت رفت و برگشتی ChatGPT مفید است.

قابلیت جدید چت جی پی تی

به جای انجام جستجو، دریافت پاسخ اشتباه و سپس انجام جستجوی دیگر، می‌توانید از ربات درخواست کنید و پاسخ را اصلاح کنید. (این بسیار شبیه کاری است که گوگل با جستجوی چندوجهی انجام می‌دهد.)

بدیهی است که جستجوی تصویر مشکلات بالقوه خود را دارد. یکی از آن‌ها این است که وقتی از یک چت بات در مورد یک شخص درخواست می‌کنید چه اتفاقی می‌افتد؟ OpenAI می‌گوید که عمدا «توانایی ChatGPT برای تجزیه و تحلیل و اظهارنظر مستقیم درباره افراد» را به دلایل حفظ حریم خصوصی محدود کرده است.

این قابلیت دقیقا شبیه همان فیلم‌های علمی‌تخیلی‌ است که در آن یک فرد توانایی به دست آوردن همه اطلاعات درباره یک شخص فقط با نگاه کردن را داشته باشد.

ملاحظات اخلاقی 

تقریباً یک سال پس از راه‌اندازی اولیه چت جی پی تی، شرکت اوپن‌ای‌آی هنوز در تلاش است تا بفهمد چگونه ویژگی‌ها و قابلیت‌های بیشتری را بدون ایجاد مجموعه‌ای از مشکلات و جنبه‌های منفی به چت بات خود اضافه کند.

با عرضه این قابلیت‌های جدید، این شرکت تلاش کرد تا با محدود کردن عمدی آنچه که مدل‌های جدیدش می‌توانند انجام دهند، این ملاحظات اخلاقی را در نظر بگیرد؛ اما این رویکرد برای همیشه کار نخواهد کرد. هرچه تعداد بیشتری از افراد از کنترل صوتی و جستجوی تصویر استفاده می‌کنند و هر چه ChatGPT به یک دستیار مجازی مفید و چندوجهی نزدیک‌تر می‌شود، کنترل و حفظ امن بودن این فناوری‌ها سخت‌تر و سخت‌تر می‌شود.

امتیازی به این نوشته بدهید
منبع theverge.com
ممکن است شما دوست داشته باشید
اشتراک در
اطلاع از
guest

0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
0
افکار شما را دوست داریم، لطفا نظر دهید.x