مبدل هوش مصنوعی متن به ویدئو Sora بهصورت عمومی اما محدود در دسترس قرار گرفته است.
خالق ChatGPT اعلام کرد که نسخهی جدیدی از سورا با نام Sora Turbo را بهعنوان یک محصول مستقل در Sora.com برای کاربران ChatGPT Plus و ChatGPT Pro منتشر کرده است. این نسخه بهطور قابلتوجهی سریعتر از مدل اولیهای محسوب میشود که در فوریه (بهمن ۱۴۰۲) به نمایش در آمد.
بهگفتهی OpenAI، کاربران میتوانند ویدیوهایی با وضوح تا 1080p، با مدت حداکثر ۲۰ ثانیه و در نسبتهای ابعادی عریض، عمودی یا مربعی تولید کنند. هوش مصنوعی مولد ویدئو OpenAI میتواند با قابلیت Remix، ویدیوهایی که به آن داده میشود را متناسب با درخواست کاربر تغییر دهد، دو صحنهی متفاوت را در یکدیگر ادغام کند یا کلیپهای جدیدی را از روی عکس یا توصیف متنی بیافریند.
سورا علاوهبر تولید کلیپهای مجزا، ویژگی داستاننویسی (Storyboard) دارد که به کاربر اجازه میدهد ویدیویی شامل صحنههای مختلف را بهوسیلهی پرامپتهای سریالی خود تولید کند.
در صفحهی اصلی وبسایت سورا، ویدئوهای تازهتولیدشده و منتخبی از فیدهای Featured و Recent نشان داده میشوند که بهطور مداوم با آثار تولیدکنندگان بهروز میشوند. ویدئوهای موجود در صفحهی اصلی سورا میتوانند برای مشاهدهی بعدی با برچسب Saved علامتگذاری و در پوشهها سازماندهی شوند. با کلیک روی هر ویدیو میتوان دید که از چه پرامپتی برای ایجاد آن استفاده شده است.
OpenAI میگوید که مشترکان حساب Plus در ChatGPT میتوانند بدون پرداخت هزینهی اضافی از سورا استفاده کنند و تا ۵۰ ویدیوی پنج ثانیهای با وضوح تا 720p در هر ماه بسازند.
اشتراک ۲۰۰ دلاری ChatGPT Pro امکان تولید ۵۰۰ ویدیوی ۲۰ ثانیهای تا وضوح 1080p در هر ماه را میدهد و کاربر میتوان ویدیو را بدون واترمارک دانلود کند و بهطور همزمان پنج ویدیو بسازد. OpenAI هماکنون روی قیمتگذاری متناسبی برای کاربران مختلف کار میکند و قصد دارد اوایل ۲۰۲۵ آن را در دسترس قرار دهد.
خالق ChatGPT اذعان کرد که نسخهی فعلی سورا محدودیتهای زیادی دارد. این مدل اغلب حالتهای فیزیکی غیرواقعی تولید میکند و در انجام اقدامات پیچیده در مدت زمان طولانی دچار مشکل میشود. طبق بررسی اولیهی مارکز براونلی، یوتیوبر معروف حوزهی فناوری، در ویدئوهای سورا اشیاء ثبات ندارند و بهگونهای در مقابل یا پشت یکدیگر حرکت میکنند که منطقی نیست و بدون هیچ دلیلی ناپدید و دوباره ظاهر میشوند.
تمام ویدیوهای تولید شده توسط سورا دارای متادادهی C2PA هستند که ویدیو را بهعنوان تولید شده توسط سورا شناسایی میکند تا بتوان از آن برای تأیید منبع استفاده کرد. علاوهبر این، همهی ویدیوها دارای واترمارک قابل مشاهده خواهند بود و OpenAI ابزاری برای جستوجوی داخلی توسعه داده که بهکمک ویژگیهای فنی تشخیص میدهد که ویدیو را سورا پدید آورده است.
OpenAI خطوط قرمزی را برای جلوگیری از دیپ فیک، تولید محتواهای جنسی و خشونت آمیز، تصاویر افراد زیر ۱۸ سال و پرهیز از بارگذاری یا ایجاد محتوای دارای حق کپیرایت مانند نام و لوگو شرکتها درنظر گرفته است. علاوهبر این، بارگذاری تصاویر افراد در حال حاضر محدود خواهد بود، اما این ویژگی پس از بهبود تدابیر دیپفیک برای کاربران بیشتری در دسترس قرار میگیرد.