تینا مزدکی_هفته گذشته استودیوی هوش مصنوعی دارن آرونوفسکی با همکاری مجله تایم، دو قسمت اول مجموعه «در این روز… 1776» خود را منتشر کرد. این مجموعه ویدئویی کوتاه که در طول یک سال منتشر خواهد شد، وقایع انقلاب آمریکا در 250 سال پیش را شرح می دهد. اما این کار را با استفاده از “مجموعه ای از ابزارهای هوش مصنوعی” برای ایجاد صحنه های فوتورئالیستی با نمادهای چهره های تاریخی مانند جورج واشنگتن، توماس پین و بنجامین فرانکلین انجام می دهد.
بن بیتونتی، رئیس استودیوی تایم، در معرفی این مجموعه گفت که این پروژه “چشم اندازی از کاربرد متفکرانه، خلاقانه و هنری هوش مصنوعی را ارائه می دهد”. نه برای جایگزینی تخصص و مهارت، بلکه برای گسترش آنچه ممکن است و اجازه دادن به داستانسرایان به مکانهایی که قبلاً نمیتوانستند بروند.»
منتقدان قطعاً مشتاق کمتری نسبت به این تلاش بودند. وب سایت AV Club از قسمت های اولیه به دلیل “حرکات تکراری دوربین و شخصیت های مومی” انتقاد کرد که “نگاهی زشت به تاریخ آمریکا” ارائه می کرد. CNET نوشت که این “شور هوش مصنوعی تاریخ آمریکا را نابود می کند” و این ویدئوها را “ترکیبی جهنمی از خروجی ماشین محور و انتخاب های بد انسانی” نامید.
گاردین ابراز تاسف کرد که «کارگردانی که زمانی مورد تحسین قرار میگرفت «Strong Black and The Wrestler» خود را در باتلاق هوش مصنوعی غرق کرده است و این سریال را «خجالتآور»، «وحشتناک» و «کاملاً زشت» خواند.
اما چنین واکنش های اولیه ظاهراً سوپ اولیه را از تلاش های رو به رشد خود منصرف نکرد. یک منبع نزدیک به تیم سازنده که با Ares Technica برای بحث در مورد جزئیات تولید این سریال صحبت کرده است، گفت که کیفیت قسمت های جدید افزایش می یابد زیرا تیم ابزارهای هوش مصنوعی خود را در طول سال بهبود می بخشد و نحوه استفاده از آنها را بهتر یاد می گیرد.
این منبع گفت: “ما با این فرض شروع کردیم که چیزهای زیادی برای یادگیری داریم، این روند تکامل خواهد یافت و ابزارهایی که استفاده می کنیم تغییر خواهند کرد.” ما اشتباه خواهیم کرد و درس های زیادی خواهیم گرفت… در آن بهتر خواهیم شد و تکنولوژی تغییر خواهد کرد. خواهیم دید که مخاطب به چه چیزی پاسخ می دهد، چه چیزی جواب می دهد و چه چیزی جواب نمی دهد. “این یک آزمون واقعا بزرگ است.”
همه چیز هوش مصنوعی نیست
نکته مهم این است که مجموعه «This Day… 1776» به طور کامل توسط هوش مصنوعی ساخته نشده است. برای مثال، فیلمنامه توسط تیمی از نویسندگان نوشته شده است که توسط همکاران قدیمی آرونوفسکی، آری هندل و لوکاس ساسمن (به نقل از هالیوود ریپورتر) نظارت میشوند. این باعث میشود که انتقاداتی مانند «فرقههای گاردین به سبک ChatGPT» در قسمتهای اولیه کمی نابجا و خندهدار به نظر بیایند.
منبع تولید ما می گوید که این پروژه همیشه به عنوان یک اثر نوشته شده توسط انسان تصور می شد و تیم پشت آن برای مدت طولانی در حال برنامه ریزی و تحقیق در مورد چگونگی بیان این نوع داستان بود. او گفت: «من حتی فکر نمیکنم آنها چنین کمک یا نوشتنی داشته باشند [مبتنی بر هوش مصنوعی] آنها به این نیاز داشتند یا این را می خواستند. همه ما نوشتن با هوش مصنوعی و رباتهای گفتگو را امتحان کردهایم، و میدانید که چقدر با کیفیت هستند.
تهیهکنندگان همچنین تاکید میکنند که تمامی دیالوگهای سریال مستقیماً توسط صداپیشههایی که عضو انجمن بازیگران سینما (SAG) هستند ضبط میشود نه شبیهسازهای هوش مصنوعی. در حالی که قوانین اتحادیه اخیراً در مورد مذاکره ممکن است نقش داشته باشد، منبع ما گفت که صداهای تولید شده توسط هوش مصنوعی که تیم برای آهنگهای آزمایشی استفاده میکرد، به وضوح مصنوعی بود و برای تولید حرفهای آماده نبود.

به گفته منبع، افراد مستقیماً مسئول موسیقی، تدوین، صداگذاری، جلوه های بصری و تصحیح رنگ پروژه هستند. تنها جایی که «ابزارهای مبتنی بر هوش مصنوعی» وارد عمل میشوند، خود ویدیو است که از طریق ترکیبی از «ابزارهای فیلمسازی سنتی و قابلیتهای هوش مصنوعی در حال ظهور» ایجاد شده است.
در عمل، این به این معنی است که مردم استوریبرد میسازند، مرجع بصری مکانها و شخصیتها را پیدا میکنند و نحوه نمایش عکسها را تنظیم میکنند. این اطلاعات، همراه با فیلمنامه، به یک سازنده ویدیوی هوش مصنوعی داده میشود که تک تک عکسها را میسازد تا توسط انسانها در پستولید سنتی مونتاژ و ویرایش شوند.
این روند بحث در مورد سینمای هوش مصنوعی را یک قدم فراتر از Ancestra می برد. یک فیلم کوتاه توسط Primordial Soup با همکاری Google DMind تابستان گذشته منتشر شد. در آنجا از ابزارهای هوش مصنوعی برای تقویت “صحنه های اکشن زنده با سکانس های تولید شده توسط مدل Veo” استفاده شد.
“هفته ها” سفارش و بازنویسی سفارشات
از لحاظ تئوری، داشتن یک مدل هوش مصنوعی که یک صحنه را در عرض چند دقیقه ایجاد میکند، میتواند در مقایسه با فیلمسازی سنتی (پیدا کردن مکانها، استخدام بازیگران، تنظیم دوربینها و دکورها) در زمان زیادی صرفهجویی کند. اما این منبع میگوید که فرآیند بسیار تکراری تولید و بهینهسازی فیلم برای این مجموعه هنوز هم برای هر چند دقیقه ویدیو «هفتهها» طول میکشد و «ما اغلب با ضربالاجلها سر و کار داریم».
اگرچه مدل هوش مصنوعی اساساً آواتارهای واقعگرایانه را متحرک میکند، منبع گفت این فرآیند به دلیل عدم کنترل دقیق بر خروجی مدل ویدیویی «بیشتر شبیه فیلمسازی لایو اکشن» است. او افزود: “شما نمی دانید که در اولین برداشت، دوازدهمین یا چهلمین چیزی که می خواهید به دست خواهید آورد.”

در حالی که دستیابی به برخی از پوسته ها ممکن است زمان کمتری داشته باشد، مدل هوش مصنوعی به ندرت در اولین تلاش یک پوسته کامل و قابل پخش تولید می کند. در حالی که برخی از مشکلات جزئی در ظاهر تولید شده توسط هوش مصنوعی را می توان در پس از تولید با جلوه های بصری یا ترفندها حل کرد، اغلب تیم باید به عقب برگردد و به مدل بگوید که یک ویدیوی کاملاً جدید با تغییرات جزئی بسازد.
او گفت: «این هنوز به تلاش زیادی نیاز دارد و این لزوماً به این دلیل نیست که خروجی اشتباه است، بلکه به این دلیل است که ما در تلاش هستیم تا کنترل را درست انجام دهیم. زیرا می خواهید نور به روش خاصی برای بیان داستان به صورت شما بتابد. ما همچنان به دنبال همان کنترلی هستیم که همیشه در تولیدات لایو اکشن داشتیم تا داستان و احساسات را به حداکثر برسانیم.»
نماهای کوتاه و بودجه کمتر
به گفته منبع، اگرچه مدلهای ویدیویی پس از پخش کلیپ کابوسآمیز «ویل اسمیت در حال خوردن اسپاگتی» بهبود یافتهاند، اما به گفته منبع، توهمات و حرفهای بیهدف «هنوز یک مشکل» در تولید مجموعه هستند. این یکی از دلایلی است که شرکت تصمیم گرفت به جای یک فیلم کامل از یک سری ویدیوهای کوتاه استفاده کند.
او میگوید: «ثابت بودن در سه دقیقه یک چیز است، اما ثابت ماندن در دو ساعت بسیار سختتر است و به کار بسیار بیشتری نیاز دارد». من نمیدانم در حال حاضر نقطه پایان چیست، اما هر چه این مدت طولانیتر شود، همه چیز بیشتر از هم میپاشد.»
کوتاه نگه داشتن نماهای فردی امکان کنترل بیشتر و «بازگیری» کمتر در تولیدات انیمیشن هوش مصنوعی را فراهم می کند. او افزود: “اگر می خواهید یک کلیپ 20 ثانیه ای بسازید، اتفاقات زیادی رخ می دهد و اگر یکی از آنها در عرض 20 ثانیه خراب شد، باید از نو شروع کنید.” “احتمال رخ دادن خطا در 20 ثانیه بسیار زیاد است، اما در 8 ثانیه بسیار کمتر است.”
در حالی که منبع ما توضیح بیشتری در مورد هزینه تولید این مقدار ویدئو برای تیم ارائه نکرد، او اشاره کرد که این روند همچنان بسیار ارزان تر از فیلمبرداری یک مستند تاریخی در محل است. او قول داد که در قسمت های آینده “شما کارهایی را خواهید دید که حتی دوربین ها هم نمی توانند انجام دهند” بنابراین “ما از این محیط بهترین استفاده را خواهیم کرد.”
اگر به سرعت پیشرفت ویدیوهای تولید شده با هوش مصنوعی دقت کرده اید، ممکن است فکر کنید که مدل های هوش مصنوعی به زودی با یک فرمان ساده می توانند فیلم هایی با کیفیت هالیوود تولید کنند. با این حال، به گفته این منبع، کار در این پروژه نشان می دهد که هنوز وجود انسان در چرخه تولید چقدر مهم است. او گفت: «شخصاً، فکر نمیکنم که ما هرگز به نقطهی جایگزینی ویراستاران انسانی نخواهیم رسید. “ما شدیداً به یک ویرایشگر نیاز داریم.”
این می تواند خبر خوبی برای سردبیران باشد. اما این پروژه همچنین جهانی را پیشنهاد می کند که در آن بازیگران انسانی روی صفحه کاملاً با آواتارهای هوش مصنوعی جایگزین می شوند. این منبع در نهایت به این سوال که چرا سازندگان فکر می کنند هوش مصنوعی آماده است تا این بخش منحصر به فرد انسانی را در اختیار بگیرد، پاسخ شگفت انگیزی داد.
او گفت: “من نمی دانم که آیا ما این را می دانیم، صادقانه بگویم.” فکر می کنم می دانیم که این فناوری آماده آزمایش است. ما بهعنوان داستاننویس، واقعاً به همه ابزارهای مختلفی که میتوانیم برای انتقال داستان خود استفاده کنیم و به مخاطب احساس چیزی کنیم، علاقه مندیم. به ندرت پیش می آید که ابزارهای جدید و عالی مانند این به دست آوریم. پس این هرگز در زندگی من اتفاق نیفتاده است. اما وقتی ابزارهایی از این دست دارید، می خواهید با آنها بازی کنید. ما باید چیزهای مختلفی را امتحان کنیم تا ببینیم آیا کار می کند یا خیر. ما اکنون ابزارها را داریم. بیایید ببینیم چه کاری می توانیم انجام دهیم.”
منبع: arstechnica
۵۸۳۲۳
گردآوری شده از رسانه خبر آنلاین






ارسال پاسخ