آریا جوان

آخرين مطالب

موفقیت هوش مصنوعی مایکروسافت در رنگی‌کردن ویدئوها فقط با یک تصویر فناوری

  بزرگنمايي:

آریا جوان - تلاش جدید تیمی از پژوهشگران نشان داد یادگیری ماشین به‌کمک هوش مصنوعی مایکروسافت می‌تواند ویدئوهای سیاه‌و‌سفید را تنها با یک تصویر مرجع رنگی، رنگی کند.

رنگی‌کردن ویدئوها ممکن است اثری هنری قلمداد شود. امروزه، مدل‌های جدید هوش مصنوعی کم‌کم به این حوزه نیز وارد شدند و می‌توانند اثری هنری خلق کنند. تیم دانشمندان مایکروسافت با همکاری دانشگاه حمد‌بن‌خلیفه و مؤسسه‌ی USC در بخش‌های تحقیقات آسیا (Research Asia) و ادراک هوش مصنوعی (AI Perception) و بخش واقعیت ترکیبی (Mixed Reality Division) پژوهشی جدید انجام داد و مقاله‌ای با عنوان رنگی‌کردن ویدئوها مبتنی‌بر نمونه‌ی مرجع (Deep Exemplar-based Video Colorization) در وب‌سایت Arxiv منتشر کرد. این پژوهش جدید دستاوردی در حوزه‌ی فناوری‌های خلاقانه است و پژوهشگران این تیم ادعا می‌کنند موفق شدند اولین سیستم سرتاسری مستقلِ مبتنی‌بر نمونه (مثلا برگرفته از تصویری مرجع) را در رنگی‌کردن ویدئوها ایجاد کنند. به‌گفته‌ی پژوهشگران مایکروسافت، این تحقیقات در هر دو بخش کمّی و کیفی به نتایجی فراتر از اثری هنری دست پیدا کرده است. نویسندگان این مقاله معتقدند: مسئله‌ی اصلی چگونگی دستیابی به ثبات زمانی (Temporal Consistency) است؛ درحالی‌که بتوان به سبک و ویژگی‌های تصویر مرجع وفادار ماند. تمام بخش‌های مختلف این مدل هوش مصنوعی که به‌صورت سیستم سرتاسری آموزش داده شده، باعث ایجاد ویدئوهای واقعی با پایداری زمانی (Temporal Stability) مناسب می‌شود. نویسندگان این مقاله خاطرنشان کردند توانایی هوش مصنوعی در تبدیل ویدئو‌های تک‌رنگی به ویدئوهای رنگی کار جدیدی نیست. برای نمونه، پژوهشگران انویدیا یکی از بزرگ‌ترین شرکت‌های فناوری جهان و غول پردازنده‌های گرافیکی ، در سپتامبر گذشته موفق شدند مدلی ارائه کنند که رنگ‌ها را از فریم فقط یک ویدئو رنگی‌شده استخراج می‌کرد. نمونه‌ی دیگر، هوش مصنوعی گوگل است که در ژوئن با ارائه‌ی الگوریتمی، ویدئوهای سیاه‌وسفید را بدون نظارت دستی انسان رنگی می‌کرد. بااین‌حال، نکته‌ی اصلی این است که خروجی تمام این مدل‌ها و الگوریتم‌های ارائه‌شده خطاها و آرتیفکت‌های بسیار دارد که مدت زمان ویدئو ورودی را افزایش می‌دهد.
برای مشاهده‌ی ابعاد اصلی روی تصویر کلیک کنید. پژوهشگران در تلاش برای کاهش این نقص‌ها در روشی جدید، نتیجه‌ی فریم ویدئو قبلی را به‌عنوان ورودی (برای حفظ ثبات) حفظ و با استفاده از تصویر مرجع جدید، ویدئو را رنگی‌ کردند. در بیشتر مدل‌های قبلی، رنگ صحیح اجسام درون تصویر را نمی‌شد به‌صورت مستقیم از تصویر سیاه‌وسفید به‌دست آورد؛ بنابراین، هوش مصنوعی باید می‌توانست نوع و رنگ اجسام را ازطریق یادگیری ماشینی که از چند میلیون عکس رنگی به‌دست آورد و به‌درستی پیش‌بینی کند. در این مدل، به تصویر نمونه‌ی مرجع اجازه‌ی هدایت رنگی‌کردن فریم‌به‌فریم ویدئو داده می‌شد که این کار باعث جلوگیری از تجمع خطاها کاهش تعداد آن‌ها می‌شد. در این مدل جدید، هنگام جلورفتن فریم‌به‌فریم ویدئو، رنگ فریم‌ها تغییر نمی‌کند؛ یعنی رنگ جدید محتوای ویدئویی سیاه‌وسفید با جلورفتن ویدئو در فریم‌های بعدی ثابت باقی می‌ماند. اگر تصویر مرجع یک فریم رنگی در ویدئو باشد، این کار همانند بسیاری دیگر از روش‌های رنگی‌کردن ویدئوها، اما بسیار قدرتمندتر و با دقت بیشتری انجام می‌شود؛ درنتیجه، این مدل جدید می‌تواند رنگ‌های «طبیعی» را براساس معانی ورودی تصویر سیاه‌وسفید پیش‌بینی کند. این مدل حتی می‌تواند زمانی‌که تطبیق مناسبی در تصویر مرجع یا فریم قبلی ارائه نشده باشد، پیش‌بینی مناسبی از معنای رنگ کند. دستیابی به چنین مدلی نیازمند معماری شبکه‌ی کانولوشن سرتاسری است. شبکه‌ی کانولوشن سرتاسری نوعی سیستم هوش مصنوعی است که برای تجزیه‌و‌تحلیل تصاویر دیداری از آن استفاده می‌شود و همراه‌با ساختاری مکرر است که اطلاعات تاریخی ازنظر زمانی را حفظ می‌کند. این مدل از دو ماژول تشکیل شده است: 1. مدل Correspondence که تراز تصویر مرجع را در فریم ورودی متناسب با معنای تراکم رنگ تنظیم می‌کند؛ 2. مدل رنگی‌کردن ویدئوها است که باتوجه‌به نتیجه‌ی رنگی‌شدن فریم فبلی و تراز تصویر مرجع، فریم ویدئو سیاه‌و‌سفید را رنگی می‌کند. مقاله‌های مرتبط:
رنگی کردن عکس‌ های قدیمی به کمک هوش مصنوعی پیتر جکسون چگونه فیلم‌های 100 ساله جنگ جهانی اول را رنگی کرد؟
تیم تحقیقاتی مجموعه‌ای از داده‌های آموزش‌دیده را از مجموعه‌ی متن‌باز Videvo گردآوری کردند که بیشتر شامل تصاویر حیوانات و مناظر بودند. آن‌ها پرتره ویدئوها را با استفاده از مجموعه‌ی جداگانه‌ای (هالیوود 2) کامل کردند و مجموع 768 ویدئویی را فیلتر کردند که بیش‌ازحد تصویر آن‌ها تاریک بود یا رنگ محوی داشتند. برای هر ویدئو، 25 فریم استخراج شد و دسته‌بندی داده‌ها را با عکس‌های ImageNet، مرکز داده‌ی وسیعی برای توسعه‌ی نرم‌افزارهای هوش مصنوعی گسترش دادند که برای اعمال تحریف هندسی تصادفی و مشخص‌کردن نویزها برای تولید فریم‌ها استفاده می‌شدند. نتیجه‌ی نهایی، تولید 70 هزار ویدئو تکمیل‌شده در «دسته‌‌بندی‌های گوناگون» بود. به‌گزارش نویسندگان این مقاله، در آزمایش‌های انجام‌شده‌ی این سیستم جدید، بهترین دقت کلاس Top-5 و Top-1 در ImageNet ارائه شده است. این نشان‌دهنده‌ی آن است که نتایج ازنظر معنایی معنادار بوده و آن را با کمترین مقدار Frechet Inception Distance یا FID در‌مقایسه‌با معیارهای بنچمارک مدیریت کرده که این کار باعث می‌شود خروجی بسیار واقعی‌تر باشد. پژوهشگران گفتند: به‌طورکلی، نتایج این مدل وایبرنت رنگی کمی دارند؛ اما شباهت زیادی با رنگ‌های زمینه عکس مرجع دارند. همچنین، این روش جدید در مقایسه‌ی کیفی نیز نتایج واقعی‌تری با وایبرنت رنگی‌سازی کمتری تولید می‌کند. علاوه‌براین در هر فریم، وایبرنت‌های رنگی با آرتیفکت‌های بسیار کمتری در‌مقایسه‌با مدل‌های قبلی وجود دارند. در‌عین‌حال، فریم‌های متوالی رنگی نشان می‌دهد هماهنگی ثبات زمانی مناسبی دارد.

لینک کوتاه:
https://www.aryajavan.ir/Fa/News/136640/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

عکسی از بازیگر سریال «جومونگ» پس از سال‌ها

برخی از بناهای تاریخی در گذشته چگونه به نظر می رسیدند

جدال اپل و اسپاتیفای بر سر قوانین اپ استور همچنان ادامه دارد

کوالکام از تراشه اسنپدراگون X پلاس رونمایی کرد؛ سلاح اقتصادی ویندوزی‌ها برای نبرد با مک‌بوک‌ها

ارتباط مغز و کامپیوتر؛ رقیب چینی تراشه نورالینک ایلان ماسک معرفی شد

گلکسی رینگ سامسونگ به هوش مصنوعی مجهز خواهد بود

سناتو آمریکایی خواستار جلوگیری از فروش تمام کالاها به هواوی شد

موجودات فضایی‌ بازی Exodus نژادهای متنوعی خواهند داشت

تلگرام با 15 قابلیت جدید نفس را در سینه واتساپ حبس کرد

اپل واچ سری X احتمالا از مادربرد با طراحی باریک‌تر استفاده خواهد کرد

مبارزه مرد آمریکایی با تمساح!

حمایت جالب فعالین رسانه‌ای دنیا از اعتراضات ضد صهیونیستی دانشجویان آمریکا

نماهنگ «فلسطین تنها نیست» با نوای مهدی سلحشور

اگر کسی به یاد گناهان گذشته اش افتاد بداند ذات اقدس الهی به یادش انداخته

تفال/ سالها دل طلب جام جم از ما می‌کرد

تقویم تاریخ/ بیانیه سازمان ملل علیه سلاح‏های شیمیایی عراق بر ضد ایران

دریاچه ای زیبا در نیوزلند

حکمت/ گناهِ ثروتمندی

محافظت دانشجویان هاروارد از دانشجویان مسلمان هنگام خواندن نماز

آیا جن‌ها هم زاد و ولد دارند؟

خانه مورد علاقه سرخپوشان/ عکس

فال روزانه جمعه 7 اردیبهشت 1403

دو تا کلیه محکم و پرکار، در عین حال ترد و کرانچی!

صفحه مجازی همسر سابق «مهدی قائدی» بسته شد

پخش برنامه «هفت» با اجرای بهروز افخمی از فردا

بازسازی سکانس مشهور ترانه علیدوستی توسط صهبا شرافتی

مهران مدیری با «پدر قهوه» به شبکه خانگی می آید

فروش 9 میلیاردی «مست عشق» در دو روز

این چه سوزشی است که بر جان من پدید آمد؟!

آقای ناخدا ما آدمای بدی نیستیم

این کار را با مدیرتان نکنید!

هشدار بارسا به ژاوی؛ رفتارت را درست کن

توخل در فکر شانس برتری بایرن مقابل رئال به روایت انیمیشن

فوتبالیست‌هایی که قوانین را مجاب به تغییر کردند!

تمرینات انفرادی پادشاه روی تشک

گل برتر هفته 30 لیگ برتر پرتغال

منافی: انتخاب سرمربی پرسپولیس باید به پایان فصل موکول شود

جعفری: استقلال لحظه آخر شانس آورد

واکنش رئیس لالیگا به ماندن ژاوی

پیام وزیر ورزش به‌ مناسبت روز فرهنگ پهلوانی و ورزش زورخانه‌ای

موسیالا: اگر به من بود می‌گفتم امباپه به بایرن بیاید

تپانچه بادی ایران نایب قهرمان شد

سبکی خاص از لباس پوشیدن که دوباره مد شده است

اصولی ترین نکات در نگهداری از کیف‌های چرمی گران قیمت

زنان بدون فرزند شاد‌تر هستند یا مادران؟

اشتباهات کوچک اکثر ما زنان در آشپزخانه

توئیت مهدی فضائلی درباره سردار بلندپایه سپاه

تصاویر جدید از سردار قاآنی با پوشش غیرنظامی

پیام رئیسی در پی درگذشت عروس امام خمینی

اظهارات وزیر کشور درخصوص دور دوم انتخابات مجلس