آریا جوان

آخرين مطالب

اینتل معماری تراشه‌های مجتمع گرافیکی نسل 11 خود را رونمایی کرد فناوری

  بزرگنمايي:

آریا جوان - اینتل در وب‌سایت خود از جزییات معماری پردازنده‌‌های گرافیکی مجتمع Gen11 که قرار است در آینده‌ی نزدیک همراه‌با پردازنده‌های 10 نانومتری Ice Lake ارائه شود، رونمایی کرد.

شرکت اینتل به یک‌باره و بی هیچ مراسم و تشریفاتی، در وب‌سایت خود از ریز معماری پردازنده‌های گرافیکی مجتمع نسل 11 (Gen11) رونمایی کرد. در اسناد ارائه‌شده توسط اینتل، جزئیات درخورتوجهی در مورد تراشه‌ی گرافیکی جدید این شرکت که همراه‌با پردازنده‌های 10 نانومتری Ice Lake در آینده‌ی نزدیک عرضه خواهند شد، ارائه شده است. مقالات مرتبط:
رمزگشایی از داستان دنباله‌دار پردازنده‌های Lake اینتل عزم جزم اینتل برای ورود به بازار کارت گرافیک
اینتل پردازنده‌ی گرافیکی نسل 11 جدید خود را در مراسم Architecture Day معرفی کرد و تصریح کرد که تیم مهندسی پردازنده‌ی گرافیکی نسل 11 به‌سختی در حال کار روی این تراشه‌هاست تا سطح عملکردی چشمگیر نسبت به تراشه‌های گرافیکی نسل‌های قبلی این شرکت ایجاد کند‌. هدف از ساخت چنین تراشه‌ای رسیدن به قدرت محاسباتی یک ترافلاپس در محاسبات اعشاری 32 بیتی و 2 ترافلاپس در پردازش مشابه 16 بیتی همراه‌با توان مصرفی پایین‌تر در تراشه‌های گرافیکی مجتمع اینتل است. اخیرا شواهدی در مورد سطح عملکرد درخورتوجه این تراشه در محیط‌های گرافیکی واقعی روی شبکه‌ی اینترنت منتشر شده است . با درنظرگرفتن اطلاعات و ارقام ارائه‌شده توسط شرکت اینتل در این اسناد، می‌توان به‌طور مستدل عملکرد خام این تراشه‌های مجتمع گرافیکی را در محدوده‌ی هسته‌های Radeon Vega 8 دانست که همراه‌با پردازنده‌ی Ryzen 3 2200G عرضه می‌شود. این سطح عملکرد مترقی، حاکی از بهبود اساسی در موتورهای گرافیکی پیش‌فرضی است که اینتل همراه‌با اغلب پردازنده‌های جریان اصلی محصولات خود عرضه می‌کند؛ چنین پردازنده‌ی گرافیکی یکپارچه‌ای می‌تواند زنگ خطری برای محصولات گرافیکی رده پایین انویدیا و AMD به حساب آید. اسناد ارائه‌شده توسط اینتل حاکی از آن است که این تراشه‌های گرافیکی بر پایه‌ی فناوری ساخت 10 نانومتری با ترانزیستورهای نسل سوم FinFET تولید شده است. همان‌طور که انتظار می‌رفت، این تراشه‌ها از تمامی APIهای مهم پشتیبانی می‌کند. اینتل پشتیبانی از 4 حافظه‌ی 32 بیتی LPDDR4/DDR4 را به این پردازنده‌ها اضافه کرده که پیشرفت چشمگیری نسبت به پشتیبانی تراشه‌های گرافیکی نسل 9 از دو حافظه‌ی 64 بیتی LPDDR4/DDR4 به حساب می‌آید. در تراشه‌های گرافیکی نسل 9 اینتل از چیدمانی ماژولار شامل 3 برش‌ فرعی (Sub-Slice) که هر یک میزبان 8 واحد اجرایی (EU) است، استفاده شده است. شرکت اینتل ‏Intel این بار در طراحی نسل 11 این تراشه‌های گرافیکی تا 8 برش فرعی ایجاد کرده که در اکثر نسخه‌های GT2 در مجموع دربرگیرنده‌ی 64 واحد اجرایی یا EU است؛ اما ممکن است در طراحی برخی نسخه‌های تراشه این میزان تعدیل شود.در چنین حالتی قابلیت محاسباتی تراشه‌ی جدید تا 2.67 برابر تراشه‌های گرافیکی نسل 9 افزایش می‌یابد. تراشه‌ی جدید همچنین قادر به انتقال 2 پیکسل در هر کلاک است. شکل زیر نشان‌دهنده‌ی دیاگرام ابتدائی بلوک‌های یک پردازنده‌ی نسل بعدی Ice Lake است؛ همان‌طور که دیده می‌شود قسمت‌های مختلف SOC (سیستم روی یک تراشه) شامل هسته‌های پردازنده، هسته‌های پردازنده‌ی گرافیکی، LLC (آخرین سطح حافظه‌ی کش) و عوامل کارگزار سیستم (شامل PCIe، کنترلر حافظه و کنترلر نمایشگر) ازطریق یک حلقه‌ی اتصال‌دهنده‌ی داخلی به یکدیگر وصل شده و با هم در ارتباط هستند.
چنین چیدمانی گویای آن است که اینتل از یک اتصال داخلی Ring Bus برای اتصال ساختارهای مختلف در تراشه استفاده می‌کند. مسئله‌ی قابل‌توجه در این طراحی این است که آخرین سطحِ حافظه‌ی کش (LLC) در میان هسته‌های پردازنده و تراشه‌ی گرافیکی به اشتراک گذارده‌ شده که باعث حذف فرایند نقل و انتقال داده‌ها به واحدهای متناظر می‌شود. در طراحی این SOC از دامنه‌های کلاک متعددی استفاده شده که به هر هسته‌ی پردازنده‌ی اصلی، تراشه‌ی گرافیکی مجتمع و حلقه‌ی اتصال داخلی، دامنه‌ی کلاک معینی قابل تخصیص است. تراشه‌ی مجتمع گرافیکی نسل 11 از رندرینگ Tile و همچنین حالت رندرینگ فوری پشتیبانی می‌کند؛ در این حالت در خلال برخی بارهای کاری رندرینگ، از میزان تقاضای حافظه کاسته می‌شود. در شکل زیر، سلسله‌مراتب حافظه در یک تراشه‌ی Ice Lake و حداکثر پهنای باند متناظر میان اجزا نشان داده شده است. حرکت اینتل به سمت پشتیبانی از حافظه‌ی LPDDR4 متضمن افزایش چشمگیر پهنای باند و در عین حال کاهش توان مصرفی است. نوآوری راستین در این تراشه در طراحی حافظه‌ی اشتراکی نهفته است که تقاضا برای کپی‌کردن داده‌ها را ازطریق بافرها کاهش می‌دهد.
GTI (که مخفف Graphics Technology Interface یا رابط فناوری گرافیکی است) پردازنده‌ی گرافیکی را به بخش‌های دیگر تراشه‌ی SOC شامل حافظه‌ی LLC و DRAM متصل کرده است. شرکت اینتل در این نسخه سطح عملکرد را از 32 بایت در هر کلاک به 64 بایت در هر کلاک در عملیات نوشتن ارتقا داده، و صف‌بندی‌های داخلی را با هدف کاهش تأخیر و بهبود پهنای باند بازآرایی و اصلاح کرده است. در این شکل دیده می‌‌شود که پردازنده‌ی گرافیکی (GPU) قادر به خواندن و نوشتن در حلقه‌ی اتصال داخلی با سرعت 64 بایت به ازای هر کلاک است، درحالی‌که پردازنده‌ی اصلی (CPU) فقط می‌تواند 32 بایت به ازای هر کلاک در این رینگ بنویسد یا از آن بخواند؛ بنابراین پردازنده‌ی گرافیکی مسیر (Pathway) سریع‌تری به آخرین سطح حافظه‌ی کش اشتراکی (L3) در دسترس خود دارد. علاوه‌بر این، پردازنده‌ی گرافیکی 3 مگابایت کش سطح 3 داخلی اختصاصی در اختیار دارد که به‌صورت واسطه‌ای میان برش‌های فرعی و GTI عمل می‌کند. در تصویر زیر، نمایی از برش‌های تراشه‌ی گرافیکی نسل 11 ارائه شده است. هر برش‌ تراشه میزبان یک واحد 3D Fixed Function Geometry، هشت برش فرعی شامل واحدهای EU و یک برش مشترک (Common Slice) است که بلوک‌های عامل ثابت را در بر داشته و اقدام به نوشتن در برش کش L3 می‌کند. اینتل زیرسیستم حافظه را با 4 برابر کردن حافظه‌ی کش سطح 3 اختصاصی به میزان 3 مگابایت بهبود بخشیده و برای بهبود و عدم تداخل در توازیِ کاری (Parallelism) حافظه‌ی محلی اشتراکی (SLM) مجزایی برای هر برش فرعی در نظر گرفته است. به‌علاوه طراحی جدید، دربرگیرنده‌ی الگوریتم‌های فشرده‌سازی حافظه است.
سایر بخش‌های ارتقاءیافته در معماری پردازنده‌ی گرافیکی جدید شامل یک موتور HEVC Quick Sync Video کاهش‌دهنده‌ی 30 درصدی بیت ریت در مقایسه با نسل 9 (در کیفیت تصویر مشابه یا بهتر)، پشتیبانی از استریم ویدئوی 4K و 8K چندگانه با توان مصرفی کمتر و نیز پشتیبانی از فناوری Adaptive Sync است. عمق بیت در رمزگشایی ویدئویی VP9 از 8 به 10 بیت افزایش یافته تا این بار از ویدئوهای HDR نیز پشتیبانی به عمل آید. در بررسی عمیق‌تر تراشه‌ی گرافیکی نسل جدید می‌توان دید که هر برش میزبان 8 برش فرعی است که هر کدام 8 واحد اجرایی یا EU را در بر دارد. هر زیربرش‌ دربرگیرنده‌ی یک واحد Thread Dispatcher محلی و کش‌های دستورالعمل مربوط‌به خود برای تغذیه‌ی آن است. یک حافظه‌ی محلی اشتراکی، واحد نمونه‌برداری بافت سه‌بعدی و واحد دیتاپورت هر یک از این برش‌های فرعی را تکمیل می‌کند.
با نگاهی دقیق‌تر به طراحی حافظه‌ی محلی اشتراکی (SLM) که 8 واحد اجرایی را در هر برش فرعی تغذیه می‌کند، مشخص می‌شود که اینتل SLM را به این دلیل را در برش فرعی وارد کرده است که رقابت را در دیتاپورت به هنگام تلاش واحدهای EU برای دسترسی همزمان به کش سطح 3 کاهش دهد. نزدیکی بیشتر SLM به واحدهای EU همچنین به کاهش تأخیر و بازدهی بوست‌ها کمک می‌کند.
با ورود به درون هر یک از واحدهای اجرایی EU چند رشته‌ای (Multi-threaded)، می‌توان یک جفت واحد محاسبه‌ی اعشاری SIMD (یا ALU-ها) در هر کدام مشاهده کرد؛ اما در عمل هر یک از این واحدها هم از عملیات اعشاری و هم از عملیات صحیح پشتیبانی می‌کند. اینتل می‌گوید این واحدهای ALU قادر به انجام چهار عملیات اعشاری یا صحیح 32 بیتی یا 8 عملیات اعشاری 16 بیتی است. این مقدار مساوی است با 16 عملیات FP32 به ازای هر کلاک یا 32 عملیات FP16 در هر کلاک.

لینک کوتاه:
https://www.aryajavan.ir/Fa/News/114267/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

سفر به دنیای ارباب حلقه ها با تریلر جدید Tales of the Shire: A Lord of the Rings

ستاره سابق یونایتد: برمی‌گردم!

گلزن جدید استقلال از دفاع آمد

ویسی به یاد 9 بازیکن خوزستانی در تیم ملی

اورونوف، مهمترین اسلحه اوسمار برای انتقام

چه کنم نیمار و مسی نیستم، ولی عاشق رونالدو هستم!‏

شادی بلینگام و واسکز در تهران تکرار شد!

خطرناک‌ترین ورژن خدابنده‌لو شاید در اراک!

ادامه آمار جادویی حسن‌زاده در تیم ملی

ورود سروش به باشگاه صدتایی‌های پرسپولیس

سقوط از لیگ برتر با یک برزیلی لغو می‌شود

چرا پرسپولیس دربی را نبرد

منشا برای فولاد ضرر داشت رفت!

ویسی، ایده کمیته فنی در فولاد را رد کرد

رئیسی پاکستان را به مقصد سریلانکا ترک کرد

دیدار معاون مددکاری و مشارکت های مردمی بنیاد شهید و امور ایثارگران با نماینده ولی فقیه و استاندار البرز

استان البرز شهدای بزرگی را تقدیم نظام کرده است

قوانین مصوب با اعتبارات بنیاد شهید همخوانی ندارد

دستگاه های جوجه کشی شرکت مکانیزاسیون در مسیر صادرات

رسیدگی به درخواست 41 متقاضی توسط سرپرست بنیاد شهید و امور ایثارگران آذربایجان شرقی

یازده بازیکن برتر تاریخ ایران از نگاه خسرو حیدری

جوان‌ترین بازیکن تیم ملی: قرقیزستان با برزیل فرقی ندارد

یک بازی لیگ برتر بدون تماشاگر شد

معاون سلامت و توانمندسازی اجتماعی  بنیاد شهید و امور ایثارگران با جمعی از جانباران قطع نخاعی دیدار کرد

شهریار شعر ایران را بیشتر بشناسید

این مردها آماده شروع یک رابطه عاطفی هستند

تودور: با سری بالا از کوپا ایتالیا حذف شدیم

ناگفته‌های مربی سابق استقلال از دربی حذفی‌

پوچتینو: به شکست 5-0 نیاز داشتیم!

یک بی‌احتیاطی و رویاهایی که بر باد رفت

روزگار بحرانی یاران صیادمنش؛ 9 بازی 3 امتیاز

سرنوشت تراکتور سرانجام تعیین شد

مکان بازی مرگ و زندگی سپاهان مشخص شد

جای آزمون را یک ایرانی پُر می‌کند

خلاصه بازی آرسنال 5 - چلسی 0

خسرو: در زمان ساپینتو، چهار پنج مدیرعامل عوض کردیم

خلاصه بازی لاتزیو 2 - یوونتوس 1

حیدری: تیم نکونام شخصیت قهرمانی دارد

ناگفته‌های خسرو حیدری از دربی جام حذفی

نمک سیاوش یزدانی بر زخم هواداران الهلال!

گل تماشایی سینا اسدبیگی در تمرین پرسپولیس

مشکلات ساپینتو و فتح‌الله‌زاده بر سر دفتر کمپ حجازی

حیدری: در اولین بازی خوشه طلایی، فقط یازده بازیکن داشتم

خلاصه بازی الهلال 2 - العین 1

گل پنجم آرسنال به چلسی توسط بن وایت دقیقه 70

اولین کاپیتانی ترابی در پرسپولیس

ابتلای ستاره اتلتیکو به یک بیماری خطرناک

حریف سپاهان از هند نیروی کمکی گرفت!

دبیر جدید فدراسیون کبدی معرفى شد

گل اول یوونتوس توسط میلیک در دقیقه 82