راه ترقی

آخرين مطالب

اینتل معماری تراشه‌های مجتمع گرافیکی نسل 11 خود را رونمایی کرد اقتصاد

  بزرگنمايي:

راه ترقی - اینتل در وب‌سایت خود از جزییات معماری پردازنده‌‌های گرافیکی مجتمع Gen11 که قرار است در آینده‌ی نزدیک همراه‌با پردازنده‌های 10 نانومتری Ice Lake ارائه شود، رونمایی کرد.

شرکت اینتل به یک‌باره و بی هیچ مراسم و تشریفاتی، در وب‌سایت خود از ریز معماری پردازنده‌های گرافیکی مجتمع نسل 11 (Gen11) رونمایی کرد. در اسناد ارائه‌شده توسط اینتل، جزئیات درخورتوجهی در مورد تراشه‌ی گرافیکی جدید این شرکت که همراه‌با پردازنده‌های 10 نانومتری Ice Lake در آینده‌ی نزدیک عرضه خواهند شد، ارائه شده است. مقالات مرتبط:
رمزگشایی از داستان دنباله‌دار پردازنده‌های Lake اینتل عزم جزم اینتل برای ورود به بازار کارت گرافیک
اینتل پردازنده‌ی گرافیکی نسل 11 جدید خود را در مراسم Architecture Day معرفی کرد و تصریح کرد که تیم مهندسی پردازنده‌ی گرافیکی نسل 11 به‌سختی در حال کار روی این تراشه‌هاست تا سطح عملکردی چشمگیر نسبت به تراشه‌های گرافیکی نسل‌های قبلی این شرکت ایجاد کند‌. هدف از ساخت چنین تراشه‌ای رسیدن به قدرت محاسباتی یک ترافلاپس در محاسبات اعشاری 32 بیتی و 2 ترافلاپس در پردازش مشابه 16 بیتی همراه‌با توان مصرفی پایین‌تر در تراشه‌های گرافیکی مجتمع اینتل است. اخیرا شواهدی در مورد سطح عملکرد درخورتوجه این تراشه در محیط‌های گرافیکی واقعی روی شبکه‌ی اینترنت منتشر شده است . با درنظرگرفتن اطلاعات و ارقام ارائه‌شده توسط شرکت اینتل در این اسناد، می‌توان به‌طور مستدل عملکرد خام این تراشه‌های مجتمع گرافیکی را در محدوده‌ی هسته‌های Radeon Vega 8 دانست که همراه‌با پردازنده‌ی Ryzen 3 2200G عرضه می‌شود. این سطح عملکرد مترقی، حاکی از بهبود اساسی در موتورهای گرافیکی پیش‌فرضی است که اینتل همراه‌با اغلب پردازنده‌های جریان اصلی محصولات خود عرضه می‌کند؛ چنین پردازنده‌ی گرافیکی یکپارچه‌ای می‌تواند زنگ خطری برای محصولات گرافیکی رده پایین انویدیا و AMD به حساب آید. اسناد ارائه‌شده توسط اینتل حاکی از آن است که این تراشه‌های گرافیکی بر پایه‌ی فناوری ساخت 10 نانومتری با ترانزیستورهای نسل سوم FinFET تولید شده است. همان‌طور که انتظار می‌رفت، این تراشه‌ها از تمامی APIهای مهم پشتیبانی می‌کند. اینتل پشتیبانی از 4 حافظه‌ی 32 بیتی LPDDR4/DDR4 را به این پردازنده‌ها اضافه کرده که پیشرفت چشمگیری نسبت به پشتیبانی تراشه‌های گرافیکی نسل 9 از دو حافظه‌ی 64 بیتی LPDDR4/DDR4 به حساب می‌آید. در تراشه‌های گرافیکی نسل 9 اینتل از چیدمانی ماژولار شامل 3 برش‌ فرعی (Sub-Slice) که هر یک میزبان 8 واحد اجرایی (EU) است، استفاده شده است. شرکت اینتل ‏Intel این بار در طراحی نسل 11 این تراشه‌های گرافیکی تا 8 برش فرعی ایجاد کرده که در اکثر نسخه‌های GT2 در مجموع دربرگیرنده‌ی 64 واحد اجرایی یا EU است؛ اما ممکن است در طراحی برخی نسخه‌های تراشه این میزان تعدیل شود.در چنین حالتی قابلیت محاسباتی تراشه‌ی جدید تا 2.67 برابر تراشه‌های گرافیکی نسل 9 افزایش می‌یابد. تراشه‌ی جدید همچنین قادر به انتقال 2 پیکسل در هر کلاک است. شکل زیر نشان‌دهنده‌ی دیاگرام ابتدائی بلوک‌های یک پردازنده‌ی نسل بعدی Ice Lake است؛ همان‌طور که دیده می‌شود قسمت‌های مختلف SOC (سیستم روی یک تراشه) شامل هسته‌های پردازنده، هسته‌های پردازنده‌ی گرافیکی، LLC (آخرین سطح حافظه‌ی کش) و عوامل کارگزار سیستم (شامل PCIe، کنترلر حافظه و کنترلر نمایشگر) ازطریق یک حلقه‌ی اتصال‌دهنده‌ی داخلی به یکدیگر وصل شده و با هم در ارتباط هستند.
چنین چیدمانی گویای آن است که اینتل از یک اتصال داخلی Ring Bus برای اتصال ساختارهای مختلف در تراشه استفاده می‌کند. مسئله‌ی قابل‌توجه در این طراحی این است که آخرین سطحِ حافظه‌ی کش (LLC) در میان هسته‌های پردازنده و تراشه‌ی گرافیکی به اشتراک گذارده‌ شده که باعث حذف فرایند نقل و انتقال داده‌ها به واحدهای متناظر می‌شود. در طراحی این SOC از دامنه‌های کلاک متعددی استفاده شده که به هر هسته‌ی پردازنده‌ی اصلی، تراشه‌ی گرافیکی مجتمع و حلقه‌ی اتصال داخلی، دامنه‌ی کلاک معینی قابل تخصیص است. تراشه‌ی مجتمع گرافیکی نسل 11 از رندرینگ Tile و همچنین حالت رندرینگ فوری پشتیبانی می‌کند؛ در این حالت در خلال برخی بارهای کاری رندرینگ، از میزان تقاضای حافظه کاسته می‌شود. در شکل زیر، سلسله‌مراتب حافظه در یک تراشه‌ی Ice Lake و حداکثر پهنای باند متناظر میان اجزا نشان داده شده است. حرکت اینتل به سمت پشتیبانی از حافظه‌ی LPDDR4 متضمن افزایش چشمگیر پهنای باند و در عین حال کاهش توان مصرفی است. نوآوری راستین در این تراشه در طراحی حافظه‌ی اشتراکی نهفته است که تقاضا برای کپی‌کردن داده‌ها را ازطریق بافرها کاهش می‌دهد.
GTI (که مخفف Graphics Technology Interface یا رابط فناوری گرافیکی است) پردازنده‌ی گرافیکی را به بخش‌های دیگر تراشه‌ی SOC شامل حافظه‌ی LLC و DRAM متصل کرده است. شرکت اینتل در این نسخه سطح عملکرد را از 32 بایت در هر کلاک به 64 بایت در هر کلاک در عملیات نوشتن ارتقا داده، و صف‌بندی‌های داخلی را با هدف کاهش تأخیر و بهبود پهنای باند بازآرایی و اصلاح کرده است. در این شکل دیده می‌‌شود که پردازنده‌ی گرافیکی (GPU) قادر به خواندن و نوشتن در حلقه‌ی اتصال داخلی با سرعت 64 بایت به ازای هر کلاک است، درحالی‌که پردازنده‌ی اصلی (CPU) فقط می‌تواند 32 بایت به ازای هر کلاک در این رینگ بنویسد یا از آن بخواند؛ بنابراین پردازنده‌ی گرافیکی مسیر (Pathway) سریع‌تری به آخرین سطح حافظه‌ی کش اشتراکی (L3) در دسترس خود دارد. علاوه‌بر این، پردازنده‌ی گرافیکی 3 مگابایت کش سطح 3 داخلی اختصاصی در اختیار دارد که به‌صورت واسطه‌ای میان برش‌های فرعی و GTI عمل می‌کند. در تصویر زیر، نمایی از برش‌های تراشه‌ی گرافیکی نسل 11 ارائه شده است. هر برش‌ تراشه میزبان یک واحد 3D Fixed Function Geometry، هشت برش فرعی شامل واحدهای EU و یک برش مشترک (Common Slice) است که بلوک‌های عامل ثابت را در بر داشته و اقدام به نوشتن در برش کش L3 می‌کند. اینتل زیرسیستم حافظه را با 4 برابر کردن حافظه‌ی کش سطح 3 اختصاصی به میزان 3 مگابایت بهبود بخشیده و برای بهبود و عدم تداخل در توازیِ کاری (Parallelism) حافظه‌ی محلی اشتراکی (SLM) مجزایی برای هر برش فرعی در نظر گرفته است. به‌علاوه طراحی جدید، دربرگیرنده‌ی الگوریتم‌های فشرده‌سازی حافظه است.
سایر بخش‌های ارتقاءیافته در معماری پردازنده‌ی گرافیکی جدید شامل یک موتور HEVC Quick Sync Video کاهش‌دهنده‌ی 30 درصدی بیت ریت در مقایسه با نسل 9 (در کیفیت تصویر مشابه یا بهتر)، پشتیبانی از استریم ویدئوی 4K و 8K چندگانه با توان مصرفی کمتر و نیز پشتیبانی از فناوری Adaptive Sync است. عمق بیت در رمزگشایی ویدئویی VP9 از 8 به 10 بیت افزایش یافته تا این بار از ویدئوهای HDR نیز پشتیبانی به عمل آید. در بررسی عمیق‌تر تراشه‌ی گرافیکی نسل جدید می‌توان دید که هر برش میزبان 8 برش فرعی است که هر کدام 8 واحد اجرایی یا EU را در بر دارد. هر زیربرش‌ دربرگیرنده‌ی یک واحد Thread Dispatcher محلی و کش‌های دستورالعمل مربوط‌به خود برای تغذیه‌ی آن است. یک حافظه‌ی محلی اشتراکی، واحد نمونه‌برداری بافت سه‌بعدی و واحد دیتاپورت هر یک از این برش‌های فرعی را تکمیل می‌کند.
با نگاهی دقیق‌تر به طراحی حافظه‌ی محلی اشتراکی (SLM) که 8 واحد اجرایی را در هر برش فرعی تغذیه می‌کند، مشخص می‌شود که اینتل SLM را به این دلیل را در برش فرعی وارد کرده است که رقابت را در دیتاپورت به هنگام تلاش واحدهای EU برای دسترسی همزمان به کش سطح 3 کاهش دهد. نزدیکی بیشتر SLM به واحدهای EU همچنین به کاهش تأخیر و بازدهی بوست‌ها کمک می‌کند.
با ورود به درون هر یک از واحدهای اجرایی EU چند رشته‌ای (Multi-threaded)، می‌توان یک جفت واحد محاسبه‌ی اعشاری SIMD (یا ALU-ها) در هر کدام مشاهده کرد؛ اما در عمل هر یک از این واحدها هم از عملیات اعشاری و هم از عملیات صحیح پشتیبانی می‌کند. اینتل می‌گوید این واحدهای ALU قادر به انجام چهار عملیات اعشاری یا صحیح 32 بیتی یا 8 عملیات اعشاری 16 بیتی است. این مقدار مساوی است با 16 عملیات FP32 به ازای هر کلاک یا 32 عملیات FP16 در هر کلاک.

لینک کوتاه:
https://www.rahetaraghi.ir/Fa/News/61998/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

واکنش همتی به سخنان قالیباف؛ زندگی را برای مردم سخت و پیچیده نکنید

سرقت عجیب سهمیه بنزین؛ مواظب کارت سوخت خود باشید!

پیانو هم قیمت یک آپارتمان شد

آنالیز شبانه تیم ملی فوتسال در بانکوک

خلاصه بازی مس رفسنجان 1(5) - پیکان 1(4)

سردار برای بازی متفاوت رم فیکس شد

عربستان اسپانسر فیفا شد!‏

پرفسور کروس آلمان را قهرمان اروپا می‌کند

وینیسیوس: وقت قهرمانی دوباره رئال در ‏CL‏ است

هلاکت 2 تروریست با عملیات پهپادی نیروهای امنیتی در اطراف زاهدان

سردار اشتری: شهید حجازی دارای سبک فرماندهی بود

سردار فدوی: نقش شهید حجازی در توانمندسازی مقاومت موثر است

غریب‌ آبادی: آمریکا صلاحیت ورود به عرصه حقوق بشر را ندارد

طوفان نمک کوهنوردیه!

آرنولد از رقابت با استالونه می‌گوید

تهدید خانواده آرمان عبدالعالی به شکایت از فیلم «بی بدن»

دو تا کلیه محکم و پرکار، در عین حال ترد و کرانچی!

صفحه مجازی همسر سابق «مهدی قائدی» بسته شد

مافیای موسیقی در ایران فقط برای موسیقی پاپ هست؟

تغییر مسیر پرواز تهران- زاهدان- مشهد

تجاوز به چپ کامیون چهار کشته برجای گذاشت

دبی هنوز در زیر آب!

استنشاق گاز شادی‌آور با طعم قلیان‌های مرگ‌آور!

دفترچه آزمون گروه‌های هنر و زبان‌های خارجی کنکور 1403 منتشر شد

سیلاب در گلزار شهدای کرمان

تخریب منازل مسکونی در زاهدان بر اثر طوفان

دستگیری 70 زورگیر و سارق موبایل در تهران

ناسا 2 ماموریت رصد زمین را پس از 18 سال متوقف کرد

داستانک/ سمعک با کارکرد متفاوت

جبهه پایداری معامله‌گر است

اسراییل‌ ضربه راهبردی خورده است

دردسر تیک‌تاک

ائتلاف غرب علیه نفت روسی

اتفاق جدید در بازار مسکن؛ خریداران مسکن و مستاجران منتظر تغییر باشند

قیمت این خودرو 30 میلیون تومان ارزان شد

غافلگیری یک بازیکن جلوی چشم خانواده‌اش

احمدی و سورگی هم با پرسپولیس رفتند

پول رسید، پرسپولیسی‌ها خندیدند

بنزما و طلسم بزرگان؛ کریم را چه می‌شود!‏

شغل جدید ستاره نیوکسل؛ راننده کامیون!‏

دو بازیکن از تمرین یک‌راست به بیمارستان رفتند!‏

رئیسی: هرکجای کشور فسادی دیده شود مطلقا به فساد و مفسد رحم نخواهد شد

انتقاد فلاحت پیشه به ادعای کریمی قدوسی درباره بمب اتم

ایران: تحریم‌های یکجانبه علیه سوریه باید لغو شود

از حواشی ادامه دار یک پلتفرم تا صدرنشینی «محفل»

بازی جالب حدس چهره با سیدجواد هاشمی

آهنگ محسن چاوشی به نام «شاه مقصود» برای طرفدارانش

آتش‌سوزی مهیب اطراف بیمارستان هفت‌تیر در منطقه شهرری

شناسایی و دستگیری داوطلبان متخلف آزمون‌های روز اول کنکور 1403

ایران می تواند پرتاب انسان به فضا را رقم بزند؟