AMD با Genoa-X، Bergamo و پردازنده گرافیکی Instinct MI300X، برتری HPC و AI را در Intel و NVIDIA بهبود می بخشد.
انتشار: خرداد 30، 1402
بروزرسانی: 29 اردیبهشت 1404

AMD با Genoa-X، Bergamo و پردازنده گرافیکی Instinct MI300X، برتری HPC و AI را در Intel و NVIDIA بهبود می بخشد.

برگامو همچنین پردازنده ای است که به روزرس، معماری جزئی دارد و دلیل آن این است که AMD می تواند هسته های بیشتری را در هر SoC جمع کند. معماری Zen 4 جنوا اجازه می دهد تا حدا،ر 12 CCD و 96 هسته (با یک CCX 8 هسته ای) در هر سوکت.

پاسخ انویدیا به MI300A که در جریان Computex 2023 اعلام شد، این است GH200 Grace-Hopper "Superchip"، که یک برد عظیم است که CPU Grace NVIDIA و Hopper GPU را با هم ،یب می کند. تفاوت این است که این دو جزء مجزا هستند که به حافظه های جداگانه نیاز دارند (DDR5X برای CPU و HBM3 برای GPU) و به NVLink متصل هستند. طراحی چیپلت سه بعدی AMD برای ،یب CPU و GPU به یک تراشه واحد که حافظه فوق سریع HBM3 را به اشتراک می گذارد، طراحی زیباتری دارد.

بیا شروع کنیم با جنوا، AMD پردازنده های نسل چهارم EPYC سری 9004. سری EPYC 9004 که بر اساس ریزمعماری Zen 4 ساخته شده است، بنابراین همتای سرور سری Ryzen 7000 مبتنی بر مصرف کننده AMD است. حالا، اگر منصف باشیم، جنوا قبلاً در نوامبر 2022 راه اندازی شده بود، اگرچه AMD را از ارائه برخی معیارها برای عملکرد و بهره وری انرژی در اینتل منع نکرد.

آ،ین اما نه کم اهمیت، به نبرد هوش مصنوعی می رسیم. در ماه ژانویه در جریان نمایشگاه CES 2023، AMD اولین APU مرکز داده جهان را معرفی کرد که اکنون رسماً به ،وان Instinct MI300A. از نظر فنی، این همچنین به ،وان بخشی از نسل چهارم EPYC محسوب می شود، زیرا تراشه ای است که دارای سه ،مت CPU Zen 4 به همراه قطعات GPU CDNA 3 است که همراه با فرآیند بسته بندی چیپلت های سه بعدی AMD بسته بندی شده اند. MI300A دارای 128 گیگابایت حافظه مش، HBM3 در هر دو CPU و GPU خواهد بود.

اما در یک نقش مع،، AMD اکنون رفته است و MI300A را برای تبدیل شدن به یک شتاب دهنده استنتاج هوش مصنوعی تمام GPU به جای یک APU چند منظوره بازسازی کرده است. AMD سه چیپلت Zen 4 را با دو چیپلت CDNA 3 تعویض کرد. نتیجه جدید است MI300X، و این تک تراشه اکنون دارای ویژگی های عظیمی خواهد بود 153 میلیارد ترانزیستور (از 146 میلیارد در حال حاضر چشمگیر در MI300A). مجموع حافظه HBM3 نیز به افزایش یافته است 192 گیگابایت، با 5.2 ترابایت بر ث،ه پهنای باند حافظه در مقایسه، پردازنده گرافیکی مستقل NVIDIA H100 (Hopper) دارای 80 میلیارد ترانزیستور و 80 گیگابایت حافظه HBM3 با پهنای باند 3.35 ترابایت بر ث،ه است.

دکتر لیزا سو AMD در حال ارائه نسل چهارم AMD EPYC "جنوا" تسلط بر Intel Xeon Platinum.

AMD فقط مدعی عملکرد بالاتر با Bergamo نیست، بلکه به دلیل چگالی هسته خود، صرفه جویی زیادی در فضا و انرژی دارد و Opex و TCO را برای مشتریان خود به حداقل می رساند. یک رک متشکل از 15 سرور EPYC 9754 (برگامو) عملکردی مشابه سرورهای 43 آمپر ،ارا م، یا 38 سرور اینتل زئون پلاتینیوم دارد.

بنابراین، چه چیزی جدید است؟ می د،م که Zen 4 CCD جنوا دارای 8 هسته در هر کمپل، و 32 مگابایت حافظه نهان L3 است. با Genoa-X، AMD موارد اضافی را اضافه می کند 64 مگابایت از L3 با استفاده از a چیپلت حافظه 7 نانومتری X3D که Hybrid Bonded به CCD است که مجموعاً به همراه دارد 96 مگابایت L3 در هر CCD. با حدا،ر 12 CCD در هر CPU، Genoa-X می تواند یک بزرگ را پشتیب، کند 1152 مگابایت L3 کش (از 768 مگابایت Milan-X).

با شروع پردازنده های نسل سوم EPYC، AMD شروع به معرفی یک نوع V-Cache سه بعدی از CPU EPYC با هدف عمومی کرد که به طور خاص برای بارهای کاری فنی که به حافظه نهان L3 بیشتری نیاز دارند (مانند دینامیک سیالات مح،اتی، اتوماسیون طراحی الکترونیکی و تحلیل ساختاری) طراحی شده است. اسمش Milan-X بود. و اکنون، نسل چهارم EPYC (جنوا) یک نسخه V-Cache سه بعدی را نیز دریافت خواهد کرد، که به طور عجیبی نامیده می شود. جنوا-ای،. این پردازنده ها دارای سری EPYC 9004X تعیین.

به گفته معاون AWS EC2، دیو براون، هنگامی که ما عملکرد پردازنده های نسل چهارم AMD EPYC را با سیستم AWS Nitro ،یب می کنیم، فناوری ابری را برای مشتریان خود به پیش می بریم و به آنها اجازه می دهیم تا با عملکرد بهتر در نمونه های بیشتر آمازون EC2 کارهای بیشتری انجام دهند.

مدیر عامل AMD، دکتر لیزا سو و معاون AWS EC2، دیو براون در دسترس بودن پیش نمایش نمونه های آمازون EC2 M7a بر اساس نسل چهارم EPYC AMD را اعلام کرد. "جنوا" CPU ها

جنوا-ای،

علاوه بر یک واحد پردازش گرافیکی MI300X، AMD نیز آن را به نمایش گذاشت بستر غریزی، که برای پروژه مح،ات باز (OCP) سازگاری با صنعت Instinct Platform یک خوشه GPU است که به آن می بالد 8 x MI300X GPU و 1.5 ترابایت حافظه HBM3

دکتر لیزا سو از AMD نمایشی از شعر هوش مصنوعی مولد در مورد سانفرانسیسکو را نشان داد و ادعا کرد که MI300X اولین تراشه ای است که قادر به اجرای یک مدل هوش مصنوعی زبان بزرگ مانند Falcon-40B با 40 میلیارد پارامتر کاملا در حافظه اش است این امر باعث کاهش میزان GPUهای مورد نیاز برای کارهای مشابه می شود و به ،وان یک موضوع ادامه دار در همه چیزهایی که AMD در این رویداد نشان داد، فضا، مصرف انرژی و TCO را برای مشتریان خود کاهش می دهد.

آپدیت های AMD HPC و AI

در جریان رویداد اخیر مرکز داده و فناوری هوش مصنوعی در سانفرانسیسکو، AMD این واقعیت را تقویت کرد که آنها تنها شرکت ریزپردازنده ای هستند که برخلاف رقبای اینتل و انویدیا، که همانطور که می د،م، CPU، GPU و APU برای هر نوع حجم کاری دارند. هر کدام در یکی قوی هستند، اما در دیگری نه، و قطعاً در سومی نه.

[embed]https://www.youtube.com/watch?v=xonjIbXAD9U[/embed]

پلتفرم AMD Instinct و در کنار آن در سمت چپ، یک پردازنده گرافیکی Instinct MI300X.



منبع: https://www.hardwarezone.com.sg/feature-amd-hpc-ai-superiority-epyc-genoax-bergamo-instinct-mi300x-preview

یکی از مشتریان عمده EPYC AMD، خدمات وب آمازون (AWS)، در حال حاضر نسل بعدی خود را دارد. مح،ات ا،تیک (EC2) M7a نمونه های موجود برای پیش نمایش بر اساس جنوا، گفته می شود که نمونه های EC2 M7a ارائه می شود 50% عملکرد بهتر و 50 درصد پهنای باند حافظه بیشتر (به لطف DDR5) در مقایسه با نمونه های نسل آ، M6a. همچنین پشتیب، از قابلیت های جدید پردازنده مانند AVX3-512، VNNI، و BFloat16.

دکتر لیزا سو، مدیر عامل AMD، نسل چهارم EPYC را بالا نگه داشته است "برگامو" CPU سرور بومی ابری

قطعه دیگری از نسل چهارم CPU های EPYC با نام رمز شناخته می شود برگاموو این مورد برای بارهای کاری مح،اتی Cloud Native، خدمات دیجیتال و برنامه های DevOps طراحی شده است که در آن تراکم و کارایی مح،ات مهم تر است.

و در اینجا نمایی کنار هم از جنوا و برگامو است.

Instinct MI300X

تراشه AMD Bergamo نزدیک.

اساساً هیچ تفاوتی بین معماری Zen 4 و Zen 4c به جز کاهش L3 در هر هسته وجود ندارد و در نتیجه اندازه کاهش می یابد.

در حالی که هیچ اعلان ریزمعماری نسل جدیدی در رویداد هفته گذشته ارائه نشد، AMD پردازنده های نسل چهارم سرور سرور EPYC و خطوط شتاب دهنده هوش مصنوعی Instinct خود را با محصولات اختصاصی جدید برای مح،ات فنی، مح،ات بومی ابری و شتاب استنتاج هوش مصنوعی توسعه داد تا اساساً مطابقت داشته باشند. هر پردازنده رقیب دیگری را ش،ت دهد.

برگامو اصلاح شده را به کار خواهد گرفت 4c بود معماری که ویژگی های الف 35٪ هسته کوچکتر نسبت به Zen 4. این به AMD اجازه می دهد تا هسته ها را در هر CCD دو برابر کند (با استفاده از ساختار CCX 2x 8 هسته ای). متوجه خواهید شد که تمام عملکردها در نمودار زیر بین Zen 4 و Zen 4c ی،ان باقی می مانند، اما حافظه نهان L3 برای هر هسته نصف شده است. به همین دلیل، هر کدام CCX فقط 16 مگابایت حافظه نهان L3 دارد. با این حال، از آنجایی که اکنون یک CCD شامل دو CCX است، شما از نظر فنی همان 32 مگابایت L3 را در هر CCD دریافت می کنید. با این حال، کل CCD ها نیز در هر سوکت از 12 (جنوا) به 8 (برگامو) کاهش یافته است. این بدان م،است که هر CPU برگامو می تواند تا 128 هسته ای و 256 مگابایت L3 حافظه پنهان CPUهای برگامو این را خواهند داشت نسل چهارم سری EPYC 97X4 تعیین.

در حالی که پردازنده های Genoa-X می توانند تا 96 هسته افزایش پیدا کنند، AMD مقایسه مستقیمی بین 9384X 32 هسته ای در مقابل Intel Xeon Platinum 8462Y+ 32 هسته ای ارائه کرد.

جنوا

Genoa-X نیز در حال حاضر توسط شرکای AMD پیاده سازی شده است. برای اولین بار، مایکروسافت در دسترس بودن عمومی را اعلام کرده است Azure HBv4 و HX نمونه هایی که توسط پردازنده های سری EPYC 9004X با 3D V-Cache تغذیه می شوند.

برگامو

برای گیک ها، یک نگاه فنی به "برگامو" پیکربندی