جنوا-ای،
برگامو همچنین پردازندهای است که بهروزرس، معماری جزئی دارد و دلیل آن این است که AMD میتواند هستههای بیشتری را در هر SoC جمع کند. معماری Zen 4 جنوا اجازه می دهد تا حدا،ر 12 CCD و 96 هسته (با یک CCX 8 هسته ای) در هر سوکت.
به گفته معاون AWS EC2، دیو براون، هنگامی که ما عملکرد پردازندههای نسل چهارم AMD EPYC را با سیستم AWS Nitro ،یب میکنیم، فناوری ابری را برای مشتریان خود به پیش میبریم و به آنها اجازه میدهیم تا با عملکرد بهتر در نمونههای بیشتر آمازون EC2 کارهای بیشتری انجام دهند.
آ،ین اما نه کم اهمیت، به نبرد هوش مصنوعی می رسیم. در ماه ژانویه در جریان نمایشگاه CES 2023، AMD اولین APU مرکز داده جهان را معرفی کرد که اکنون رسماً به ،وان Instinct MI300A. از نظر فنی، این همچنین به ،وان بخشی از نسل چهارم EPYC محسوب میشود، زیرا تراشهای است که دارای سه ،مت CPU Zen 4 به همراه قطعات GPU CDNA 3 است که همراه با فرآیند بستهبندی چیپلتهای سه بعدی AMD بستهبندی شدهاند. MI300A دارای 128 گیگابایت حافظه مش، HBM3 در هر دو CPU و GPU خواهد بود.
بنابراین، چه چیزی جدید است؟ می د،م که Zen 4 CCD جنوا دارای 8 هسته در هر کمپل، و 32 مگابایت حافظه نهان L3 است. با Genoa-X، AMD موارد اضافی را اضافه می کند 64 مگابایت از L3 با استفاده از a چیپلت حافظه 7 نانومتری X3D که Hybrid Bonded به CCD است که مجموعاً به همراه دارد 96 مگابایت L3 در هر CCD. با حدا،ر 12 CCD در هر CPU، Genoa-X می تواند یک بزرگ را پشتیب، کند 1152 مگابایت L3 کش (از 768 مگابایت Milan-X).
با شروع پردازنده های نسل سوم EPYC، AMD شروع به معرفی یک نوع V-Cache سه بعدی از CPU EPYC با هدف عمومی کرد که به طور خاص برای بارهای کاری فنی که به حافظه نهان L3 بیشتری نیاز دارند (مانند دینامیک سیالات مح،اتی، اتوماسیون طراحی الکترونیکی و تحلیل ساختاری) طراحی شده است. اسمش Milan-X بود. و اکنون، نسل چهارم EPYC (جنوا) یک نسخه V-Cache سه بعدی را نیز دریافت خواهد کرد، که به طور عجیبی نامیده می شود. جنوا-ای،. این پردازنده ها دارای سری EPYC 9004X تعیین.
دکتر لیزا سو از AMD نمایشی از شعر هوش مصنوعی مولد در مورد سانفرانسیسکو را نشان داد و ادعا کرد که MI300X اولین تراشه ای است که قادر به اجرای یک مدل هوش مصنوعی زبان بزرگ مانند Falcon-40B با 40 میلیارد پارامتر کاملا در حافظه اش است این امر باعث کاهش میزان GPUهای مورد نیاز برای کارهای مشابه می شود و به ،وان یک موضوع ادامه دار در همه چیزهایی که AMD در این رویداد نشان داد، فضا، مصرف انرژی و TCO را برای مشتریان خود کاهش می دهد.
Genoa-X نیز در حال حاضر توسط شرکای AMD پیاده سازی شده است. برای اولین بار، مایکروسافت در دسترس بودن عمومی را اعلام کرده است Azure HBv4 و HX نمونه هایی که توسط پردازنده های سری EPYC 9004X با 3D V-Cache تغذیه می شوند.
برگامو
جنوا
پاسخ انویدیا به MI300A که در جریان Computex 2023 اعلام شد، این است GH200 Grace-Hopper “Superchip”، که یک برد عظیم است که CPU Grace NVIDIA و Hopper GPU را با هم ،یب می کند. تفاوت این است که این دو جزء مجزا هستند که به حافظه های جداگانه نیاز دارند (DDR5X برای CPU و HBM3 برای GPU) و به NVLink متصل هستند. طراحی چیپلت سه بعدی AMD برای ،یب CPU و GPU به یک تراشه واحد که حافظه فوق سریع HBM3 را به اشتراک می گذارد، طراحی زیباتری دارد.
یکی از مشتریان عمده EPYC AMD، خدمات وب آمازون (AWS)، در حال حاضر نسل بعدی خود را دارد. مح،ات ا،تیک (EC2) M7a نمونه های موجود برای پیش نمایش بر اساس جنوا، گفته می شود که نمونه های EC2 M7a ارائه می شود 50% عملکرد بهتر و 50 درصد پهنای باند حافظه بیشتر (به لطف DDR5) در مقایسه با نمونه های نسل آ، M6a. همچنین پشتیب، از قابلیت های جدید پردازنده مانند AVX3-512، VNNI، و BFloat16.
در حالی که هیچ اعلان ریزمعماری نسل جدیدی در رویداد هفته گذشته ارائه نشد، AMD پردازندههای نسل چهارم سرور سرور EPYC و خطوط شتابدهنده هوش مصنوعی Instinct خود را با محصولات اختصاصی جدید برای مح،ات فنی، مح،ات بومی ابری و شتاب استنتاج هوش مصنوعی توسعه داد تا اساساً مطابقت داشته باشند. هر پردازنده رقیب دیگری را ش،ت دهد.
آپدیت های AMD HPC و AI
در جریان رویداد اخیر مرکز داده و فناوری هوش مصنوعی در سانفرانسیسکو، AMD این واقعیت را تقویت کرد که آنها تنها شرکت ریزپردازندهای هستند که برخلاف رقبای اینتل و انویدیا، که همانطور که مید،م، CPU، GPU و APU برای هر نوع حجم کاری دارند. هر کدام در یکی قوی هستند، اما در دیگری نه، و قطعاً در سومی نه.
منبع: https://www.hardwarezone.com.sg/feature-amd-hpc-ai-superiority-epyc-genoax-bergamo-instinct-mi300x-preview
بیا شروع کنیم با جنوا، AMD پردازنده های نسل چهارم EPYC سری 9004. سری EPYC 9004 که بر اساس ریزمعماری Zen 4 ساخته شده است، بنابراین همتای سرور سری Ryzen 7000 مبتنی بر مصرف کننده AMD است. حالا، اگر منصف باشیم، جنوا قبلاً در نوامبر 2022 راهاندازی شده بود، اگرچه AMD را از ارائه برخی معیارها برای عملکرد و بهرهوری انرژی در اینتل منع نکرد.
اما در یک نقش مع،، AMD اکنون رفته است و MI300A را برای تبدیل شدن به یک شتابدهنده استنتاج هوش مصنوعی تمام GPU به جای یک APU چند منظوره بازسازی کرده است. AMD سه چیپلت Zen 4 را با دو چیپلت CDNA 3 تعویض کرد. نتیجه جدید است MI300X، و این تک تراشه اکنون دارای ویژگی های عظیمی خواهد بود 153 میلیارد ترانزیستور (از 146 میلیارد در حال حاضر چشمگیر در MI300A). مجموع حافظه HBM3 نیز به افزایش یافته است 192 گیگابایت، با 5.2 ترابایت بر ث،ه پهنای باند حافظه در مقایسه، پردازنده گرافیکی مستقل NVIDIA H100 (Hopper) دارای 80 میلیارد ترانزیستور و 80 گیگابایت حافظه HBM3 با پهنای باند 3.35 ترابایت بر ث،ه است.
Instinct MI300X
علاوه بر یک واحد پردازش گرافیکی MI300X، AMD نیز آن را به نمایش گذاشت بستر غریزی، که برای پروژه مح،ات باز (OCP) سازگاری با صنعت Instinct Platform یک خوشه GPU است که به آن می بالد 8 x MI300X GPU و 1.5 ترابایت حافظه HBM3
قطعه دیگری از نسل چهارم CPU های EPYC با نام رمز شناخته می شود برگاموو این مورد برای بارهای کاری مح،اتی Cloud Native، خدمات دیجیتال و برنامه های DevOps طراحی شده است که در آن تراکم و کارایی مح،ات مهم تر است.
AMD فقط مدعی عملکرد بالاتر با Bergamo نیست، بلکه به دلیل چگالی هسته خود، صرفه جویی زیادی در فضا و انرژی دارد و Opex و TCO را برای مشتریان خود به حداقل می رساند. یک رک متشکل از 15 سرور EPYC 9754 (برگامو) عملکردی مشابه سرورهای 43 آمپر ،ارا م، یا 38 سرور اینتل زئون پلاتینیوم دارد.
برگامو اصلاح شده را به کار خواهد گرفت 4c بود معماری که ویژگی های الف 35٪ هسته کوچکتر نسبت به Zen 4. این به AMD اجازه می دهد تا هسته ها را در هر CCD دو برابر کند (با استفاده از ساختار CCX 2x 8 هسته ای). متوجه خواهید شد که تمام عملکردها در نمودار زیر بین Zen 4 و Zen 4c ی،ان باقی می مانند، اما حافظه نهان L3 برای هر هسته نصف شده است. به همین دلیل، هر کدام CCX فقط 16 مگابایت حافظه نهان L3 دارد. با این حال، از آنجایی که اکنون یک CCD شامل دو CCX است، شما از نظر فنی همان 32 مگابایت L3 را در هر CCD دریافت می کنید. با این حال، کل CCD ها نیز در هر سوکت از 12 (جنوا) به 8 (برگامو) کاهش یافته است. این بدان م،است که هر CPU برگامو می تواند تا 128 هسته ای و 256 مگابایت L3 حافظه پنهان CPUهای برگامو این را خواهند داشت نسل چهارم سری EPYC 97X4 تعیین.