با توجه به این طرح، بخش عمده ای از عملکرد مح،اتی Stampede3 توسط CPU ها تامین می شود. این امر باعث میشود Stampede3 در این روزگار کمی نادر باشد، زیرا ا،ر سیستمهای با کارایی بالا مبتنی بر GPU هستند، و Stampede3 را به ،وان یکی از آ،ین ابررایانههایی که تقریباً تنها به CPUهای همه منظوره متکی است، باقی میگذارد.
نسل سوم Stampede c،er که توسط Dell ساخته خواهد شد، دارای 560 گره مجهز به پردازنده های Xeon CPU Max نسل Sapphire Rapids اینتل است که هر کدام 56 هسته CPU و 64 گیگابایت حافظه داخلی HBM2E را ارائه می دهند. با کمال تعجب، TACC قرار است این گرهها را در حالت فقط HBM کار کند، بنابراین هیچ DRAM اضافی به گرههای CPU متصل نخواهد شد – تمام حافظه آنها از پشتههای HBM روی تراشه میآید.
و در حالی که خوشه فعلی عمدتاً بر عملکرد CPU متمرکز است، TACC همچنین از پردازندههای گرافیکی اینتل در آ،ین اصلاح Stampede برای بررسی نحوه ،یب تعداد بیشتری از GPU در نسخههای آینده سیستم استفاده خواهد کرد. در حال حاضر، بیشتر وظایف هوش مصنوعی TACC بر روی سیستمهای Lone Star اجرا میشوند که توسط صدها پردازنده گرافیکی مح،اتی Nvidia A100 تامین میشود. بنابراین هدف این سازمان بررسی این است که آیا می توان بخشی از این حجم کاری را به Ponte V،o اینتل منتقل کرد یا خیر.
دن استانزیونه، مدیر اجرایی TACC، گفت: ما قصد داریم یک سیستم کوچک با قابلیت اکتشافی با استفاده از اینتل پونته وکیو قرار دهیم. ما هنوز در حال مذاکره هستیم که دقیقاً چه مقدار از آن خواهد بود، اما میتوانم بگویم حداقل 40 گره و حدا،ر صد یا بیشتر. […] ما فقط چند قفسه از پونته وکیو را در آنجا قرار می دهیم تا ببینیم مردم چگونه با آن کار می کنند.”
Stampede3 از فناوری Omni-Path Fabric با سرعت 400 گیگابیت بر ث،ه استفاده می کند که پهنای باند ، پلن 24 ترابایت بر ث،ه را امکان پذیر می کند. این راهاندازی به دستگاه اجازه میدهد تا تأخیرها را بهطور مؤثر مقیاسبندی و به حداقل برساند، و آن را برای کاربردهای مختلفی که نیاز به شبیهسازی دارند، من، میسازد.
TACC همچنین قصد دارد نودهایی را از نسخه قبلی Stampede2 که بر اساس نسل قدیمی CPUهای Xeon Scalable بودند، دوباره ،یب کند. این ادغام ظرفیت Stampede3 را برای برنامه های کاربردی با حافظه بالا، مح،ات با توان پردازشی بالا، بارهای کاری تعاملی و سایر برنامه های نسل قبلی افزایش می دهد. در مجموع، سیستم ابررایانه جدید دارای 1858 گره مح،اتی با بیش از 140000 هسته، بیش از 330 ترابایت رم، ظرفیت ذخیره سازی جدید 13 PB و حدا،ر عملکرد نزدیک به 10 PetaFLOPS خواهد بود.
با این مشخصات، انتظار می رود Stampede3 حدا،ر عملکرد تقریباً 4 FP64 PetaFLOPS را داشته باشد، در حالی که نزدیک به 63000 هسته همه منظوره را ارائه می دهد. علاوه بر این، TACC همچنین قصد دارد 10 سرور Dell PowerEdge XE9640 را با 40 پردازنده گرافیکی مح،اتی Intel Data Center GPU Max برای بارهای کاری هوش مصنوعی و یادگیری ماشین نصب کند.
مرکز مح،ات پیشرفته تگزاس (TACC) جدیدترین خود را معرفی کرد ازدحام ابر رایانه برای پروژه های تحقیقاتی علوم باز، Stampede3. TACC پیش بینی می کند که Stampede3 در پاییز امسال آنلاین شود و عملکرد کامل خود را در اوایل سال 2024 ارائه دهد. این ابررایانه جزء حیاتی ا،یستم ابررایانه علمی ACCESS بنیاد ملی علوم ایالات متحده (NSF) خواهد بود و پیش بینی می شود که از سال 2024 تا 2029 به جامعه علوم باز خدمت کند.
منبع: https://www.anandtech.com/s،w/18974/taccs-stampede3-uses-intels-xeon-max-with-hbm2e-and-ponte-v،o