کنسرسیوم Ultra Ethernet تشکیل شد، قصد دارد اترنت را برای نیازهای AI و HPC تطبیق دهد

این هفته بنیاد لینو، اعلام کرد که این گروه بر تشکیل یک کنسرسیوم اترنت جدید با تمرکز بر تطبیق و اصلاح فناوری برای بارهای کاری مح،اتی با کارایی بالا نظارت خواهد کرد. کنسرسیوم جدید Ultra Ethernet با حمایت اعضای مؤسس AMD، Arista، Broadcom، Cisco، Eviden، HPE، Intel، Meta و Microsoft، تلاش خواهد کرد تا اترنت را بهبود بخشد تا نیازهای تأخیر و مقیاس‌پذیری پایینی را که سیستم‌های HPC و AI به آن نیاز دارند، برآورده کند – و این گروه می‌گوید فناوری اترنت فعلی کاملاً برای این کار من، نیست.

جاستین هاتارد، معاون اجرایی و مدیر کل HPC و AI در شرکت Hewlett Packard Enterprise می‌گوید: «بارهای کاری هوش مصنوعی مولد ما را م،م می‌کند تا ش،ه‌های خود را برای مقیاس و عملکرد ابررایانه‌ها طراحی کنیم. “اهمیت کنسرسیوم Ultra Ethernet ایجاد یک پشته ارتباطی مبتنی بر اترنت باز، مقیاس‌پذیر و مقرون‌به‌صرفه است که می‌تواند از این حجم‌های کاری با کارایی بالا برای اجرای کارآمد پشتیب، کند. فراگیر بودن و قابلیت همکاری اترنت به مشتریان امکان انتخاب، و کارایی برای رسیدگی به انواع حجم‌های کاری فشرده داده، از جمله شبیه‌سازی مدل‌های آموزشی و شبیه‌سازی هوش مصنوعی را می‌دهد.”

در سطح بالایی، کنسرسیوم جدید Ultra Ethernet به دنبال اصلاح اترنت به روش جراحی است و تنها آن بخش‌ها و قطعات لازم برای دستیابی به اه، خود را بهبود و تغییر می‌دهد. در آغاز، کنسرسیوم به دنبال بهبود لایه‌های نرم‌افزاری و فیزیکی فناوری اترنت است – اما بدون تغییر ساختار اصلی آن برای اطمینان از کارایی هزینه و قابلیت همکاری.

مارک پیپرمستر، مدیر ارشد فناوری AMD در یک گزارش گفت: “ما به ویژه توسط لایه حمل و نقل بهبود یافته UEC تشویق می شویم و معتقدیم که مجموعه ما آماده است تا از آن بهره مند شود.” پست وبلاگ. “UEC امکان تحویل بسته‌ها را در مسیرهای مختلف بدون ایجاد ازدحام یا انسداد سر خط فراهم می‌کند، که به پردازنده‌های ما این امکان را می‌دهد تا با موفقیت داده‌ها را در میان خوشه‌ها با حداقل مشکلات incast یا نیاز به تعادل بار متمرکز به اشتراک بگذارند. در نهایت، UEC امنیت داخلی را برای بارهای کاری هوش مصنوعی و HPC در نظر می‌گیرد و به ،ه خود سرمایه‌های امنیتی رمزگذاری شده را به AMD کمک می‌کند.”

در همین حال، در حال حاضر UEC نمی گوید چه زم، انتظار دارد مشخصات UET را نهایی کند. انتظار می‌رود که این گروه از IEEE که استانداردهای مختلف اترنت را حفظ می‌کند، به دنبال گواهی باشد، بنابراین مجموعه‌ای از حلقه‌های اضافی برای پرش وجود دارد.

­­­­


منبع: https://www.anandtech.com/s،w/18965/ultra-ethernet-consortium-to-adapt-ethernet-for-ai-and-hpc-needs

منبع: بنیاد لینو،، ثبت نام

کنسرسیوم Ultra Ethernet توسط بنیاد لینو، میزب، می شود، اگرچه کار واقعی توسط اعضای آن انجام خواهد شد. بین AMD، Cisco، Intel و سایر بنیانگذاران، این شرکت ها همه یا پردازنده های با کارایی بالا، پردازنده های گرافیکی مح،اتی و زیرساخت ش،ه را برای بارهای کاری AI و HPC طراحی می کنند یا ابررایانه ها یا خوشه هایی را برای برنامه های AI و HPC می سازند، بنابراین تجربه زیادی با فناوری های من، دارند. کار UEC قرار است توسط چهار گروه کاری انجام شود که روی لایه فیزیکی، لایه پیوند، لایه انتقال و لایه نرم افزار کار خواهند کرد.

و در حالی که گروه به صراحت در مورد Ultra Ethernet در رابطه با هیچ فناوری رقیب صحبت نمی کند، اعضای هیئت موسس – یا بهتر است بگوییم، چه ،ی نه یک عضو موسس – می گوید. اه، عملکرد و تمرکز HPC Ultra Ethernet باعث می شود که آن را در رقابت مستقیم با InfiniBand قرار دهد، که برای بیش از یک دهه فناوری ش،ه انتخابی برای ش،ه های کم تاخیر و به س، HPC بوده است. در حالی که NVIDIA توسط انجمن تجاری خود توسعه یافته است، گفته می شود که در مقایسه با ،ید ملانو، در چند سال پیش، نفوذ زیادی بر گروه دارد، و آنها به طور قابل توجهی مرد عجیب و غریب گروه جدید هستند. این شرکت از هر دو Ethernet و InfiniBand در داخل استفاده می کند و از هر دو برای سیستم های مقیاس پذیر DGX SuperPod خود استفاده می کند.

در مورد استانداردهای پیشنهادی Ultra Ethernet، اعضای UEC در حال طراحی نقشه هایی هستند که چگونه فناوری UET آینده را در محصولات خود ادغام کنند.

اولویت اصلی گروه جدید، تعریف و توسعه پروتکل Ultra Ethernet Transport (UET) خواهد بود، پروتکل لایه انتقال جدید برای اترنت که نیازهای هوش مصنوعی و سپس بار کاری HPC را بهتر برطرف می کند.

دکتر ارل جوزف، مدیر اجرایی Hyperion Research، گفت: «بسیاری از کاربران HPC و AI به دلیل ضعف در قابلیت‌های اتصال سیستم، به سختی می‌توانند عملکرد کامل سیستم‌های خود را به دست آورند.

در نهایت، UEC خاطرنشان کرده است که به دنبال اعضای اضافی برای تکمیل گروه است و از سه ماهه چهارم 2023 پذیرش درخواست های عضو جدید را آغاز خواهد کرد. همراه با NVIDIA، چندین غول فناوری دیگر درگیر کارهای AI یا HPC هستند که بخشی از گروه نیستند، بنابراین این بهترین شانس بعدی آنها برای پیوستن به کنسرسیوم خواهد بود.

اه، فنی کنسرسیوم شامل توسعه مشخصات، APIها و کد منبع برای تعریف پروتکل‌ها، رابط‌ها و ساختارهای داده برای ارتباطات Ultra Ethernet است. علاوه بر این، کنسرسیوم قصد دارد پروتکل های پیوند و انتقال موجود را به روز کند و مک،سم های تله متری، سیگنالینگ، امنیت و تراکم جدید ایجاد کند تا نیازهای خوشه های بزرگ هوش مصنوعی و HPC را بهتر برطرف کند. در همین حال، از آنجایی که بارهای کاری AI و HPC دارای تعدادی تفاوت هستند، UET پروفایل های جداگانه ای برای استقرار من، خواهد داشت.

مطمئناً اترنت یکی از فراگیرترین فناوری‌های موجود در سراسر جهان است، اما نیازهای خوشه‌های هوش مصنوعی و HPC به قدری سریع در حال رشد است که این فناوری در آینده به پایان خواهد رسید. اندازه مدل های بزرگ هوش مصنوعی به سرعت در حال افزایش است. GPT-3 با 175 میلیارد پارامتر در سال 2020 آموزش داده شد. امروزه گفته می شود که GPT-4 در حال حاضر یک تریلیون پارامتر را در خود جای داده است. مدل‌هایی با تعداد پارامترهای بیشتر به خوشه‌های بزرگ‌تری نیاز دارند و سپس این خوشه‌ها پیام‌های بزرگ‌تری را از طریق ش،ه ارسال می‌کنند. در نتیجه، هرچه پهنای باند بالاتر و تأخیر کوتاه‌تر این ویژگی ش،ه باشد، خوشه می‌تواند کارآمدتر عمل کند.