این هفته بنیاد لینو، اعلام کرد که این گروه بر تشکیل یک کنسرسیوم اترنت جدید با تمرکز بر تطبیق و اصلاح فناوری برای بارهای کاری مح،اتی با کارایی بالا نظارت خواهد کرد. کنسرسیوم جدید Ultra Ethernet با حمایت اعضای مؤسس AMD، Arista، Broadcom، Cisco، Eviden، HPE، Intel، Meta و Microsoft، تلاش خواهد کرد تا اترنت را بهبود بخشد تا نیازهای تأخیر و مقیاسپذیری پایینی را که سیستمهای HPC و AI به آن نیاز دارند، برآورده کند – و این گروه میگوید فناوری اترنت فعلی کاملاً برای این کار من، نیست.
جاستین هاتارد، معاون اجرایی و مدیر کل HPC و AI در شرکت Hewlett Packard Enterprise میگوید: «بارهای کاری هوش مصنوعی مولد ما را م،م میکند تا ش،ههای خود را برای مقیاس و عملکرد ابررایانهها طراحی کنیم. “اهمیت کنسرسیوم Ultra Ethernet ایجاد یک پشته ارتباطی مبتنی بر اترنت باز، مقیاسپذیر و مقرونبهصرفه است که میتواند از این حجمهای کاری با کارایی بالا برای اجرای کارآمد پشتیب، کند. فراگیر بودن و قابلیت همکاری اترنت به مشتریان امکان انتخاب، و کارایی برای رسیدگی به انواع حجمهای کاری فشرده داده، از جمله شبیهسازی مدلهای آموزشی و شبیهسازی هوش مصنوعی را میدهد.”
در سطح بالایی، کنسرسیوم جدید Ultra Ethernet به دنبال اصلاح اترنت به روش جراحی است و تنها آن بخشها و قطعات لازم برای دستیابی به اه، خود را بهبود و تغییر میدهد. در آغاز، کنسرسیوم به دنبال بهبود لایههای نرمافزاری و فیزیکی فناوری اترنت است – اما بدون تغییر ساختار اصلی آن برای اطمینان از کارایی هزینه و قابلیت همکاری.
مارک پیپرمستر، مدیر ارشد فناوری AMD در یک گزارش گفت: “ما به ویژه توسط لایه حمل و نقل بهبود یافته UEC تشویق می شویم و معتقدیم که مجموعه ما آماده است تا از آن بهره مند شود.” پست وبلاگ. “UEC امکان تحویل بستهها را در مسیرهای مختلف بدون ایجاد ازدحام یا انسداد سر خط فراهم میکند، که به پردازندههای ما این امکان را میدهد تا با موفقیت دادهها را در میان خوشهها با حداقل مشکلات incast یا نیاز به تعادل بار متمرکز به اشتراک بگذارند. در نهایت، UEC امنیت داخلی را برای بارهای کاری هوش مصنوعی و HPC در نظر میگیرد و به ،ه خود سرمایههای امنیتی رمزگذاری شده را به AMD کمک میکند.”
در همین حال، در حال حاضر UEC نمی گوید چه زم، انتظار دارد مشخصات UET را نهایی کند. انتظار میرود که این گروه از IEEE که استانداردهای مختلف اترنت را حفظ میکند، به دنبال گواهی باشد، بنابراین مجموعهای از حلقههای اضافی برای پرش وجود دارد.
منبع: https://www.anandtech.com/s،w/18965/ultra-ethernet-consortium-to-adapt-ethernet-for-ai-and-hpc-needs
منبع: بنیاد لینو،، ثبت نام
کنسرسیوم Ultra Ethernet توسط بنیاد لینو، میزب، می شود، اگرچه کار واقعی توسط اعضای آن انجام خواهد شد. بین AMD، Cisco، Intel و سایر بنیانگذاران، این شرکت ها همه یا پردازنده های با کارایی بالا، پردازنده های گرافیکی مح،اتی و زیرساخت ش،ه را برای بارهای کاری AI و HPC طراحی می کنند یا ابررایانه ها یا خوشه هایی را برای برنامه های AI و HPC می سازند، بنابراین تجربه زیادی با فناوری های من، دارند. کار UEC قرار است توسط چهار گروه کاری انجام شود که روی لایه فیزیکی، لایه پیوند، لایه انتقال و لایه نرم افزار کار خواهند کرد.
و در حالی که گروه به صراحت در مورد Ultra Ethernet در رابطه با هیچ فناوری رقیب صحبت نمی کند، اعضای هیئت موسس – یا بهتر است بگوییم، چه ،ی نه یک عضو موسس – می گوید. اه، عملکرد و تمرکز HPC Ultra Ethernet باعث می شود که آن را در رقابت مستقیم با InfiniBand قرار دهد، که برای بیش از یک دهه فناوری ش،ه انتخابی برای ش،ه های کم تاخیر و به س، HPC بوده است. در حالی که NVIDIA توسط انجمن تجاری خود توسعه یافته است، گفته می شود که در مقایسه با ،ید ملانو، در چند سال پیش، نفوذ زیادی بر گروه دارد، و آنها به طور قابل توجهی مرد عجیب و غریب گروه جدید هستند. این شرکت از هر دو Ethernet و InfiniBand در داخل استفاده می کند و از هر دو برای سیستم های مقیاس پذیر DGX SuperPod خود استفاده می کند.
در مورد استانداردهای پیشنهادی Ultra Ethernet، اعضای UEC در حال طراحی نقشه هایی هستند که چگونه فناوری UET آینده را در محصولات خود ادغام کنند.
اولویت اصلی گروه جدید، تعریف و توسعه پروتکل Ultra Ethernet Transport (UET) خواهد بود، پروتکل لایه انتقال جدید برای اترنت که نیازهای هوش مصنوعی و سپس بار کاری HPC را بهتر برطرف می کند.
دکتر ارل جوزف، مدیر اجرایی Hyperion Research، گفت: «بسیاری از کاربران HPC و AI به دلیل ضعف در قابلیتهای اتصال سیستم، به سختی میتوانند عملکرد کامل سیستمهای خود را به دست آورند.
در نهایت، UEC خاطرنشان کرده است که به دنبال اعضای اضافی برای تکمیل گروه است و از سه ماهه چهارم 2023 پذیرش درخواست های عضو جدید را آغاز خواهد کرد. همراه با NVIDIA، چندین غول فناوری دیگر درگیر کارهای AI یا HPC هستند که بخشی از گروه نیستند، بنابراین این بهترین شانس بعدی آنها برای پیوستن به کنسرسیوم خواهد بود.
اه، فنی کنسرسیوم شامل توسعه مشخصات، APIها و کد منبع برای تعریف پروتکلها، رابطها و ساختارهای داده برای ارتباطات Ultra Ethernet است. علاوه بر این، کنسرسیوم قصد دارد پروتکل های پیوند و انتقال موجود را به روز کند و مک،سم های تله متری، سیگنالینگ، امنیت و تراکم جدید ایجاد کند تا نیازهای خوشه های بزرگ هوش مصنوعی و HPC را بهتر برطرف کند. در همین حال، از آنجایی که بارهای کاری AI و HPC دارای تعدادی تفاوت هستند، UET پروفایل های جداگانه ای برای استقرار من، خواهد داشت.
مطمئناً اترنت یکی از فراگیرترین فناوریهای موجود در سراسر جهان است، اما نیازهای خوشههای هوش مصنوعی و HPC به قدری سریع در حال رشد است که این فناوری در آینده به پایان خواهد رسید. اندازه مدل های بزرگ هوش مصنوعی به سرعت در حال افزایش است. GPT-3 با 175 میلیارد پارامتر در سال 2020 آموزش داده شد. امروزه گفته می شود که GPT-4 در حال حاضر یک تریلیون پارامتر را در خود جای داده است. مدلهایی با تعداد پارامترهای بیشتر به خوشههای بزرگتری نیاز دارند و سپس این خوشهها پیامهای بزرگتری را از طریق ش،ه ارسال میکنند. در نتیجه، هرچه پهنای باند بالاتر و تأخیر کوتاهتر این ویژگی ش،ه باشد، خوشه میتواند کارآمدتر عمل کند.