36 گیگابیت بر ثانیه با رمزگذاری PAM3

در حالی که GDDR7 وعده افزایش عملکرد عمده بدون افزایش مصرف برق را می دهد، شاید بزرگترین سوال مخاطبان فنی این باشد. چه زم، نوع جدید حافظه قرار است در دسترس قرار گیرد. بدون تعهد سخت JEDEC، بازه زم، خاصی برای انتظار انتشار GDDR7 وجود ندارد. اما با توجه به کار انجام شده و انتشار یک سیستم تأیید از Cadence، انتظار اینکه GDDR7 همراه با نسل بعدی پردازنده‌های گرافیکی AMD و NVIDIA وارد صحنه شود، غیرمنطقی نخواهد بود. در نظر داشته باشید که این دو شرکت تمایل دارند معماری‌های GPU جدید را در یک دوره زم، تقریباً دو ساله معرفی کنند، این بدان م،است که در اوا، سال 2024 شاهد نمایش GDDR7 در دستگاه‌ها خواهیم بود.

البته، با توجه به اینکه این روزها شرکت‌های هوش مصنوعی و HPC زیادی روی محصولاتی با پهنای باند کار می‌کنند، ممکن است یکی دو تا از آن‌ها راه‌حل‌هایی را با تکیه بر حافظه GDDR7 زودتر منتشر کنند. اما استفاده انبوه از GDDR7 تقریباً به طور قطع با رمپ بردهای گرافیکی نسل بعدی AMD و NVIDIA همزمان خواهد شد.


منبع: https://www.anandtech.com/s،w/18759/cadence-derlivers-tech-details-on-gddr7-36gbps-pam3-encoding

با GDDR6X، Micron و NVIDIA جایگزین کدگذاری سنتی بدون بازگشت به صفر (NRZ/PAM2) با کدگذاری م،اسیون دامنه پالس چهار سطحی (PAM4) شدند. PAM4 با استفاده از چهار سطح سیگنال، نرخ انتقال داده موثر را به دو بیت داده در هر چرخه افزایش می دهد، بنابراین نرخ انتقال داده بالاتری را امکان پذیر می کند. در عمل، از آنجایی که GDDR6X زم، که در حالت PAM4 کار می‌کند، دارای طول انفجاری 8 بایت (BL8) است، در همان نرخ داده (یا بهتر بگوییم، نرخ سیگنالینگ) سریع‌تر از GDDR6 نیست، بلکه به گونه‌ای طراحی شده است که بتواند به نرخ داده بالاتر از آنچه GDDR6 می تواند به راحتی انجام دهد.

م،اسیون دامنه پالس چهار سطحی نسبت به NRZ در مورد از دست دادن سیگنال مزیت دارد. از آنجایی که PAM4 به نیمی از نرخ باود سیگنالینگ NRZ برای یک نرخ داده معین نیاز دارد، تلفات سیگنال به طور قابل توجهی کاهش می یابد. از آنجایی که سیگنال‌های فرکانس بالاتر با عبور از سیم/ردی سریع‌تر از بین می‌روند – و ردیابی‌های حافظه بر اساس استانداردهای منطق دیجیتال فواصل نسبتاً طول، دارند – توانایی کار در یک گذرگاه با فرکانس پایین‌تر، در نهایت برخی از مسیریابی مهندسی و ردیابی را آسان‌تر می‌کند. امکان نرخ داده بالاتر

و البته، زیرسیستم های حافظه GDDR6X به یک کنتر، حافظه کاملاً جدید و همچنین یک رابط فیزیکی کاملاً جدید (PHY) هم برای پردازنده ها و هم برای تراشه های حافظه نیاز دارند. این پیاده‌سازی‌های پیچیده تا حد زیادی دلایل اصلی این هستند که چرا کدگذاری چهار سطحی، تا همین اوا،، تقریباً به طور انحصاری برای ش،ه‌های مرکز داده پیشرفته استفاده می‌شد، جایی که حاشیه‌ها برای پشتیب، از چنین فناوری پیشرفته‌ای وجود دارد.

GDDR7: رمزگذاری PAM3 برای حدا،ر سرعت 36 گیگابیت بر ث،ه در پین

IP تأیید همچنین از حالت های مختلف تزریق خطا در چندین زمینه تراکنش ها در طول انتقال داده های آرایه و آموزش رابط پشتیب، می کند. علاوه بر این، راه‌حل اشکال‌زدای شکل موج برای تجسم تراکنش‌ها بر روی نمایشگرهای شکل موج برای اشکال‌زدایی و تأیید سریع‌تر ارائه می‌شود.

وقتی سامسونگ مس،ه کرد توسعه مداوم حافظه GDDR7 در اکتبر گذشته، این شرکت هیچ جزئیات فنی دیگری از مشخصات ورودی را فاش نکرد. اما Cadence اخیرا معرفی کرد اولین راه حل تأیید صنعت برای حافظه GDDR7، و در این فرآیند جزئیات بیشتری را در مورد این فناوری فاش کرده است. همانطور که مشخص است، حافظه GDDR7 از PAM3 و همچنین سیگنال‌دهی NRZ استفاده می‌کند و از تعدادی ویژگی دیگر پشتیب، می‌کند، با هدف رسیدن به نرخ داده تا 36 گیگابیت بر ث،ه در هر پین.

یک درس کوتاه تاریخ GDDR

در بی،ه Cadence آمده است: «با عرضه اولیه Cadence GDDR7 VIP به بازار، کاربران اولیه می‌توانند فوراً با آ،ین مشخصات کار را شروع کنند و از انطباق با استاندارد و دستیابی به سریع‌ترین مسیر برای بسته شدن تأیید IP و SoC اطمینان حاصل کنند.»

چه زم، GDDR7 فرود می آید؟

PAM3 فناوری است که در آن خط داده می تواند یک -1، یک 0 یا یک +1 را حمل کند. کاری که سیستم انجام می دهد این است که در واقع دو ارسال PAM3 را در یک سیگنال داده 3 بیتی ،یب می کند، مانند 000 یک -1 و به دنبال آن یک -1 است. این پیچیده می شود، بنابراین ج،ی در اینجا آمده است:















رمزگذاری PAM3
AnandTech انتقال. رساندن
1
انتقال. رساندن
2
000 -1 -1
001 -1 0
010 -1 1
011 0 -1
100 0 1
101 1 -1
110 1 0
111 1 1
استفاده نشده 0 0

در حالی که JEDEC مشخصات GDDR7 را به طور رسمی منتشر نکرده است، این آ،ین اطلاعات فنی در زم، است که Cadence راه حل تأیید خود را برای دستگاه های حافظه GDDR7 راه اندازی کرده است. راه حل آنها به طور کامل از شبیه سازی PAM3 توسط یک نمایش اعداد واقعی پشتیب، می کند، از گذرگاه باینری، مدل سازی قدرت و مدل سازی اعداد واقعی پشتیب، می کند.



از Teledyne LeCroy در YouTube

علاوه بر این، زیر سیستم های حافظه GDDR7 قادر خواهند بود دو دستور مستقل را به صورت موازی صادر کنند. به ،وان مثال، بانک X را می توان با صدور فرمان Refresh per bank در CA به روز کرد[2:0]، در حالی که بانک Y را می توان با صدور دستور خواندن در CA خواند[4:3] همزمان. همچنین، GDDR7 از حالت آموزش داده ثبت تغییر بازخورد خطی (LFSR) برای تعیین سطوح ولتاژ و زمان‌بندی من، برای اطمینان از انتقال داده‌ها پشتیب، می‌کند. در این حالت، میزبان هر چشم فردی (اتصال) را ردیابی می کند، که به آن اجازه می دهد ولتاژهای من، را برای بهینه سازی بهتر مصرف برق اعمال کند.

و برای ،، که امتیاز را حفظ می کنند، این در واقع دومین فناوری مصرف کننده عمده ای است که ما شاهد معرفی آن هستیم که از PAM3 استفاده می کند. USB4 v2 (معروف به USB 80Gbps) نیز به دلایل فنی مشابه از PAM3 استفاده می کند. برای نقل قول از پوشش اولیه ما در سال 2021:

در سطح بالایی، تکامل حافظه GDDR در سال‌های اخیر نسبتاً ساده بوده است: تکرارهای حافظه جدیدتر نرخ سیگنال‌دهی را افزایش می‌دهد، اندازه انفجار را افزایش می‌دهد تا با این نرخ‌های سیگنال‌دهی همگام شود، و استفاده از کانال را بهبود می‌بخشد. اما هیچ یک از اینها به طور قابل توجهی ساعت داخلی سلول های حافظه را افزایش نداد. به ،وان مثال، GDDR5X و سپس GDDR6 اندازه انفجار خود را به 16 بایت افزایش دادند و سپس به جزئیات دسترسی 32 بایتی دو کاناله روی آوردند. اگرچه در هر نسل از فناوری بدون چالش نیست، در نهایت بازیگران صنعت توانسته‌اند فرکانس گذرگاه حافظه را با هر نسخه از GDDR افزایش دهند تا افزایش عملکرد را حفظ کنند.

پس در PAM3 چه اتفاقی می افتد؟

معامله این است که سیگنالینگ PAM4 به طور کلی به نویز تصادفی و القایی حساس تر است. در ازای سیگنال فرکانس پایین تر، باید بتو،د دو برابر بیشتر حالت ها را به درستی شناسایی کنید. در عمل، این منجر به نرخ خطای بیت بالاتر در فرکانس معین می شود. برای کاهش BER، ی،ان سازی در انتهای Rx و پیش جبران در انتهای Tx باید اجرا شود که مصرف برق را افزایش می دهد. و در حالی که در حافظه GDDR6X استفاده نمی شود، در فرکانس های بالاتر (به ،وان مثال PCIe 6.0)، تصحیح خطای جلو (FEC) نیز یک نیاز عملی است.

همانطور که از نام آن پیداست، PAM3 چیزی است که بین NRZ/PAM2 و PAM4 قرار می گیرد و از سیگنال م،اسیون دامنه پالس سه سطحی (-1، 0، +1) استفاده می کند که به آن اجازه می دهد 1.5 بیت در هر چرخه (یا به عبارت بهتر 3 بیت بیش از حد) ارسال کند. دو چرخه). PAM3 نرخ انتقال داده در هر چرخه بالاتری نسبت به NRZ ارائه می‌کند – نیاز به حرکت به فرکانس‌های گذرگاه حافظه بالاتر را کاهش می‌دهد و از دست دادن سیگنال با چالش‌هایی همراه است – در حالی که نیاز به نسبت سیگنال به نویز کمتری نسبت به PAM4 دارد. به طور کلی، GDDR7 عملکرد بالاتری نسبت به GDDR6 و همچنین مصرف انرژی و هزینه های پیاده سازی کمتر نسبت به GDDR6X را نوید می دهد.

اما حتی افزایش “ساده” فرکانس به طور فزاینده ای چندان ساده نیست. و این صنعت را به دنبال راه‌حل‌هایی غیر از افزایش ساعت‌ها سوق داده است.

با این اوصاف، باید دید که یک زیرسیستم حافظه 256 بیتی با نرخ انتقال داده 36 گیگابیت بر ث،ه که سامسونگ وعده داده است، چقدر انرژی مصرف خواهد کرد. خود مشخصات GDDR7 هنوز تایید نشده است، و خود سخت‌افزار هنوز در حال ساخت است (که ابزارهایی مانند Cadence وارد می‌شوند). اما با توجه به اینکه برنامه‌های کاربردی برای هوش مصنوعی، HPC و گرافیک چقدر پهنای باند دارند، این پهنای باند همیشه مورد استقبال قرار خواهد گرفت.

بهینه سازی راندمان و مصرف برق

علاوه بر افزایش توان، انتظار می‌رود که GDDR7 چندین راه برای بهینه‌سازی کارایی حافظه و مصرف انرژی داشته باشد. به طور خاص، GDDR7 از چهار حالت مختلف ساعت خواندن (RCK) پشتیب، می‌کند تا فقط در صورت نیاز آن را فعال کند:

  • همیشه در حال اجرا: همیشه در حال اجرا است و در حالت خواب متوقف می شود.
  • غیرفعال ،: اجرا را متوقف می کند.
  • با دستور شروع RCK شروع کنید: میزبان می‌تواند با صدور دستور RCK S، قبل از خواندن داده‌ها، RCK را راه‌اندازی کند و در صورت نیاز از دستور توقف RCK متوقف شود.
  • با خواندن شروع کنید: زم، که DRAM هر فرم، را که شامل خواندن داده ها می شود دریافت می کند، RCK به طور خودکار شروع به اجرا می کند. با استفاده از دستور RCK Stop می توان آن را متوقف کرد.

در نهایت، GDDR7 می‌تواند بین کدگذاری PAM3 و رمزگذاری NRZ بر اساس نیازهای پهنای باند جابه‌جا شود. در سناریوهای با پهنای باند بالا، PAM3 استفاده خواهد شد، در حالی که در سناریوهای با پهنای باند پایین، کنترل‌کننده‌های حافظه و حافظه می‌توانند به NRZ کارآمدتر انرژی تغییر کنند.

Cadence اولین راه حل تأیید GDDR7 را ارائه می دهد

با توجه به معاوضه های ذکر شده در بالا در مورد سیگنالینگ PAM4 یا سیگنالینگ NRZ، معلوم می شود که اعضای JEDEC پشت استاندارد حافظه GDDR7 در عوض موضعی شبیه به سازش دارند. به جای استفاده از PAM4، حافظه GDDR7 قرار است از رمزگذاری PAM3 برای انتقال با سرعت بالا استفاده کند.

وقتی NRZ را با PAM3 و PAM4 مقایسه می کنیم، می بینیم که نرخ انتقال داده برای PAM3 در وسط NRZ و PAM4 است. دلیل استفاده از PAM3 در این مورد، دستیابی به پهنای باند بالاتر بدون محدودیت‌های اضافی است که PAM4 برای فعال ، نیاز دارد.









NRZ در مقابل PAM-3 در مقابل PAM4
AnandTech بیت ها چرخه ها بیت پر
چرخه
NRZ 1 1 1
PAM-3 3 2 1.5
PAM-4 2 1 2