در حالی که GDDR7 وعده افزایش عملکرد عمده بدون افزایش مصرف برق را می دهد، شاید بزرگترین سوال مخاطبان فنی این باشد. چه زم، نوع جدید حافظه قرار است در دسترس قرار گیرد. بدون تعهد سخت JEDEC، بازه زم، خاصی برای انتظار انتشار GDDR7 وجود ندارد. اما با توجه به کار انجام شده و انتشار یک سیستم تأیید از Cadence، انتظار اینکه GDDR7 همراه با نسل بعدی پردازندههای گرافیکی AMD و NVIDIA وارد صحنه شود، غیرمنطقی نخواهد بود. در نظر داشته باشید که این دو شرکت تمایل دارند معماریهای GPU جدید را در یک دوره زم، تقریباً دو ساله معرفی کنند، این بدان م،است که در اوا، سال 2024 شاهد نمایش GDDR7 در دستگاهها خواهیم بود.
البته، با توجه به اینکه این روزها شرکتهای هوش مصنوعی و HPC زیادی روی محصولاتی با پهنای باند کار میکنند، ممکن است یکی دو تا از آنها راهحلهایی را با تکیه بر حافظه GDDR7 زودتر منتشر کنند. اما استفاده انبوه از GDDR7 تقریباً به طور قطع با رمپ بردهای گرافیکی نسل بعدی AMD و NVIDIA همزمان خواهد شد.
منبع: https://www.anandtech.com/s،w/18759/cadence-derlivers-tech-details-on-gddr7-36gbps-pam3-encoding
با GDDR6X، Micron و NVIDIA جایگزین کدگذاری سنتی بدون بازگشت به صفر (NRZ/PAM2) با کدگذاری م،اسیون دامنه پالس چهار سطحی (PAM4) شدند. PAM4 با استفاده از چهار سطح سیگنال، نرخ انتقال داده موثر را به دو بیت داده در هر چرخه افزایش می دهد، بنابراین نرخ انتقال داده بالاتری را امکان پذیر می کند. در عمل، از آنجایی که GDDR6X زم، که در حالت PAM4 کار میکند، دارای طول انفجاری 8 بایت (BL8) است، در همان نرخ داده (یا بهتر بگوییم، نرخ سیگنالینگ) سریعتر از GDDR6 نیست، بلکه به گونهای طراحی شده است که بتواند به نرخ داده بالاتر از آنچه GDDR6 می تواند به راحتی انجام دهد.
م،اسیون دامنه پالس چهار سطحی نسبت به NRZ در مورد از دست دادن سیگنال مزیت دارد. از آنجایی که PAM4 به نیمی از نرخ باود سیگنالینگ NRZ برای یک نرخ داده معین نیاز دارد، تلفات سیگنال به طور قابل توجهی کاهش می یابد. از آنجایی که سیگنالهای فرکانس بالاتر با عبور از سیم/ردی سریعتر از بین میروند – و ردیابیهای حافظه بر اساس استانداردهای منطق دیجیتال فواصل نسبتاً طول، دارند – توانایی کار در یک گذرگاه با فرکانس پایینتر، در نهایت برخی از مسیریابی مهندسی و ردیابی را آسانتر میکند. امکان نرخ داده بالاتر
و البته، زیرسیستم های حافظه GDDR6X به یک کنتر، حافظه کاملاً جدید و همچنین یک رابط فیزیکی کاملاً جدید (PHY) هم برای پردازنده ها و هم برای تراشه های حافظه نیاز دارند. این پیادهسازیهای پیچیده تا حد زیادی دلایل اصلی این هستند که چرا کدگذاری چهار سطحی، تا همین اوا،، تقریباً به طور انحصاری برای ش،ههای مرکز داده پیشرفته استفاده میشد، جایی که حاشیهها برای پشتیب، از چنین فناوری پیشرفتهای وجود دارد.
GDDR7: رمزگذاری PAM3 برای حدا،ر سرعت 36 گیگابیت بر ث،ه در پین
IP تأیید همچنین از حالت های مختلف تزریق خطا در چندین زمینه تراکنش ها در طول انتقال داده های آرایه و آموزش رابط پشتیب، می کند. علاوه بر این، راهحل اشکالزدای شکل موج برای تجسم تراکنشها بر روی نمایشگرهای شکل موج برای اشکالزدایی و تأیید سریعتر ارائه میشود.
وقتی سامسونگ مس،ه کرد توسعه مداوم حافظه GDDR7 در اکتبر گذشته، این شرکت هیچ جزئیات فنی دیگری از مشخصات ورودی را فاش نکرد. اما Cadence اخیرا معرفی کرد اولین راه حل تأیید صنعت برای حافظه GDDR7، و در این فرآیند جزئیات بیشتری را در مورد این فناوری فاش کرده است. همانطور که مشخص است، حافظه GDDR7 از PAM3 و همچنین سیگنالدهی NRZ استفاده میکند و از تعدادی ویژگی دیگر پشتیب، میکند، با هدف رسیدن به نرخ داده تا 36 گیگابیت بر ث،ه در هر پین.
یک درس کوتاه تاریخ GDDR
در بی،ه Cadence آمده است: «با عرضه اولیه Cadence GDDR7 VIP به بازار، کاربران اولیه میتوانند فوراً با آ،ین مشخصات کار را شروع کنند و از انطباق با استاندارد و دستیابی به سریعترین مسیر برای بسته شدن تأیید IP و SoC اطمینان حاصل کنند.»
چه زم، GDDR7 فرود می آید؟
PAM3 فناوری است که در آن خط داده می تواند یک -1، یک 0 یا یک +1 را حمل کند. کاری که سیستم انجام می دهد این است که در واقع دو ارسال PAM3 را در یک سیگنال داده 3 بیتی ،یب می کند، مانند 000 یک -1 و به دنبال آن یک -1 است. این پیچیده می شود، بنابراین ج،ی در اینجا آمده است:
رمزگذاری PAM3 |
AnandTech |
انتقال. رساندن 1 |
انتقال. رساندن 2 |
000 |
-1 |
-1 |
001 |
-1 |
0 |
010 |
-1 |
1 |
011 |
0 |
-1 |
100 |
0 |
1 |
101 |
1 |
-1 |
110 |
1 |
0 |
111 |
1 |
1 |
استفاده نشده |
0 |
0 |
در حالی که JEDEC مشخصات GDDR7 را به طور رسمی منتشر نکرده است، این آ،ین اطلاعات فنی در زم، است که Cadence راه حل تأیید خود را برای دستگاه های حافظه GDDR7 راه اندازی کرده است. راه حل آنها به طور کامل از شبیه سازی PAM3 توسط یک نمایش اعداد واقعی پشتیب، می کند، از گذرگاه باینری، مدل سازی قدرت و مدل سازی اعداد واقعی پشتیب، می کند.
از Teledyne LeCroy در YouTube
علاوه بر این، زیر سیستم های حافظه GDDR7 قادر خواهند بود دو دستور مستقل را به صورت موازی صادر کنند. به ،وان مثال، بانک X را می توان با صدور فرمان Refresh per bank در CA به روز کرد[2:0]، در حالی که بانک Y را می توان با صدور دستور خواندن در CA خواند[4:3] همزمان. همچنین، GDDR7 از حالت آموزش داده ثبت تغییر بازخورد خطی (LFSR) برای تعیین سطوح ولتاژ و زمانبندی من، برای اطمینان از انتقال دادهها پشتیب، میکند. در این حالت، میزبان هر چشم فردی (اتصال) را ردیابی می کند، که به آن اجازه می دهد ولتاژهای من، را برای بهینه سازی بهتر مصرف برق اعمال کند.
و برای ،، که امتیاز را حفظ می کنند، این در واقع دومین فناوری مصرف کننده عمده ای است که ما شاهد معرفی آن هستیم که از PAM3 استفاده می کند. USB4 v2 (معروف به USB 80Gbps) نیز به دلایل فنی مشابه از PAM3 استفاده می کند. برای نقل قول از پوشش اولیه ما در سال 2021:
در سطح بالایی، تکامل حافظه GDDR در سالهای اخیر نسبتاً ساده بوده است: تکرارهای حافظه جدیدتر نرخ سیگنالدهی را افزایش میدهد، اندازه انفجار را افزایش میدهد تا با این نرخهای سیگنالدهی همگام شود، و استفاده از کانال را بهبود میبخشد. اما هیچ یک از اینها به طور قابل توجهی ساعت داخلی سلول های حافظه را افزایش نداد. به ،وان مثال، GDDR5X و سپس GDDR6 اندازه انفجار خود را به 16 بایت افزایش دادند و سپس به جزئیات دسترسی 32 بایتی دو کاناله روی آوردند. اگرچه در هر نسل از فناوری بدون چالش نیست، در نهایت بازیگران صنعت توانستهاند فرکانس گذرگاه حافظه را با هر نسخه از GDDR افزایش دهند تا افزایش عملکرد را حفظ کنند.
پس در PAM3 چه اتفاقی می افتد؟
معامله این است که سیگنالینگ PAM4 به طور کلی به نویز تصادفی و القایی حساس تر است. در ازای سیگنال فرکانس پایین تر، باید بتو،د دو برابر بیشتر حالت ها را به درستی شناسایی کنید. در عمل، این منجر به نرخ خطای بیت بالاتر در فرکانس معین می شود. برای کاهش BER، ی،ان سازی در انتهای Rx و پیش جبران در انتهای Tx باید اجرا شود که مصرف برق را افزایش می دهد. و در حالی که در حافظه GDDR6X استفاده نمی شود، در فرکانس های بالاتر (به ،وان مثال PCIe 6.0)، تصحیح خطای جلو (FEC) نیز یک نیاز عملی است.
همانطور که از نام آن پیداست، PAM3 چیزی است که بین NRZ/PAM2 و PAM4 قرار می گیرد و از سیگنال م،اسیون دامنه پالس سه سطحی (-1، 0، +1) استفاده می کند که به آن اجازه می دهد 1.5 بیت در هر چرخه (یا به عبارت بهتر 3 بیت بیش از حد) ارسال کند. دو چرخه). PAM3 نرخ انتقال داده در هر چرخه بالاتری نسبت به NRZ ارائه میکند – نیاز به حرکت به فرکانسهای گذرگاه حافظه بالاتر را کاهش میدهد و از دست دادن سیگنال با چالشهایی همراه است – در حالی که نیاز به نسبت سیگنال به نویز کمتری نسبت به PAM4 دارد. به طور کلی، GDDR7 عملکرد بالاتری نسبت به GDDR6 و همچنین مصرف انرژی و هزینه های پیاده سازی کمتر نسبت به GDDR6X را نوید می دهد.
اما حتی افزایش “ساده” فرکانس به طور فزاینده ای چندان ساده نیست. و این صنعت را به دنبال راهحلهایی غیر از افزایش ساعتها سوق داده است.
با این اوصاف، باید دید که یک زیرسیستم حافظه 256 بیتی با نرخ انتقال داده 36 گیگابیت بر ث،ه که سامسونگ وعده داده است، چقدر انرژی مصرف خواهد کرد. خود مشخصات GDDR7 هنوز تایید نشده است، و خود سختافزار هنوز در حال ساخت است (که ابزارهایی مانند Cadence وارد میشوند). اما با توجه به اینکه برنامههای کاربردی برای هوش مصنوعی، HPC و گرافیک چقدر پهنای باند دارند، این پهنای باند همیشه مورد استقبال قرار خواهد گرفت.
بهینه سازی راندمان و مصرف برق
علاوه بر افزایش توان، انتظار میرود که GDDR7 چندین راه برای بهینهسازی کارایی حافظه و مصرف انرژی داشته باشد. به طور خاص، GDDR7 از چهار حالت مختلف ساعت خواندن (RCK) پشتیب، میکند تا فقط در صورت نیاز آن را فعال کند:
- همیشه در حال اجرا: همیشه در حال اجرا است و در حالت خواب متوقف می شود.
- غیرفعال ،: اجرا را متوقف می کند.
- با دستور شروع RCK شروع کنید: میزبان میتواند با صدور دستور RCK S، قبل از خواندن دادهها، RCK را راهاندازی کند و در صورت نیاز از دستور توقف RCK متوقف شود.
- با خواندن شروع کنید: زم، که DRAM هر فرم، را که شامل خواندن داده ها می شود دریافت می کند، RCK به طور خودکار شروع به اجرا می کند. با استفاده از دستور RCK Stop می توان آن را متوقف کرد.
در نهایت، GDDR7 میتواند بین کدگذاری PAM3 و رمزگذاری NRZ بر اساس نیازهای پهنای باند جابهجا شود. در سناریوهای با پهنای باند بالا، PAM3 استفاده خواهد شد، در حالی که در سناریوهای با پهنای باند پایین، کنترلکنندههای حافظه و حافظه میتوانند به NRZ کارآمدتر انرژی تغییر کنند.
Cadence اولین راه حل تأیید GDDR7 را ارائه می دهد
با توجه به معاوضه های ذکر شده در بالا در مورد سیگنالینگ PAM4 یا سیگنالینگ NRZ، معلوم می شود که اعضای JEDEC پشت استاندارد حافظه GDDR7 در عوض موضعی شبیه به سازش دارند. به جای استفاده از PAM4، حافظه GDDR7 قرار است از رمزگذاری PAM3 برای انتقال با سرعت بالا استفاده کند.
وقتی NRZ را با PAM3 و PAM4 مقایسه می کنیم، می بینیم که نرخ انتقال داده برای PAM3 در وسط NRZ و PAM4 است. دلیل استفاده از PAM3 در این مورد، دستیابی به پهنای باند بالاتر بدون محدودیتهای اضافی است که PAM4 برای فعال ، نیاز دارد.
NRZ در مقابل PAM-3 در مقابل PAM4 |
AnandTech |
بیت ها |
چرخه ها |
بیت پر چرخه |
NRZ |
1 |
1 |
1 |
PAM-3 |
3 |
2 |
1.5 |
PAM-4 |
2 |
1 |
2 |