در پردازندههای سرور EPYC 7002 AMD، مشکلی شناسایی شده است که میتواند باعث ش،ت هسته مح،اتی پس از 1044 روز کار بدون وقفه شود.
اطلاعات AMD نشان می دهد که راه اندازی مجدد سرور در این بازه زم، ممکن است مشکل را دور بزند. با این حال، AMD در حال حاضر قصد ندارد اشکالی را برطرف کند. تیم تحریریه Tom’s Hardware این اشکال را در راهنمای ویرایش پردازنده سرور EPYC 7002 AMD که در ماه آوریل منتشر شد، شناسایی ،د. این راهنما نشان می دهد که یک هسته مح،اتی در EPYC 7002 به دلیل عدم توانایی برای بیدار شدن از حالت خواب CC6 مستعد ش،ت است.
مدت زمان دقیق تا آشکار شدن باگ تحت تأثیر عوامل مختلفی از جمله ساعت مرجع استفاده شده توسط پردازنده است. برای دور زدن این اشکال، کاربران این گزینه را دارند که حالت خواب CC6 را غیرفعال کنند یا سرور خود را قبل از تقریباً 1044 روز کارکرد مجدد راه اندازی کنند.
حدس و گمان در مورد مدت زمان خاص در سیستم عامل های آنلاین به وجود آمده است، با یکی از کاربران در Reddit این فرضیه که ممکن است نزدیک به 1042 روز باشد. علیرغم اینکه بروز اشکالات در پردازندهها تا حدی معمول است، همانطور که توسط Tom’s Hardware مشخص شده است، جالب است بد،د که آ،ین راهنمای ویرایش تراشههای سرور AMD EPYC 7002 “Rome” از یک باگ جدید رونمایی میکند که باعث میشود یک هسته پس از 1044 روز از کار بیفتد. زمان کار این ناهنجاری زم، رخ می دهد که هسته قادر به ،وج از حالت خواب CC6 نباشد. زمان وقوع آن ممکن است بر اساس عواملی مانند طیف گسترده و فرکانس REFCLK متفاوت باشد، که دومی ساعت مرجعی است که برای زمانسنجی استفاده میشود. یکی از کاربران Reddit، acid_migrain، تئوری جالبی را ارائه کرده است، که نشان میدهد این مشکل ممکن است در واقع در حدود 1042 روز و 12 ساعت ظاهر شود، زیرا TSC روی 2800 مگاهرتز است.
رفع اشکال ساده است: سرور را قبل از رسیدن به 1044 روز آپتایم راه اندازی مجدد کنید تا “تایمر” CPU را بازنش، کنید، یا وضعیت خواب CC6 را غیرفعال کنید. اگرچه این اشکال باعث افزایش ابروها میشود، اما احتمالاً بر ا،ر کاربران تأثیر نمیگذارد، زیرا باید بهروزرس،های امنیتی و نگهداری منظم را بیشتر انجام دهند.
گفته میشود، این باگ ممکن است بر کاربر، که از ویژگی وصله زنده لینو، یا kexec برای بهروزرس، بدون راهاندازی مجدد استفاده میکنند، تأثیر بگذارد، که به طور بالقوه منجر به افزایش زمان آپدیت میشود که میتواند باعث ایجاد باگ شود. به طور مشابه، سرورهایی که برنامه های کاربردی حیاتی را با آپتایم گسترده اجرا می کنند، ممکن است تحت تأثیر قرار گیرند.
منبع: https://www.guru3d.com/news-story/amd-epyc-7002-server-processors-reportedly-harbour-a-bug-crashes-after-1044-days-of-uptime.html