کدگذاری ویدیوی AV1 با 1 وات در هر جریان

AMD امروز صبح یک شتاب دهنده رسانه اختصاصی و کارت رمزگذاری ویدیویی جدید برای مراکز داده راه اندازی می کند – و اولین موردی که با نام تجاری AMD – Alveo MA35D عرضه می شود. این کارت جانشین سری قبلی کارت‌های Xilinx است که AMD به ،وان بخشی از ،ید Xilinx انتخاب کرد و آنها را به بازار کارت‌های رمزگذاری اختصاصی ویدیویی عرضه کرد. آ،ین نسل کارت شتاب دهنده رسانه Alveo، به ،ه خود، مزایای عملکرد قابل توجهی را نسبت به نسل قبلی خود نوید می دهد، حدا،ر تعداد پخش همزمان ویدیو را چهار برابر می کند و در عین حال پشتیب، از رمزگذاری با وضوح AV1 و 8K را نیز اضافه می کند.

بازار هدف این کارت، مانند مدل قبلی خود، بازار مرکز داده است. مشتریان اصلی AMD خدمات پخش زنده و سایر خدمات ویدئویی تعاملی هستند (به Twitch، بازی های ابری، کنفرانس ویدیویی و غیره فکر کنید)، که همگی نیاز به کدگذاری تعداد زیادی از جریان های ویدئویی در زمان واقعی در یک محیط سرور دارند. بنابراین، مانند پردازنده‌های EPYC AMD، این بخش تا حد زیادی یک بخش سرور است که هدف آن گروهی از ،ب‌وکارها است.

با دو VPU، کارت کامل Alveo MA35D هنوز به اندازه‌ای کوچک است که به صورت نیم‌قد و نیمه بلند عرضه می‌شود. با TDP 50 وات، کارت به طور کامل از طریق اسلات PCIe تغذیه می شود و از یک کانکتور PCIe x8 (که برای هر VPU به x4 ت،یم می شود) استفاده می کند. و همانطور که برای کارت های شتاب دهنده مرکز داده معمول است، MA35D به صورت غیرفعال خنک می شود.

از آنجایی که این خط تولیدی است که توسط AMD به ،وان بخشی از ،ید Xilinx به ارث رسیده و توسط گروه مح،اتی تطبیقی ​​و تعبیه شده توسعه یافته است، Alveo MA35D هم برای AMD جدید و هم آشنا است. محصولات قبلی کدگذاری ویدئویی مرکز داده منتشر شده توسط AMD بر اساس ،یب GPU آنها بود، بنابراین در حالی که این جدیدترین کارت رمزگذاری ویدیویی برای تیم سابق Xilinx است، این اولین بار است که AMD یک کارت رمزگذاری اختصاصی ویدئویی را به این روش عرضه می‌کند. – و تبدیل آن به نمونه‌ای بارز از نوع فرصت‌های جدید بازار که AMD برای ،ید Xilinx به دنبال آن بود.

مانند مدل قبلی خود، Alveo U30، MA35D نیز یک کارت رمزگذاری ویدئویی خالص است که برای مراکز داده طراحی شده است. به این م،ا که ASIC های آن صرفاً برای رمزگذاری ویدیوهای تعاملی/زمان واقعی طراحی شده اند، و Xilinx به دنبال انجام یک کار و انجام آن بسیار خوب است. این استراتژی طراحی در تضاد قابل توجهی با محصولات رقیب اینتل (سری GPU Flex) و NVIDIA (T4 & L4) است که محصولات مبتنی بر پردازنده گرافیکی هستند و از انعطاف‌پذیری پردازنده‌های گرافیکی خود همراه با رمزگذارهای ویدئویی یکپارچه خود برای عملکرد به ،وان ویدئو استفاده می‌کنند. کارت‌ها، کارت‌های بازی یا سایر نقش‌هایی که به آنها اختصاص داده شده را رمزگذاری می‌کنند. در مقایسه، MA35D یک محصول نسبتاً ساده است که برای انجام بهینه‌تر و کارآمدتر رمزگذاری ویدیو با تمرکز بر روی آن طراحی شده است.

در مجموع، AMD با Alveo MA35D ادعاهایی نسبتاً تهاجمی نسبت به کیفیت تصویر دارد. کیفیت تصویر H.264 و H.265 باید به ترتیب مشابه x264 Medium و x265 Medium از پیش تنظیم شده باشد، در حالی که کیفیت رمزگذاری AV1 کارت باید با AV1 کند مقایسه شود. این مقایسه‌ها بر اساس امتیازات VMAF و اینکه چه تنظیماتی برای دستیابی به امتیازات مشابه نیاز است، انجام می‌شود. یا برای کادربندی چیزها بر اساس نرخ بیت، با استفاده از AV1 AMD می‌گوید MA35D می‌تواند همان کیفیت تصویر Alveo U30 را در حالت H.264 با 55 درصد نرخ بیت (بهبود بازده 1.8 برابری) ارائه دهد.

در زیر هود، هر VPU شامل 4 بلوک رمزگذاری ویدیویی است که با بلوک‌های لوازم جانبی مختلفی که برای تبدیل آن به یک تراشه کاملاً کاربردی مورد نیاز است، تقویت شده است. دو بلوک رمزگذاری دارای ویژگی های کامل هستند و از H.264، H.265 و AV1 پشتیب، می کنند، در حالی که دو بلوک دیگر صرفاً برای AV1 هستند – که بر پیچیدگی مح،اتی اضافی کدک جدید تأکید می کند. بلوک‌های دیگر در VPU شامل بلوک‌های رمزگشای ویدیویی برای رمزگذاری، کنترل‌کننده‌های حافظه، کنترل‌کننده‌های مدیریت، مقیاس‌کننده بیت‌تریت، موتورهای ،یب‌بندی و پردازشگر هوش مصنوعی 22 TOPS برای بهبود بیشتر کیفیت رمزگذاری ویدیوی کارت است.

به گفته AMD، Alveo اکنون در حال نمونه گیری برای شرکا است. این شرکت انتظار دارد محموله های تولید خود را در سه ماهه سوم سال با قیمت ،ده فروشی پیشنهادی 1595 دلار آغاز کند.


منبع: https://www.anandtech.com/s،w/18805/amd-announces-alveo-ma35d-media-accelerator-av1-video-encode-at-1w-per-stream

در همین حال، جدید Alveo MA35D و VPU آن یک بلوک شتاب هوش مصنوعی است. برخلاف محصولات مبتنی بر GPU، این برای کارهای شبه مرتبط با هوش مصنوعی مانند تشخیص تصویر نیست. بلکه AMD از شتاب دهنده هوش مصنوعی برای تغذیه داده های اضافی به رمزگذار ویدیوی خود استفاده می کند تا کیفیت رمزگذاری آنها را بیشتر بهبود بخشد. این پردازنده هوش مصنوعی با امتیاز عملکرد 22 تاپس، وجود دارد تا جریان ها را بر اساس فریم به فریم ارزیابی کند و سپس از آن تجزیه و تحلیل برای تنظیم پارامترهای رمزگذاری استفاده شده توسط بقیه تراشه استفاده کند.

در قلب این کارت، کد ویدیوی بدون نام AMD ASIC قرار دارد که آن را واحد پردازش ویدئو (VPU) می نامند. MA35D شامل دو VPU است که هر کدام دارای 8 گیگابایت حافظه LPDDR5 و اتصال PCIe 5.0 x4 به پردازنده میزبان هستند. VPU بر روی یک فرآیند 5 نانومتری ساخته می‌شود، به‌طور عجیبی AMD فاب مورد استفاده را فاش نمی‌کند، که باعث می‌شود فکر کنیم این یک فرآیند 5 نانومتری سامسونگ است.ed: در این مرحله، اگر ،ی از TSMC استفاده می کند، معمولاً درباره آن لاف می زند).

با خود بلوک‌های رمزگذاری ویدیو، مهندسان AMD به سرعت متوجه شدند که، علی‌رغم شباهت‌های همپوش، بین این بخش و تلاش‌های GPU AMD، بلوک‌های رمزگذاری ویدیوی VPU یک طراحی منحصربه‌فرد هستند و از بلوک‌های رمزگذاری ویدیوی GPU AMD خارج نشده‌اند. در حالی که من تعجب نمی کنم که ببینم AMD در نهایت IP رمزگذار را در خطوط تولید ادغام می کند، برای محصول نسل فعلی VPU های Alveo MA35D قبل از بسته شدن ،ید Xilinx در حال توسعه بودند، بنابراین تیم سابق Xilinx کاری را که شروع کرده بود به پایان رساند. این بدان م،است که VPU ها باید مجموعه ای از ویژگی های عجیب و غریب خود را داشته باشند، اما همچنین، درجه خاصی از غرور تیم Alveo وجود دارد که آنها رمزگذار ویدیویی بهتری را ساخته اند.

با استفاده از رمزگذاری منطقه مورد علاقه و تشخیص مصنوع، پردازنده AI اساساً به MA35D اجازه می دهد تا با نرخ بیت پایین تر از یک استراتژی رمزگذاری ویدیویی ساده تر از بین برود. رمزگذاری منطقه مورد علاقه به بخش‌هایی از ویدیو اجازه می‌دهد تا کدگذاری با کیفیت بالاتری دریافت کنند (متن، چهره‌ها، و غیره)، در حالی که تشخیص مصنوع می‌تواند زم، که رمزگذار در حال تغذیه تصاویر بلوک یا ت،یب‌شده (که در واقع کدگذاری آن‌ها سخت‌تر است) شناسایی شود. حذف / تصحیح آنها قبل از ارسال یک فریم برای رمزگذاری.

VPU همچنین انتقال خانواده رمزگذار ویدیوی Alveo را به یک محصول کاملاً مبتنی بر ASIC نشان می دهد. البته Xilinx بیشتر به خاطر FPGA های قابل برنامه ریزی خود شناخته شده است، و در حالی که پردازنده های قبلی Alveo U30 از منطق سخت برای بلوک های کدگذاری ویدیویی خود استفاده می ،د، که با یک ش،ه فابریک FPGA ،یب شده بود. بنابراین آن محصول هنوز ،یبی از طراحی ASIC و FPGA بود. از سوی دیگر، VPU های MA35D، ASIC های آزمایش شده و واقعی بدون ،اصر FPGA هستند، که به شرکت اجازه می دهد تا به طور کامل از مزایای بهره وری انرژی استفاده از منطق عملکرد ثابت برای یک محصول اختصاصی استفاده کند.

و بهره وری انرژی، مزیت عمده دیگری نسبت به کارت قدیمی U30 است – و همچنین چیزی که AMD آن را برتری قابل توجهی نسبت به رقبای خود می داند. TDP رسمی کارت 50 وات است، اما در عمل AMD دریافته است که مصرف برق معمولی کارت نزدیک‌تر به حدود 35 وات یا یک موی بیش از 1 وات در هر جریان برای 1080p60 است. این کاهش 66 درصدی در مصرف انرژی در هر جریان در مقایسه با U30 است که برای یک استریم 1080p کمی بیش از 3 وات بود.

در نهایت، اگرچه ثانویه به قابلیت‌های کدگذاری ویدیویی MA35D است، اما جالب است بد،د که پردازنده‌های مدیریتی در VPU از Arm به RISC-V تغییر یافته‌اند. در حالی که پردازنده‌های U30 از هسته‌های چهار هسته‌ای Cortex-A53 استفاده می‌،د، MA35D VPU از یک جفت هسته چهار هسته‌ای RISC-V استفاده می‌کرد – اگرچه AMD مشخص نمی‌کند که کدام هسته. معماری RISC-V بی سر و صدا به سمت کنتر،های مدیریتی مانند اینها رفته است و این نمونه دیگری از این انتقال در عمل است.

با غواصی در خود سخت افزار Alveo MA35D، AMD به دنبال ارتقای نسلی قابل توجهی نسبت به نسل قبلی خود است. در حالی که Alveo U30 یک کارت رمزگذاری H.264 و H.265 بود که می‌توانست تا 8 جریان 1080p را رمزگذاری کند، Alveo MA35D این میزان را تا 32 جریان 1080p افزایش می‌دهد. در همین حال، پشتیب، از آ،ین نسل کدک AV1 اضافه شده است – با پیوستن به گزینه های موجود H.264 و H.265 – و حدا،ر وضوح جریان از 4K به 8K افزایش یافته است که خود چهار برابر شده است.