به گزارش hackster
معماریهای محاسباتی امروزی اصولاً با هدف اجرای برنامههای هوش مصنوعی (AI) طراحی نشدهاند. حجم عظیم دادههایی که برای آموزش مدلهای بزرگ هوش مصنوعی باید بین حافظه و واحدهای پردازش جابهجا شوند، باعث میشود سیستمهای سنتی با کندی قابلتوجهی مواجه شوند. اما از آنجا که هوش مصنوعی یک فناوری تحولآفرین است و جایگاه خود را در دنیای فناوری تثبیت کرده، باید راهحلهایی برای بهبود عملکرد سیستمهای موجود بدون بازطراحی کامل آنها پیدا کنیم. به همین دلیل، شتابدهندههای هوش مصنوعی(AI accelerators) مانند GPUها، TPUها و VPUها توسعه یافتهاند تا سرعت اجرای بارهای کاری مرتبط با هوش مصنوعی را بهطور چشمگیری افزایش دهند.
با وجود پیشرفتهای این شتابدهندهها، همچنان نیاز به جابهجایی دادهها بین حافظه و شتابدهنده وجود دارد که محدودیتهایی را به همراه دارد. هر گزینه سختافزاری دارای مزایا و معایب خاص خود است و هیچکدام بهطور کامل برای تمامی سناریوهای استفاده مناسب نیستند. راهحل ایدهآل شاید محاسبات درونحافظه (In-Memory Computing) باشد، اما این سیستمها اغلب به دلیل نیاز به فناوریهای تخصصی، انعطافپذیری و مقیاسپذیری کافی ندارند.
محققان دانشگاه پلیتکنیک تورین و مؤسسه فناوری فدرال سوئیس در لوزان، گزینهای به نام محاسبات نزدیکبهحافظه (Near-Memory Computing – NMC) را معرفی کردهاند که میتواند برای طیف وسیعتری از بارهای کاری هوش مصنوعی مناسب باشد.
سیستمهای NMC با استفاده از جریانهای طراحی دیجیتال استاندارد، راهحلی عملی و مقیاسپذیر ارائه میدهند. در این میان، تیم تحقیقاتی بهطور خاص بر روی معماری محاسباتی مبتنی بر NMC به نام ARCANE تمرکز کردهاند تا عملکرد آن را در مقایسه با سیستمهای مبتنی بر CPU تنها بررسی کنند.
ARCANE یک معماری نوآورانه است که واحدهای پردازش برداری (Vector Processing Units – VPUs) را مستقیماً درون حافظه نهان (Cache) سیستم محاسباتی ادغام میکند. این رویکرد زمان و انرژی صرفشده برای جابهجایی دادهها بین پردازنده و حافظه را بهطور قابلتوجهی کاهش میدهد. این کار از طریق یک مجموعه دستورالعمل سفارشی به نام xmnmc انجام میشود که مدیریت حافظه را سادهسازی کرده و امکان اجرای هستههای یادگیری ماشینی را مستقیماً در حافظه نهان فراهم میکند.
تصویر j8pqpZTAHA 11zon
این پارادایم منحصربهفرد محاسبات درونحافظه نهان، از گلوگاههای حافظه که در معماری وُن نویمان ( Von Neumann architecture ) رایج هستند، جلوگیری میکند. به جای ارسال دادهها در مسیری طولانی به حافظه و بازگشت آنها، ARCANE عملیات را بهصورت محلی انجام میدهد. این کار با قفل کردن بخشی از حافظه نهان در طول اجرا و مدیریت انتقال عملگرها از طریق یک طرح ساده دسترسی مستقیم به حافظه (DMA) تحت کنترل نرمافزار انجام میشود.
در مجموعهای از آزمایشها، ARCANE عملکردی عجیب از خود نشان داده است. در عملیات کانولوشن دوبعدی (2D Convolution) که یکی از عملیات کلیدی در مدلهای بینایی ماشین است، این معماری تا ۱۵۰ برابر سرعت بیشتری نسبت به سیستمهای CPU تنها ارائه کرده است.
برای لایههای خطی (Linear Layers) که از اجزای اساسی شبکههای عصبی هستند، بهبود سرعت تا ۳۰۵ برابر گزارش شده است. حتی در عملیات مبتنی بر Transformer مانند Fused-Weight Self-Attention که معمولاً در مدلهای زبانی استفاده میشود، ARCANE توانست شتابی ۳۲ برابری را به ارمغان بیاورد.
نوع عملیات | بهبود سرعت (نسبت به CPU) |
---|---|
کانولوشن دوبعدی (2D Convolution) | ۱۵۰ برابر |
لایههای خطی (Linear Layers) | ۳۰۵ برابر |
عملیات Transformer (مانند Self-Attention) | ۳۲ برابر |
تصویر 5chjSnyhfc 11zon
در دنیای هوش مصنوعی، داشتن ابزارهای متنوع و قدرتمند میتواند تفاوت بزرگی در موفقیت پروژهها ایجاد کند. ARCANE بهعنوان یک راهحل مبتنی بر محاسبات نزدیکبهحافظه، میتواند گزینهای مناسب برای جلوگیری از توقف پروژههای نوآورانه باشد. این معماری نهتنها کارایی را افزایش میدهد، بلکه به توسعهدهندگان و محققان کمک میکند تا با چالشهای مرتبط با جابهجایی دادهها مقابله کنند و به نتایج سریعتر و بهینهتری دست یابند.
وبسایت: http://www.arvidtek.com
www.arvidtek.com | گروه مهندسی آرویدتک | فعال حوزه الکترونیک و مخابرات | فروشگاه تخصصی قطعات الکترونیک
نویسنده شو !
سیسوگ با افتخار فضایی برای اشتراک گذاری دانش شماست. برای ما مقاله بنویسید.