مایکروسافت بزرگ‌ترین مدل هوش مصنوعی «۱ بیتی» جهان را معارفه کرد_دنیای تکنولوژی

مایکروسافت بزرگ‌ترین مدل هوش مصنوعی «1 بیتی» جهان را معرفی کرد

نوشته شده توسط: علی محمدی

فروردین 28, 1404

[ad_1]
نوشته و ویرایش شده توسط مجله ی دنیای تکنولوژی

مایکروسافت از گسترش بزرگ‌ترین مدل هوش مصنوعی «۱ بیتی» با نام BitNet b1.58 2B4T خبر داده است. به حرف های ردموندی‌ها، این مدل به‌صورت متن‌باز و تحت مجوز MIT انتشار شده و به اندازه‌ای بهینه است که روی پردازنده‌های معمولی همانند اپل M2 نیز اجرا می‌بشود.

مدل‌های ۱ بیتی یا به‌کلمه BitNet، نسخه‌های فشرده‌ای از مدل‌های هوش مصنوعی می باشند که به‌طوری طراحی شده‌اند تا با منفعت گیری از منبع های سخت‌افزاری محدود نیز کارکرد مناسبی داشته باشند. در این مدل‌ها، وزن‌ها تنها با سه مقدار -۱، ۰ و ۱ نمایش داده خواهد شد که این کار علتکاهش دیدنی مصرف حافظه و افزایش شدت اجرا می‌بشود.

بر پایه گزارش تک‌کرانچ، مدل تازه مایکروسافت دارای ۲ میلیارد پارامتر است و روی مجموعه‌ داده‌ای شامل ۴ تریلیون توکن آموزش دیده است (معادل نزدیک به ۳۳ میلیون کتاب).

کارکرد مدل ۱ بیتی مایکروسافت

مطابق نتایج منتشرشده، BitNet b1.58 2B4T توانسته در تست‌هایی ازجمله GSM8K (ریاضی ابتدایی) و PIQA (علتفیزیکی) از مدل‌های هم سطح خود همانند Llama 3.2 1B (متعلق به متا)، Gemma 3 1B (متعل به گوگل) و Qwen 2.5 1.5B (متعلق به گروه علی‌بابا) امتیاز بهتری دریافت کند.

آخرین مطالب

مایکروسافت این چنین اظهار کرده که این مدل در برخی موارد تا ۲ برابر سریع تر از مدل‌های شبیه عمل می‌کند و درعین‌حال تنها بخشی از حافظه موردنیاز مدل‌های رایج را مصرف می‌کند.

بااین‌حال، برای دستیابی به این مدل، باید از فریمورک اختصاصی مایکروسافت با نام bitnet.cpp منفعت گیری کرد که اکنون تنها با سخت‌افزارهای محدودی سازگار است و حمایتاز GPUها (که نقش مهمی در اجرای مدل‌های هوش مصنوعی دارند) را شامل نمی‌بشود.

این نوشته مشخص می کند که اگرچه BitNetها پتانسیل بالایی برای منفعت گیری در دستگاه‌های کم‌مصرف و محدود دارند، اما چالش سازگاری سخت‌افزاری هم چنان یکی از مانع ها مهم گسترش آن‌ها محسوب می‌بشود.

دسته بندی مطالب

[ad_2]