[ad_1]
نوشته و ویرایش شده توسط مجله ی دنیای تکنولوژی
مایکروسافت از گسترش بزرگترین مدل هوش مصنوعی «۱ بیتی» با نام BitNet b1.58 2B4T خبر داده است. به حرف های ردموندیها، این مدل بهصورت متنباز و تحت مجوز MIT انتشار شده و به اندازهای بهینه است که روی پردازندههای معمولی همانند اپل M2 نیز اجرا میبشود.
مدلهای ۱ بیتی یا بهکلمه BitNet، نسخههای فشردهای از مدلهای هوش مصنوعی می باشند که بهطوری طراحی شدهاند تا با منفعت گیری از منبع های سختافزاری محدود نیز کارکرد مناسبی داشته باشند. در این مدلها، وزنها تنها با سه مقدار -۱، ۰ و ۱ نمایش داده خواهد شد که این کار علتکاهش دیدنی مصرف حافظه و افزایش شدت اجرا میبشود.
بر پایه گزارش تککرانچ، مدل تازه مایکروسافت دارای ۲ میلیارد پارامتر است و روی مجموعه دادهای شامل ۴ تریلیون توکن آموزش دیده است (معادل نزدیک به ۳۳ میلیون کتاب).
کارکرد مدل ۱ بیتی مایکروسافت
مطابق نتایج منتشرشده، BitNet b1.58 2B4T توانسته در تستهایی ازجمله GSM8K (ریاضی ابتدایی) و PIQA (علتفیزیکی) از مدلهای هم سطح خود همانند Llama 3.2 1B (متعلق به متا)، Gemma 3 1B (متعل به گوگل) و Qwen 2.5 1.5B (متعلق به گروه علیبابا) امتیاز بهتری دریافت کند.
مایکروسافت این چنین اظهار کرده که این مدل در برخی موارد تا ۲ برابر سریع تر از مدلهای شبیه عمل میکند و درعینحال تنها بخشی از حافظه موردنیاز مدلهای رایج را مصرف میکند.
بااینحال، برای دستیابی به این مدل، باید از فریمورک اختصاصی مایکروسافت با نام bitnet.cpp منفعت گیری کرد که اکنون تنها با سختافزارهای محدودی سازگار است و حمایتاز GPUها (که نقش مهمی در اجرای مدلهای هوش مصنوعی دارند) را شامل نمیبشود.
این نوشته مشخص می کند که اگرچه BitNetها پتانسیل بالایی برای منفعت گیری در دستگاههای کممصرف و محدود دارند، اما چالش سازگاری سختافزاری هم چنان یکی از مانع ها مهم گسترش آنها محسوب میبشود.
دسته بندی مطالب
[ad_2]

