Bonsai Image 4B چیست؟
در سال ۲۰۲۶ شرکت PrismML از مدل جدیدی به نام Bonsai Image 4B رونمایی کرد؛ مدلی که میتواند تعریف جدیدی از تولید تصویر با هوش مصنوعی روی دستگاههای شخصی ارائه دهد. برخلاف بسیاری از مدلهای تصویری که برای اجرا به سرورهای قدرتمند ابری نیاز دارند، Image 4B به گونهای طراحی شده که روی آیفون، لپتاپ، مکبوک و حتی برخی مرورگرهای مجهز به WebGPU نیز قابل اجرا باشد.
این مدل با استفاده از فناوریهای فشردهسازی پیشرفته، حجم مدل را تا بیش از ۸ برابر کاهش داده و در عین حال بخش زیادی از کیفیت تصویر مدل اصلی را حفظ کرده است.

چرا Image 4B اهمیت دارد؟
یکی از بزرگترین چالشهای مدلهای تولید تصویر، نیاز به حافظه و توان پردازشی بالا است. مدلهای مدرن معمولاً به چندین گیگابایت حافظه گرافیکی و سرورهای قدرتمند نیاز دارند.
اما این مدل با استفاده از معماری 1-Bit و Ternary این محدودیت را تا حد زیادی برطرف کرده است. طبق اعلام PrismML، این مدل میتواند روی آیفون به صورت محلی اجرا شود؛ اتفاقی که تاکنون برای مدلهای تصویری در این کلاس پارامتری تقریباً غیرممکن به نظر میرسید.
مزایای اصلی عبارتاند از:
- کاهش شدید مصرف حافظه
- اجرای سریعتر روی دستگاههای شخصی
- حذف وابستگی به سرورهای ابری
- حفظ حریم خصوصی کاربران
- کاهش هزینههای پردازشی
فناوری 1-Bit و Ternary چگونه کار میکند؟
یکی از مهمترین نوآوریهای Image 4B استفاده از وزنهای بسیار کمحجم در شبکه عصبی است.
نسخه 1-Bit
در این نسخه وزنهای مدل تنها شامل دو مقدار هستند:
-1 و +1
این روش باعث میشود حجم مدل به شکل چشمگیری کاهش پیدا کند و مصرف حافظه به حداقل برسد.
نسخه Ternary
در نسخه Ternary سه مقدار برای وزنها استفاده میشود:
-1، 0 و +1
وجود مقدار صفر انعطاف بیشتری به مدل میدهد و باعث بهبود کیفیت تصاویر تولیدشده و درک بهتر پرامپتها میشود.
میزان فشردهسازی Image 4B چقدر است؟
طبق اطلاعات منتشرشده توسط PrismML:
- نسخه 1-Bit حجم مدل را به حدود 0.93 گیگابایت کاهش میدهد.
- نسخه Ternary به حدود 1.21 گیگابایت میرسد.
- این کاهش حجم معادل 6.4 تا 8.3 برابر نسبت به نسخه اصلی است.
نکته مهم اینجاست که با وجود این کاهش حجم چشمگیر، مدل همچنان تا حدود 95 درصد کیفیت نسخه Full Precision را حفظ میکند.
عملکرد Image 4B روی آیفون و مک
یکی از جذابترین بخشهای معرفی این مدل، نتایج عملکرد آن روی دستگاههای واقعی بود.
PrismML اعلام کرده است:
- تولید تصویر 512×512 روی iPhone 17 Pro Max حدود 9.4 ثانیه زمان میبرد.
- همین عملیات روی Mac M4 Pro حدود 6 ثانیه طول میکشد.
- سرعت اجرای مدل روی مک تا 5.6 برابر بیشتر از نسخه کامل گزارش شده است.
این اعداد نشان میدهند که تولید تصویر آفلاین روی دستگاههای مصرفکننده در حال تبدیل شدن به یک واقعیت عملی است.
تفاوت Bonsai Image 4B با FLUX.2 Klein 4B

بسیاری از کارشناسان Bonsai Image 4B را نسخهای بهینهسازیشده از FLUX.2 Klein 4B میدانند.
مهمترین تفاوتها:
ویژگی Bonsai Image 4B FLUX.2 Klein 4B حجم تقریبی حدود 3 گیگابایت حدود 16 گیگابایت نوع وزنها Binary / Ternary Full Precision اجرای محلی بسیار مناسب محدودتر مصرف حافظه بسیار کم بالا مناسب موبایل بله خیر
واکنش جامعه هوش مصنوعی به Bonsai Image 4B
انتشار Bonsai Image 4B بازتاب گستردهای در جوامع هوش مصنوعی داشته است. کاربران Reddit از حجم بسیار کم، مجوز Apache 2.0 و امکان اجرای محلی در مرورگرها استقبال کردهاند. بسیاری از توسعهدهندگان این مدل را یکی از مهمترین گامها برای فراگیر شدن تولید تصویر محلی میدانند.
با این حال برخی کاربران اشاره کردهاند که در تصاویر پیچیده، آناتومی بدن و تولید متن داخل تصویر هنوز ضعفهایی مشاهده میشود.
دانلود Bonsai Image 4B و منابع رسمی
اگر قصد دارید Bonsai Image 4B را روی مک، آیفون، لپتاپ یا GPU شخصی اجرا کنید، PrismML نسخههای رسمی مدل را بهصورت متنباز منتشر کرده است. هر دو نسخه Binary و Ternary تحت مجوز Apache 2.0 در دسترس هستند.
صفحه رسمی پروژه
وبسایت رسمی PrismML:
مدلها در Hugging Face
نسخه Binary (1-Bit):
نسخه Ternary:
کالکشن کامل مدلهای Bonsai:
گیتهاب رسمی
مخزن دموی رسمی برای اجرای Bonsai Image:
مخزنهای مرتبط با کرنلها و ابزارهای PrismML:
جمعبندی
Bonsai Image 4B یکی از مهمترین نوآوریهای حوزه تولید تصویر با هوش مصنوعی در سال ۲۰۲۶ محسوب میشود. این مدل با استفاده از فناوریهای 1-Bit و Ternary توانسته حجم مدلهای تصویری را تا بیش از ۸ برابر کاهش دهد و در عین حال کیفیت قابل قبولی ارائه کند.
قابلیت اجرا روی آیفون، مک و لپتاپ، مصرف پایین حافظه، سرعت مناسب و حفظ حریم خصوصی کاربران باعث شده Bonsai Image 4B به یکی از جذابترین پروژههای هوش مصنوعی متنباز تبدیل شود. اگر روند توسعه این فناوری ادامه پیدا کند، احتمالاً در آینده نزدیک شاهد فراگیر شدن تولید تصویر کاملاً محلی روی دستگاههای شخصی خواهیم بود.