گوگل بهتازگی نسل تازهای از مدلهای متنباز هوش مصنوعی خود را با نام Gemma 4 گوگل معرفی کرده است. این مجموعه پیشرفته بر پایه فناوریها و دستاوردهای مدل Gemini 3 توسعه یافته و با مجوز متنباز Apache 2.0 منتشر شده است؛ مجوزی که به توسعهدهندگان اجازه میدهد بدون محدودیتهای گذشته، از ظرفیتهای این مدل در پروژههای مختلف خود استفاده کنند.
مدلهای مختلف در خانواده Gemma 4 گوگل
خانواده Gemma 4 گوگل چهار مدل با اندازهها و تواناییهای متفاوت دارد. گوگل دو نسخه کوچک با اندازه ۲ و ۴ میلیارد پارامتر طراحی کرده است. این مدلها روی دستگاههای سبک مانند گوشیهای هوشمند و برخی گجتهای قابل حمل اجرا میشوند. هدف اصلی این نسخهها اجرای سریع و مصرف پایین منابع سختافزاری است.
در کنار آنها، دو مدل بزرگتر با ۲۶ و ۳۱ میلیارد پارامتر نیز وجود دارند. این مدلها برای سیستمهای قدرتمند، سرورها و پردازشهای سنگین ساخته شدهاند. توسعهدهندگان میتوانند از این نسخهها در پروژههای پیچیدهتر هوش مصنوعی استفاده کنند.
بهینهسازی برای موبایل و دستگاههای هوشمند
گوگل نسخههای سبک Gemma 4 گوگل را برای اجرای محلی روی موبایلها و دستگاههای اینترنت اشیا بهینه کرده است. این مدلها هنگام اجرا رم و باتری کمتری مصرف میکنند. همین موضوع باعث میشود کاربران بتوانند بدون نیاز به سرورهای قدرتمند از آنها استفاده کنند.
در مقابل، نسخههای بزرگتر این خانواده برای وظایف پیچیدهتر طراحی شدهاند. این مدلها از معماریهای پیشرفته استفاده میکنند و توان پردازشی بالاتری ارائه میدهند. به همین دلیل، شرکتها و توسعهدهندگان حرفهای میتوانند از آنها برای تحلیل دادههای بزرگ یا ساخت ابزارهای هوش مصنوعی پیشرفته استفاده کنند.
عملکرد Gemma 4 در ارزیابیهای جهانی
پلتفرم Arena.ai عملکرد مدلهای جدید گوگل را نیز بررسی کرده است. نتایج نشان میدهد نسخههای قدرتمند Gemma 4 گوگل عملکرد بسیار خوبی دارند. این مدلها توانستند رتبههای سوم و ششم جدول ردهبندی متنی را به دست آورند.

نکته جالب این است که این مدلها توانستند برخی مدلهای بسیار بزرگتر را شکست دهند. در بعضی موارد حتی مدلهایی با اندازهای حدود ۲۰ برابر بزرگتر نیز عملکرد ضعیفتری نسبت به آنها داشتند. این موضوع نشان میدهد گوگل در بهینهسازی معماری مدلها موفق عمل کرده است.
قابلیتهای چندرسانهای و پشتیبانی از زبانها
یکی از ویژگیهای مهم این خانواده، توانایی پردازش چندرسانهای است. مدلهای این مجموعه میتوانند تصاویر و ویدیوها را تحلیل کنند. نسخههای کوچکتر حتی توانایی دریافت و درک ورودی صوتی را نیز دارند.
علاوه بر این، گوگل Gemma 4 گوگل را برای درک بیش از ۱۴۰ زبان زنده دنیا آموزش داده است. این قابلیت باعث میشود توسعهدهندگان بتوانند از آن در پروژههای بینالمللی و چندزبانه استفاده کنند.
تولید کد و پردازش اسناد طولانی
یکی از قابلیتهای کاربردی این مدلها، امکان تولید کد بهصورت آفلاین است. برنامهنویسان میتوانند بدون اتصال اینترنت از سیستم خود بهعنوان یک دستیار هوشمند کدنویسی استفاده کنند. این ویژگی برای محیطهای توسعه امن یا آفلاین بسیار مفید است.
از طرف دیگر، این مدلها پنجره زمینه بزرگی دارند. نسخههای موبایلی تا ۱۲۸ هزار توکن را پردازش میکنند. مدلهای بزرگتر حتی تا ۲۵۶ هزار توکن را در یک درخواست پردازش میکنند. این ظرفیت بالا بررسی و خلاصهسازی اسناد طولانی را بسیار آسان میکند.
انتشار متنباز و دسترسی توسعهدهندگان
گوگل این خانواده را با مجوز Apache 2.0 منتشر کرده است. این مجوز آزادی بیشتری به توسعهدهندگان میدهد. آنها میتوانند مدلها را در محیطهای ابری یا سرورهای محلی اجرا کنند.
علاقهمندان نیز میتوانند وزنهای Gemma 4 گوگل را بهصورت رایگان دریافت کنند. این فایلها در پلتفرمهایی مانند Hugging Face، Kaggle و Ollama در دسترس قرار دارند.