• اخبار
  • ابزار هوش مصنوعی
  • ارتباط با ما
  • Microsoft Lens؛ هوش مصنوعی متن‌باز مایکروسافت برای ساخت تصویر

    معرفی Microsoft Lens؛ هوش مصنوعی جدید مایکروسافت برای تولید تصاویر حرفه‌ای

    مایکروسافت با معرفی مدل جدید Microsoft Lens وارد رقابت جدی با مدل‌های مطرح تولید تصویر مانند FLUX، Midjourney و Stable Diffusion شده است. این مدل که به‌صورت متن‌باز در Hugging Face و GitHub منتشر شده، تمرکز ویژه‌ای روی کیفیت بالا، سرعت تولید تصویر و مصرف بهینه منابع پردازشی دارد.

    طبق اطلاعات رسمی منتشرشده توسط مایکروسافت، Lens یک مدل 3.8 میلیارد پارامتری برای تبدیل متن به تصویر (Text-to-Image) است که با استفاده از معماری‌های جدید و دیتاست بسیار بزرگ آموزش دیده و می‌تواند تصاویر بسیار واقع‌گرایانه و حرفه‌ای تولید کند.

    Microsoft Lens چیست؟

    Microsoft Lens یک مدل هوش مصنوعی مولد تصویر است که توسط تیم تحقیقاتی مایکروسافت توسعه یافته و هدف آن ارائه کیفیتی نزدیک به مدل‌های بسیار سنگین، اما با هزینه پردازشی کمتر است.

    این مدل از تکنولوژی‌های زیر استفاده می‌کند:

    • Dense Caption Pre-training
    • Mixed-Resolution Learning
    • GPT-OSS Multi-layer Features
    • FLUX.2 Semantic VAE
    • MMDiT Transformer Architecture

    مایکروسافت اعلام کرده این مدل با وجود مصرف منابع کمتر، می‌تواند خروجی‌هایی در سطح مدل‌های بسیار بزرگ‌تر تولید کند.

    مهم‌ترین ویژگی‌های Microsoft Lens

    1. کیفیت تصویر بسیار بالا

    یکی از مهم‌ترین نقاط قوت Lens کیفیت خروجی تصاویر است. جزئیات تصاویر، نورپردازی، بافت‌ها و ترکیب‌بندی صحنه‌ها در سطح بسیار بالایی قرار دارند.

    تصویر تولید شده با Microsoft Lens از برج بیگ بن لندن

    این مدل مخصوصاً در تولید تصاویر زیر عملکرد بسیار خوبی دارد:

    • تصاویر فوتورئالیستی
    • مناظر طبیعی
    • معماری
    • پرتره
    • فانتزی و سینمایی
    • طراحی مفهومی
    • تصاویر تبلیغاتی

    2. تولید سریع تصویر با نسخه Lens-Turbo

    تصویر هنری تولید شده با مدل Microsoft Lens

    مایکروسافت علاوه بر نسخه اصلی، مدل Lens-Turbo را نیز منتشر کرده که تنها با 4 مرحله (4-Step Sampling) تصویر تولید می‌کند.

    این موضوع باعث می‌شود سرعت تولید تصویر نسبت به بسیاری از مدل‌های فعلی چند برابر سریع‌تر باشد.

    3. پشتیبانی از رزولوشن بالا در Microsoft Lens

    نمونه تصویر فوتورئالیستی Microsoft Lens

    Lens می‌تواند تصاویر را تا رزولوشن 1440×1440 تولید کند و از نسبت تصویرهای مختلف مانند:

    • 1:1
    • 16:9
    • 9:16
    • 2:1
    • 1:2

    پشتیبانی می‌کند.

    4. درک بهتر پرامپت‌ها

    به لطف استفاده از GPT-OSS Features، این مدل درک بسیار بهتری از توضیحات متنی دارد و خروجی‌ها به پرامپت نزدیک‌تر هستند.

    نمونه تصویر فانتزی ساخته شده توسط هوش مصنوعی Microsoft Lens

    این ویژگی مخصوصاً برای:

    • طراحان
    • تولیدکنندگان محتوا
    • تبلیغات
    • طراحی محصول
    • ساخت کانسپت آرت
    • بسیار مهم است.

    مقایسه Microsoft Lens با مدل‌های معروف

    مدلکیفیتسرعتنیاز سخت‌افزاریمتن‌باز
    Microsoft Lensبسیار بالابسیار سریعمتوسطبله
    FLUXبسیار بالامتوسطبالامحدود
    Stable Diffusion XLبالامتوسطمتوسطبله
    Midjourneyبسیار بالابالاابریخیر

    آیا Microsoft Lens رقیب Midjourney و FLUX می‌شود؟

    بررسی‌های اولیه کاربران و تست‌های منتشرشده در یوتیوب نشان می‌دهد Lens کیفیت بسیار نزدیکی به مدل‌های پرچمدار دارد.

    بسیاری از کاربران Reddit نیز از سرعت بالا و کیفیت مناسب نسخه Turbo تعریف کرده‌اند، هرچند برخی معتقدند هنوز در برخی سناریوها به قدرت Midjourney نمی‌رسد.

    نحوه نصب و اجرای Microsoft Lens

    برای اجرای Lens کافی است:

    pip install -U diffusers transformers accelerate
    

    سپس مدل را از HuggingFace بارگذاری کنید:

    from lens import LensPipeline
    
    pipe = LensPipeline.from_pretrained(
        "microsoft/Lens"
    ).to("cuda")
    

    آیا Microsoft Lens رایگان است؟

    بله. این مدل تحت لایسنس MIT منتشر شده و برای تحقیقات و استفاده‌های مختلف قابل دانلود است.

    مزایا و معایب Microsoft Lens

    مزایا

    • کیفیت بسیار بالا
    • سرعت تولید تصویر عالی
    • متن‌باز بودن
    • پشتیبانی از رزولوشن بالا
    • درک قوی پرامپت‌ها

    معایب

    • نیاز به GPU نسبتاً قوی
    • هنوز اکوسیستم کاملی مثل Midjourney ندارد
    • تازه منتشر شده و جامعه کاربری آن کوچک‌تر است
    Microsoft Lens چیست؟

    Microsoft Lens یک مدل هوش مصنوعی متن‌باز از مایکروسافت برای تولید تصویر از متن است.

    آیا Microsoft Lens رایگان است؟

    بله، این مدل به‌صورت متن‌باز در Hugging Face و GitHub منتشر شده است.

    Microsoft Lens بهتر است یا Midjourney؟

    Lens در سرعت و متن‌باز بودن عملکرد خوبی دارد اما Midjourney هنوز در برخی سبک‌های هنری قوی‌تر است.

    آیا Microsoft Lens روی کامپیوتر شخصی اجرا می‌شود؟

    بله، اما برای بهترین عملکرد نیاز به GPU مناسب دارد.

    جمع‌بندی

    Microsoft Lens را می‌توان یکی از جدی‌ترین مدل‌های متن‌باز جدید در حوزه تولید تصویر دانست. ترکیب کیفیت بالا، سرعت مناسب و معماری بهینه باعث شده بسیاری از کاربران آن را رقیبی جدی برای FLUX و Stable Diffusion بدانند.

    اگر مایکروسافت توسعه این پروژه را ادامه دهد، Lens می‌تواند به یکی از محبوب‌ترین مدل‌های AI Image Generation در سال 2026 تبدیل شود.

    mohtips

    موهتیپس(Mohtips) رسانه‌ایه که برای به اشتراک گذاشتن تجربه‌ها و چیزهایی که درباره هوش مصنوعی یاد می‌گیرم ساختم. کارم رو اول از یوتیوب شروع کردم؛ جایی که اخبار AI رو پوشش می‌دادم و ابزارهای رایگان و اوپن‌سورس هوش مصنوعی رو معرفی و نحوه نصب و استفاده ازشون رو توضیح می‌دادم. حالا با راه‌اندازی این سایت، سعی می‌کنم همه این محتواها و چیزهای جدیدی که در دنیای هوش مصنوعی پیدا می‌کنم رو ساده و کاربردی با بقیه به اشتراک بذارم.

    ثبت دیدگاه

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *