• ابزار هوش مصنوعی
  • ابزار اوپن سورس
  • ارتباط با ما
  • DramaBox چیست؟ معرفی هوش مصنوعی متن به صدا متن‌باز با پشتیبانی ComfyUI

    هوش مصنوعی متن به صدا DramaBox چیست؟

    هوش مصنوعی متن به صدا DramaBox یکی از جدیدترین مدل‌های Open Source در حوزه Text To Speech یا تبدیل متن به گفتار است که توسط Resemble AI منتشر شده و به‌سرعت توجه کاربران حوزه هوش مصنوعی، تولید محتوا و دوبله را جلب کرده است.

    برخلاف بسیاری از مدل‌های TTS که فقط متن را می‌خوانند، DramaBox روی «اجرای احساسی صدا» تمرکز دارد. یعنی می‌تواند خنده، عصبانیت، نجوا، مکث، هیجان و حتی تغییر احساس در طول دیالوگ را شبیه‌سازی کند. صفحه رسمی DramaBox در Resemble AI

    مهم‌ترین ویژگی‌های هوش مصنوعی متن به صدا DramaBox

    1. تولید صدای احساسی و سینمایی

    بزرگ‌ترین نقطه قوت DramaBox اجرای طبیعی احساسات است. شما می‌توانید داخل پرامپت مشخص کنید که گوینده با چه حسی صحبت کند؛ مثلاً عصبی، آرام، ترسیده یا هیجان‌زده.

    طبق توضیحات رسمی، این مدل برای «Performance Driven TTS» طراحی شده و صرفاً یک موتور خواندن متن نیست. (Resemble AI)

    2. پشتیبانی از Voice Cloning

    DramaBox امکان کلون کردن صدا را هم دارد. تنها با حدود ۱۰ ثانیه فایل صوتی مرجع، مدل می‌تواند همان تُن صدا را روی متن جدید پیاده کند. (Resemble AI)

    ساخته شده

    مرجع

    این سه نمونه بهترین نمایش قدرت احساسات و تغییر لحن DramaBox هستند.

    لینک مدل در هاگینگ فیس:
    مدل DramaBox در Hugging Face

    اجرای هوش مصنوعی متن به صدا در ComfyUI

    یکی از جذاب‌ترین بخش‌های این پروژه، پشتیبانی از ComfyUI است. نسخه اختصاصی نودهای DramaBox برای ComfyUI منتشر شده و کاربران می‌توانند این مدل را به‌صورت Workflow داخل کامفی اجرا کنند.

    پروژه ComfyUI:
    ComfyUI-DramaBox GitHub

    این قابلیت باعث می‌شود بتوانید DramaBox را کنار ابزارهای ویدیو، انیمیشن و AI Avatar استفاده کنید و خروجی حرفه‌ای تولید کنید.

    طبق تجربه کاربران ComfyUI، مدل حتی روی سیستم‌های 16GB VRAM هم قابل اجرا بوده و کیفیت بسیار بالایی ارائه می‌دهد. (Reddit)

    تست آنلاین هوش مصنوعی متن به صدا DramaBox بدون نصب

    اگر سخت‌افزار قوی ندارید یا فقط می‌خواهید مدل را امتحان کنید، نسخه آنلاین DramaBox داخل Hugging Face Spaces در دسترس قرار گرفته است.

    از طریق لینک زیر می‌توانید مستقیم مدل را تست کنید:

    تست آنلاین DramaBox در Hugging Face Spaces

    تکنولوژی استفاده شده در DramaBox

    هوش مصنوعی متن به صدا بر پایه مدل LTX-2.3 ساخته شده و از معماری Diffusion Transformer استفاده می‌کند. همچنین طبق اطلاعات رسمی، این مدل از واترمارک صوتی داخلی هم بهره می‌برد تا فایل‌های تولیدشده قابل شناسایی باشند. (Resemble AI)

    ویژگی‌های فنی مهم:

    • خروجی 48kHz Stereo
    • پشتیبانی از Stage Direction
    • کنترل احساسات در متن
    • Voice Reference
    • Watermark داخلی
    • Open Source

    چرا DramaBox مهم است؟

    اکثر مدل‌های متن به صدا فقط «خواندن متن» را انجام می‌دهند، اما DramaBox تلاش کرده «بازیگری صوتی» را وارد دنیای AI کند.

    همین موضوع باعث شده بسیاری از کاربران حوزه AI Voice آن را یکی از هیجان‌انگیزترین پروژه‌های متن‌باز سال 2026 بدانند. (Reddit)

    جمع‌بندی

    اگر به دنبال یک مدل Open Source حرفه‌ای برای تولید صدای احساسی، دوبله AI، Voice Cloning یا ساخت کاراکترهای صوتی هستید، DramaBox یکی از بهترین پروژه‌های جدید بازار محسوب می‌شود.

    پشتیبانی از ComfyUI، تست آنلاین رایگان، کیفیت بالای احساسات و متن‌باز بودن، این پروژه را به گزینه‌ای بسیار جذاب برای تولیدکنندگان محتوا و توسعه‌دهندگان AI تبدیل کرده است.

    لینک گیت‌هاب رسمی پروژه:
    DramaBox GitHub Repository

    mohtips

    موهتیپس(Mohtips) رسانه‌ایه که برای به اشتراک گذاشتن تجربه‌ها و چیزهایی که درباره هوش مصنوعی یاد می‌گیرم ساختم. کارم رو اول از یوتیوب شروع کردم؛ جایی که اخبار AI رو پوشش می‌دادم و ابزارهای رایگان و اوپن‌سورس هوش مصنوعی رو معرفی و نحوه نصب و استفاده ازشون رو توضیح می‌دادم. حالا با راه‌اندازی این سایت، سعی می‌کنم همه این محتواها و چیزهای جدیدی که در دنیای هوش مصنوعی پیدا می‌کنم رو ساده و کاربردی با بقیه به اشتراک بذارم.

    ثبت دیدگاه

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *