فهرست مطالب

هوش مصنوعی متن به صدا DramaBox چیست؟

هوش مصنوعی متن به صدا DramaBox یکی از جدیدترین مدل‌های Open Source در حوزه Text To Speech یا تبدیل متن به گفتار است که توسط Resemble AI منتشر شده و به‌سرعت توجه کاربران حوزه هوش مصنوعی، تولید محتوا و دوبله را جلب کرده است.

برخلاف بسیاری از مدل‌های TTS که فقط متن را می‌خوانند، DramaBox روی «اجرای احساسی صدا» تمرکز دارد. یعنی می‌تواند خنده، عصبانیت، نجوا، مکث، هیجان و حتی تغییر احساس در طول دیالوگ را شبیه‌سازی کند. صفحه رسمی DramaBox در Resemble AI

مهم‌ترین ویژگی‌های هوش مصنوعی متن به صدا DramaBox

1. تولید صدای احساسی و سینمایی

بزرگ‌ترین نقطه قوت DramaBox اجرای طبیعی احساسات است. شما می‌توانید داخل پرامپت مشخص کنید که گوینده با چه حسی صحبت کند؛ مثلاً عصبی، آرام، ترسیده یا هیجان‌زده.

طبق توضیحات رسمی، این مدل برای «Performance Driven TTS» طراحی شده و صرفاً یک موتور خواندن متن نیست. (Resemble AI)

2. پشتیبانی از Voice Cloning

DramaBox امکان کلون کردن صدا را هم دارد. تنها با حدود ۱۰ ثانیه فایل صوتی مرجع، مدل می‌تواند همان تُن صدا را روی متن جدید پیاده کند. (Resemble AI)

ساخته شده

مرجع

این سه نمونه بهترین نمایش قدرت احساسات و تغییر لحن DramaBox هستند.

لینک مدل در هاگینگ فیس:
مدل DramaBox در Hugging Face

اجرای هوش مصنوعی متن به صدا در ComfyUI

یکی از جذاب‌ترین بخش‌های این پروژه، پشتیبانی از ComfyUI است. نسخه اختصاصی نودهای DramaBox برای ComfyUI منتشر شده و کاربران می‌توانند این مدل را به‌صورت Workflow داخل کامفی اجرا کنند.

پروژه ComfyUI:
ComfyUI-DramaBox GitHub

این قابلیت باعث می‌شود بتوانید DramaBox را کنار ابزارهای ویدیو، انیمیشن و AI Avatar استفاده کنید و خروجی حرفه‌ای تولید کنید.

طبق تجربه کاربران ComfyUI، مدل حتی روی سیستم‌های 16GB VRAM هم قابل اجرا بوده و کیفیت بسیار بالایی ارائه می‌دهد. (Reddit)

تست آنلاین هوش مصنوعی متن به صدا DramaBox بدون نصب

اگر سخت‌افزار قوی ندارید یا فقط می‌خواهید مدل را امتحان کنید، نسخه آنلاین DramaBox داخل Hugging Face Spaces در دسترس قرار گرفته است.

از طریق لینک زیر می‌توانید مستقیم مدل را تست کنید:

تست آنلاین DramaBox در Hugging Face Spaces

تکنولوژی استفاده شده در DramaBox

هوش مصنوعی متن به صدا بر پایه مدل LTX-2.3 ساخته شده و از معماری Diffusion Transformer استفاده می‌کند. همچنین طبق اطلاعات رسمی، این مدل از واترمارک صوتی داخلی هم بهره می‌برد تا فایل‌های تولیدشده قابل شناسایی باشند. (Resemble AI)

ویژگی‌های فنی مهم:

خروجی 48kHz Stereo
پشتیبانی از Stage Direction
کنترل احساسات در متن
Voice Reference
Watermark داخلی
Open Source

چرا DramaBox مهم است؟

اکثر مدل‌های متن به صدا فقط «خواندن متن» را انجام می‌دهند، اما DramaBox تلاش کرده «بازیگری صوتی» را وارد دنیای AI کند.

همین موضوع باعث شده بسیاری از کاربران حوزه AI Voice آن را یکی از هیجان‌انگیزترین پروژه‌های متن‌باز سال 2026 بدانند. (Reddit)

جمع‌بندی

اگر به دنبال یک مدل Open Source حرفه‌ای برای تولید صدای احساسی، دوبله AI، Voice Cloning یا ساخت کاراکترهای صوتی هستید، DramaBox یکی از بهترین پروژه‌های جدید بازار محسوب می‌شود.

پشتیبانی از ComfyUI، تست آنلاین رایگان، کیفیت بالای احساسات و متن‌باز بودن، این پروژه را به گزینه‌ای بسیار جذاب برای تولیدکنندگان محتوا و توسعه‌دهندگان AI تبدیل کرده است.

لینک گیت‌هاب رسمی پروژه:
DramaBox GitHub Repository

DramaBox چیست؟ معرفی هوش مصنوعی متن به صدا متن‌باز با پشتیبانی ComfyUI

هوش مصنوعی متن به صدا DramaBox چیست؟