هوش مصنوعی متن به صدا DramaBox چیست؟
هوش مصنوعی متن به صدا DramaBox یکی از جدیدترین مدلهای Open Source در حوزه Text To Speech یا تبدیل متن به گفتار است که توسط Resemble AI منتشر شده و بهسرعت توجه کاربران حوزه هوش مصنوعی، تولید محتوا و دوبله را جلب کرده است.
برخلاف بسیاری از مدلهای TTS که فقط متن را میخوانند، DramaBox روی «اجرای احساسی صدا» تمرکز دارد. یعنی میتواند خنده، عصبانیت، نجوا، مکث، هیجان و حتی تغییر احساس در طول دیالوگ را شبیهسازی کند. صفحه رسمی DramaBox در Resemble AI
مهمترین ویژگیهای هوش مصنوعی متن به صدا DramaBox
1. تولید صدای احساسی و سینمایی
بزرگترین نقطه قوت DramaBox اجرای طبیعی احساسات است. شما میتوانید داخل پرامپت مشخص کنید که گوینده با چه حسی صحبت کند؛ مثلاً عصبی، آرام، ترسیده یا هیجانزده.
طبق توضیحات رسمی، این مدل برای «Performance Driven TTS» طراحی شده و صرفاً یک موتور خواندن متن نیست. (Resemble AI)
2. پشتیبانی از Voice Cloning
DramaBox امکان کلون کردن صدا را هم دارد. تنها با حدود ۱۰ ثانیه فایل صوتی مرجع، مدل میتواند همان تُن صدا را روی متن جدید پیاده کند. (Resemble AI)
ساخته شده
مرجع
این سه نمونه بهترین نمایش قدرت احساسات و تغییر لحن DramaBox هستند.
لینک مدل در هاگینگ فیس:
مدل DramaBox در Hugging Face
اجرای هوش مصنوعی متن به صدا در ComfyUI
یکی از جذابترین بخشهای این پروژه، پشتیبانی از ComfyUI است. نسخه اختصاصی نودهای DramaBox برای ComfyUI منتشر شده و کاربران میتوانند این مدل را بهصورت Workflow داخل کامفی اجرا کنند.
پروژه ComfyUI:
ComfyUI-DramaBox GitHub
این قابلیت باعث میشود بتوانید DramaBox را کنار ابزارهای ویدیو، انیمیشن و AI Avatar استفاده کنید و خروجی حرفهای تولید کنید.
طبق تجربه کاربران ComfyUI، مدل حتی روی سیستمهای 16GB VRAM هم قابل اجرا بوده و کیفیت بسیار بالایی ارائه میدهد. (Reddit)
تست آنلاین هوش مصنوعی متن به صدا DramaBox بدون نصب
اگر سختافزار قوی ندارید یا فقط میخواهید مدل را امتحان کنید، نسخه آنلاین DramaBox داخل Hugging Face Spaces در دسترس قرار گرفته است.
از طریق لینک زیر میتوانید مستقیم مدل را تست کنید:
تست آنلاین DramaBox در Hugging Face Spaces
تکنولوژی استفاده شده در DramaBox
هوش مصنوعی متن به صدا بر پایه مدل LTX-2.3 ساخته شده و از معماری Diffusion Transformer استفاده میکند. همچنین طبق اطلاعات رسمی، این مدل از واترمارک صوتی داخلی هم بهره میبرد تا فایلهای تولیدشده قابل شناسایی باشند. (Resemble AI)
ویژگیهای فنی مهم:
- خروجی 48kHz Stereo
- پشتیبانی از Stage Direction
- کنترل احساسات در متن
- Voice Reference
- Watermark داخلی
- Open Source
چرا DramaBox مهم است؟
اکثر مدلهای متن به صدا فقط «خواندن متن» را انجام میدهند، اما DramaBox تلاش کرده «بازیگری صوتی» را وارد دنیای AI کند.
همین موضوع باعث شده بسیاری از کاربران حوزه AI Voice آن را یکی از هیجانانگیزترین پروژههای متنباز سال 2026 بدانند. (Reddit)
جمعبندی
اگر به دنبال یک مدل Open Source حرفهای برای تولید صدای احساسی، دوبله AI، Voice Cloning یا ساخت کاراکترهای صوتی هستید، DramaBox یکی از بهترین پروژههای جدید بازار محسوب میشود.
پشتیبانی از ComfyUI، تست آنلاین رایگان، کیفیت بالای احساسات و متنباز بودن، این پروژه را به گزینهای بسیار جذاب برای تولیدکنندگان محتوا و توسعهدهندگان AI تبدیل کرده است.
لینک گیتهاب رسمی پروژه:
DramaBox GitHub Repository