پلتفرم Podcastle مدل جدید تبدیل متن به گفتار را معرفی کرد

کمیته رکن چهارم – پلتفرم Podcastle که در زمینه ضبط و ویرایش پادکست فعالیت دارد، مدل جدید هوش مصنوعی Asyncflow v1.0 را برای تبدیل متن به گفتار (TTS) عرضه کرد. این مدل ۴۵۰ صدای مختلف هوش مصنوعی را برای تولید محتوای صوتی ارائه می‌دهد.

به گزارش کمیته رکن چهارم، Podcastle همچنین API مخصوص توسعه‌دهندگان را منتشر کرده تا مدل TTS آن را در اپلیکیشن‌های مختلف ادغام کنند. این شرکت با ارائه هزینه‌های رقابتی‌تر نسبت به رقبا، وارد رقابت با استارتاپ‌هایی مانند ElevenLabs، Speechify و WellSaid شده است.

ویژگی‌های مدل جدید:

  • ۴۵۰ صدای مختلف برای روایت متن
  • هزینه کمتر نسبت به رقبا (۴۰ دلار برای ۵۰۰ دقیقه)
  • ارتقای قابلیت تقلید صدا (Voice Cloning) تنها با چند ثانیه ضبط صوتی

آرتو یریتسیان، بنیان‌گذار Podcastle، اعلام کرد که این شرکت با بهره‌گیری از پیشرفت‌های اخیر در هوش مصنوعی، موفق به توسعه مدلی کم‌هزینه و باکیفیت برای تبدیل متن به گفتار شده است. او همچنین اشاره کرد که Podcastle در حال گسترش قابلیت‌های ویدیویی خود است و به‌سرعت به یک پلتفرم جامع برای تولید محتوا تبدیل می‌شود.

درباره نویسنده

پست های مرتبط

پاسخ دهید


خبرگزاری هرانا

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *


Type The Green Captcha Characters Below.