کمیته رکن چهارم – پلتفرم Podcastle که در زمینه ضبط و ویرایش پادکست فعالیت دارد، مدل جدید هوش مصنوعی Asyncflow v1.0 را برای تبدیل متن به گفتار (TTS) عرضه کرد. این مدل ۴۵۰ صدای مختلف هوش مصنوعی را برای تولید محتوای صوتی ارائه میدهد.

به گزارش کمیته رکن چهارم، Podcastle همچنین API مخصوص توسعهدهندگان را منتشر کرده تا مدل TTS آن را در اپلیکیشنهای مختلف ادغام کنند. این شرکت با ارائه هزینههای رقابتیتر نسبت به رقبا، وارد رقابت با استارتاپهایی مانند ElevenLabs، Speechify و WellSaid شده است.
ویژگیهای مدل جدید:
- ۴۵۰ صدای مختلف برای روایت متن
- هزینه کمتر نسبت به رقبا (۴۰ دلار برای ۵۰۰ دقیقه)
- ارتقای قابلیت تقلید صدا (Voice Cloning) تنها با چند ثانیه ضبط صوتی
آرتو یریتسیان، بنیانگذار Podcastle، اعلام کرد که این شرکت با بهرهگیری از پیشرفتهای اخیر در هوش مصنوعی، موفق به توسعه مدلی کمهزینه و باکیفیت برای تبدیل متن به گفتار شده است. او همچنین اشاره کرد که Podcastle در حال گسترش قابلیتهای ویدیویی خود است و بهسرعت به یک پلتفرم جامع برای تولید محتوا تبدیل میشود.
