Open-Source Frontier Voice AI
VibeVoice, açık kaynaklı bir sınır önü sesli yapay zeka projesidir. Bu repo, Microsoft tarafından geliştirilen ve Speech-to-Text (STT) ve Text-to-Speech (TTS) yetenekleri sunan bir çerçeve sağlar. VibeVoice-ASR, 60 dakikalık uzun formlu ses kayıtlarını tek geçişte işleyebilen ve yapılandırılmış transkriptler üreten bir STT modelidir.
🎯 Hedef Kitle: Yapay zeka ve dil işleme alanında çalışan araştırmacılar ve geliştiriciler
Bir dilbilim araştırmacısı, VibeVoice-ASR'yi kullanarak uzun formlu ses kayıtlarını transkribe edebilir ve yapılandırılmış transkriptler oluşturabilir. Ayrıca, VibeVoice-Realtime-0.5B'yi kullanarak gerçek zamanlı sesli geri bildirimler üretebilir.