Yapay zeka çılgınlığı Microsoft ayrıca katılıyorum Microsoft araştırmacıları, üç saniyelik bir ses örneği verildiğinde bir kişinin sesini simüle edebilen yapay zeka projesini duyurdu. VAL-E Yeni “metinden konuşmaya yapay zeka” modeli, EnCodec adlı bir teknolojiye dayanıyor.
Microsoft Vall-E Yapay Zeka Nedir?
Microsoft, bir kişinin sesini yalnızca üç saniyelik bir ses örneğiyle taklit edebilen yapay zeka tabanlı modelini piyasaya sürdü. ilan edildi. Dalga biçimlerini değiştirerek konuşmayı sentezleyen diğer yöntemlerin aksine, VALL-E bir kişinin çıkardığı sesi analiz edebilir. Bu bilgileri bileşenlere ayıran model, eğitim verilerini kullanarak o sesten “codec” bilgisini çıkarabilmektedir.

Microsoft, VALL-E’nin konuşma sentezi yeteneklerini Meta tarafından oluşturulan halka açık sesli kitaplarla geliştirdiğini söyledi. 7.000’den fazla konuşmacıdan 60.000 saatlik İngilizce materyal içeren LibriLight adlı bir ses kitaplığı kullandı.
VALL-E, önceden tasarlanmış ön ayarlı sesler olmadan çalışabilir ve analiz yoluyla öğrenebilir. Yani daha önce hiç duymadığı kelimeleri bile öğrenebilir. Microsoft’un yapay zeka modelihenüz kamuoyuna açıklanmadı.
Şirket, başta güvenlik olmak üzere birçok alanda önlem almayı ihmal etmedi. Birinin sesini taklit etmek veya belirli bir konuşmacıyı taklit etmek gibi durumlar için bir algılama modeli üzerinde çalıştığını belirtti.

Apple ise kitapların sesli olmasını sağlayan yapay zeka modelini daha önce duyurmuştu. Apple Books, yapay zeka ve konuşma sentezi modelini kullanarak birçok kitabı sesli hale getirmeyi planlıyor.
Bu konu hakkında ne düşünüyorsun? Fikirlerinizi yorum kısmından bizlerle paylaşabilirsiniz.
Contents