Microsoft kompaniyasi VALL-E sun'iy intellektini taqdim etdi, u bor-yo'g'i uch soniyalik namunaviy davomiylik asosida har qanday inson ovozini taqlid qila oladi. Shu bilan birga, ovoz juda ishonchli tarzda taqlid qilinadi, bu asl nusxaning tembri va hissiy rangini saqlab qoladi.
Microsoft o'zi VALL-E ni "Neyron kodek tili modeli" deb ataydi. Ishlanma EnCodec texnologiyalariga asoslangan. Ko'pincha to'lqin shakllarini manipulyatsiya qilish orqali nutqni sintez qiladigan matnni o'zgartirishning boshqa usullaridan farqli o'laroq, Microsoft ishlanmasi asosan odam qanday ovoz berishini tahlil qiladi, bu ma'lumotni individual "tokenlar" ga ajratadi va o'quv ma'lumotlaridan ularning "bilimlari" ga moslashish uchun foydalanadi, agar AI agar bu ovoz qanday eshitilsa. boshqa iboralarni aytadi.
VALL-E 7000 dan ortiq odamning 60 000 soatlik ingliz nutqini o'z ichiga olgan LibriLight kutubxonasida o'qitildi.
Google 2018 yilda odamdan deyarli farqlanmaydigan o'zining AI Duplex-ni namoyish qilgan edi, ammo Microsoft rivojlanishining mohiyati sun'iy intellektning o'zida emas, balki uning turli ovozlarga taqlid qilish qobiliyatidadir.
Loyiha veb-saytida har kim ko'rishi mumkin bo'lgan AI ishining ko'plab misollari mavjud.