Mona Liza danışdı – VİDEObackend

Alimlər rəsmlərdə təsvir edilən şəxsi rahatlıqla danışdıra bilən alət yaradıblar.

Alibaba Qrupunun İntellektual Hesablama İnstitutunun tədqiqatçıları Emote Portrait Alive adlı yeni süni intellekt tətbiqini fəaliyyətdə göstəriblər. Proqram insanın üzünün bir şəklini və danışan və ya oxuyan birinin soundtrackini çəkir, onları birləşdirərək fotonun animasiya versiyasını hazırlayır. Onun üzərində təsvir olunan şəxs və ya personaj oxuya və hər şeyi deyə bilər, TechXplore yazıb.

Adi fotoşəkilləri animasiya şəkillərinə çevirə bilən süni intellekt alətləri artıq yaradılıb. Yeni layihədə Alibaba komandası səs əlavə edərək daha da irəli gedib. Alimlər 3D modellərdən və ya üz işarələrindən istifadə etməyiblər. Əvəzində, audio və ya video faylların böyük verilənlər bazasında süni intellekt təliminə əsaslanan diffuziya modelləşdirməsindən istifadə etdilər. Tətbiqi yaratmaq üçün təxminən 250 saat belə məlumat lazım idi.

Audio siqnalı birbaşa video çərçivələrə çevirməklə tədqiqatçılar insan üzünün incə jestlərini, nitq nümunələrini və animasiya edilmiş sifətin insan olduğunu müəyyən edən digər xüsusiyyətləri tutan proqram yaratdılar. Video söz və cümlələri ifadə edərkən ağızın ehtimal olunan formasını, həmçinin uyğun üz ifadələrini dəqiq şəkildə yenidən yaradır.

Alimlər alətin kifayət qədər dəqiq işini nümayiş etdirən bir neçə video yayımlayıblar. Tərtibatçılar əmindirlər ki, onların tətbiqi realizm və ifadəlilik baxımından digər həllərdən üstündür. Hazır videonun uzunluğu orijinal audio trekin uzunluğu ilə müəyyən edilir.

Komanda texnologiyadan qeyri-etik istifadənin qarşısını almaq üçün belə bir tətbiqin məhdudlaşdırılması və nəzarət edilməsinin lazım olduğunu başa düşür.

Bununla belə, AI-nin sürətli inkişafını dayandırmaq olmaz. Bir müddət əvvəl ChatGPT-nin arxasında duran OpenAI şirkəti yeni neyron şəbəkəsini elan etmişdi. O, həmçinin mətn sorğuları ilə işləyir, lakin real videolarla cavab verir.

Mənbə: mail.ru

Aynur Camal