ElevenLabs CEO-su: Süni İntellekt (Sİ) Audio Modelləri Zamanla Əmtəələşəcək

29.10.2025 17:10 6 baxış sayı 4 dəq. oxuma TechCrunch
ElevenLabs CEO-su: Süni İntellekt (Sİ) Audio Modelləri Zamanla Əmtəələşəcək

Süni İntellekt (Sİ) audio şirkəti olan ElevenLabs-ın həmtəsisçisi və baş icraçı direktoru Mati Staniszewski, Sİ modellərinin zaman keçdikcə standartlaşacağına və ya "əmtəələşəcəyinə" inanır. Bu, hazırda əsas diqqəti məhz bu modellərin yaradılması üzərində cəmləyən bir şirkətin rəhbərinin olduqca açıq şərhidir. Staniszewski bu fikirləri çərşənbə axşamı "TechCrunch Disrupt 2025" konfransında çıxışı zamanı səsləndirib.


ElevenLabs-ın qurucusu konfransda Sİ audio sahəsinə dair həm yaxın, həm də uzaq perspektivli baxışlarını bölüşdü. Staniszewski qeyd etdi ki, şirkətin tədqiqatçıları model arxitekturası ilə bağlı bəzi əsas çətinlikləri aradan qaldıra biliblər. O, bu cür fundamental məsələlərə diqqətin yaxın bir-iki il ərzində audio sahəsində davam edəcəyini vurğuladı. Lakin onun proqnozuna görə, uzunmüddətli perspektivdə bu texnologiya əmtəələşəcəyini- yəni daha adi və geniş yayılmış hala gələcək. CEO əlavə etdi ki, bəzi səslər və dillər arasında keyfiyyət fərqləri qalsa da, ümumilikdə modellər arasındakı fərqlər getdikcə azalacaq.


Bəs Staniszewski bu modellərin zamanla standartlaşacağına inanırsa, niyə ElevenLabs onların qurulmasına bu qədər enerji sərf edir? CEO izah etdi ki, qısa müddət üçün model quruculuğu hələ də "bugünkü ən böyük üstünlükdür və böyük irəliləyişə səbəb olur." Məsələn, əgər Sİ tərəfindən yaradılan səslər və ya qarşılıqlı əlaqələr keyfiyyətsizdirsə, bu, istifadəçilər üçün ciddi bir problem olaraq qalır. Onun sözlərinə görə, bu keyfiyyət məsələsini həll etməyin yeganə yolu modelləri hazırda şirkətin özünün hazırlamasıdır. Baxmayaraq ki, o, uzunmüddətli perspektivdə digər oyunçuların da bu problemin həllini tapa biləcəyini düşünür. O, etibarlı və miqyaslana bilən istifadə ssenariləri axtaran istifadəçilərin fərqli məqsədlər üçün hələ də müxtəlif modellərdən istifadə edəcəyini də qeyd etdi.


Staniszewski yaxın bir-iki ildə Sİ sahəsində yeni bir tendensiyanın yaranacağını proqnozlaşdırır: modellərin multimodal yanaşmalar və ya birləşdirilmiş sistemlərə keçidi sürətlənəcək. Bu, eyni anda həm səs, həm də video yaratmaq, yaxud söhbət zamanı səs və Böyük Dil Modellərini (LLM) birləşdirmək deməkdir. O, bu cür birləşmələrin nə qədər güclü nəticələr verə biləcəyinə misal olaraq Google-un "Veo 3" layihəsini göstərdi. ElevenLabs-ın gələcək planı öz audio təcrübəsini digər modellərin bilikləri ilə birləşdirmək üçün açıq mənbəli texnologiyalar və başqa şirkətlərlə əməkdaşlıq üzərində işləməkdir. Şirkətin məqsədi uzunmüddətli dəyər yaratmaq üçün həm model quruculuğuna, həm də tətbiqlərə fokuslanmaqdır. CEO, "Necə ki, proqram təminatı və avadanlıq Apple üçün sehrli bir birləşmə idi, biz də düşünürük ki, məhsul (proqram) və Sİ, ən yaxşı istifadə ssenariləri nəsli üçün sehrli birləşmə olacaq," deyərək sözlərini tamamladı.


Texnologiya redaktoru

Texnologiya sahəsində 8 ildir yazıram. Bakıda keçirilən ilk startap müsabiqələrinin birində iştirak edib, o vaxtdan bu mövzuya marağım daha da artıb....

Bütün məqalələrə baxın
Paylaş: