Luma-dan yaradıcı çalışmaları yürütmək üçün nəzərdə tutulmuş agent yanaşması: Luma Agents
Yapay zəka video istehsalına fokuslanan Luma, Luma Agents-ı bazara təqdim etdi. Luma Agents, mətn, görüntü, video və səs sahələrində uçdan uca yaradıcı işləri həyata keçirmək üçün nəzərdə tutulmuşdur. Unified Intelligence model ailəsi tərəfindən dəstəklənən Luma Agents, reklam agentlikləri, marketinq komandaları, dizayn studiyaları və müəssisələr üçün yeni bir iş metodu kimi təqdim edilir.
Uni-1-in detalları

Luma-nın agentlərinin Unified Intelligence süni zəka modelləri ailəsinin ilk nümayəndəsi olan Uni-1 modeli üzərində qurulduğunu qeyd edək. Uni-1-in səs, video, görüntü, dil və məkan düşüncəsi sahələrində təlim olunduğunu da əlavə etmək faydalıdır. Google-un Nano Banana Pro və OpenAI-nin GPT Image 1.5 modelləri kimi, Uni-1 də otoreqressiv transformator üzərində qurulmuşdur. Bu kontekstdə Uni-1, ənənəvi difuziya modellərinin etdiyi kimi səs-küydən görüntüləri çıxarmaq əvəzinə, məzmunu ardıcıl olaraq token-token yaradan bir süni zəka modeli kimi qarşıya çıxır. Qısacası, mətn və görüntülər eyni emal prosesini paylaşır.
Luma-nın bildirdiyinə görə model, yaradılmadan əvvəl və zamanı əmrləri analiz edərək mürəkkəb təlimatları parçalara ayırıb səhnələri planlaya bilir. Bu yanaşmanın adətən daha dəqiq əmrlərin izlənməsi ilə nəticələndiyini qeyd edək. Bu çərçivədə Uni-1, bir neçə fotoşəkili alıb tamamilə yeni bir kompozisiya şəklində birləşdirə bilər.
Luma-nın paylaşdığı məlumatlara görə Uni-1, məntiqə əsaslanan görüntü emalı üçün RISEBench testində ən yüksək balı alıb. Hətta model, Nano Banana 2 və GPT Image 1.5-i az fərqlə geridə qoyub. Görüntü istehsal etmə qabiliyyətinin də modelin vizual anlayışını gücləndirdiyini qeyd edək. Obje tanıma sahəsində Google-un Gemini 3 Pro-suna demək olar ki, bərabər bir performans nümayiş etdirən model, bir neçə dili dəstəkləyir.
Luma Agents nələr təqdim edir?
Luma-nın bildirdiyinə görə agentlər, süni zəka modelləri ilə koordinasiya şəklində mətn, görüntü, video və səs planlaşdırma və istehsal etmə qabiliyyətinə malikdir. Agentlərin istifadə etdiyi modellər arasında Luma-nın Ray 3.14, Google-un Veo 3 və Nano Banana Pro, ByteDance-ın Seedream və ElevenLabs-ın səs modelləri yer alır.
Luma-nın CEO-su və qurucu ortağı Amit Jain-in qeyd etdiyinə görə Luma Agents-ı fərqləndirən cəhət, bir görüntü və ya fikir üzərində hər iterasiya üçün irəliləyib geri əmrlər verməyə ehtiyac olmamasıdır. Bunun əvəzinə sistem, geniş varyasiya dəstləri yaradır və istifadəçilərin danışıq yolu ilə istiqaməti müəyyən etmələrinə imkan tanıyır.
Jain-in dediklərinə görə Luma Ajanları, varlıqlar, iş ortaqları və yaradıcı iterasiyalar arasında daimi olaraq konteksti qoruyub saxlayır. Agentlər çıxışları qiymətləndirib yaxşılaşdıra bilərkən, iterativ bir öz-özünə tənqid yolu ilə öz nəticələrini inkişaf etdirə bilir.
Luma, qlobal reklam agentlikləri Publicis Groupe və Serviceplan-ın yanı sıra Adidas, Mazda və Səudiyyə AI şirkəti Humain kimi markalar da daxil olmaqla mövcud müştəriləri ilə yeni agent platformasını istifadə etməyə başlayıb. İstifadə nümunələri olaraq 200 sözlük bir xülasə və bir məhsul görüntüsü, sistemin bir reklam kampaniyası üçün bir-birindən fərqli mövzular, modellər və rəng sxemləri üçün müxtəlif ideyalar istehsal etməsini təmin edə bilir. Jain-in dediklərinə görə Luma Agents, bir markanın 15 milyon dollarlıq, bir illik reklam kampaniyasını 40 saat ərzində 20 min dolların altında bir xərclə müxtəlif ölkələr üçün çox sayda yerelleşdirilmiş reklama çevirdi. Üstəlik, bu proses həm markanın daxili keyfiyyət yoxlamalarından, həm də dəqiqlik yoxlamalarından keçdi.
Luma Agents hazırda API vasitəsilə istifadəyə açıqdır. Luma gələcəkdə Luma Agents-ı tədricən daha çox istifadəçiyə açmağı planlaşdırır.







