
Microsoft AI-მ ხუთშაბათს სამი ახალი საბაზისო AI მოდელის გამოშვება დააანონსა, რომლებსაც ტექსტის, ხმისა და გამოსახულების გენერირება შეუძლიათ.
ეს ნაბიჯი ხაზს უსვამს Microsoft-ის სტრატეგიას, შექმნას საკუთარი მულტიმოდალური AI მოდელების ეკოსისტემა და გაუწიოს კონკურენცია სხვა წამყვან AI ლაბორატორიებს, მიუხედავად იმისა, რომ იგი კვლავ მჭიდროდ არის დაკავშირებული OpenAI-სთან.
კომპანიის პრესრელიზის თანახმად, MAI-Transcribe-1 მეტყველებას 25 სხვადასხვა ენაზე გარდაქმნის ტექსტად და 2.5-ჯერ უფრო სწრაფია, ვიდრე Microsoft-ის Azure Fast. MAI-Voice-1 არის აუდიოგენერირების მოდელი, რომელიც წამში 60 წამის ხანგრძლივობის აუდიოს ქმნის და მომხმარებლებს პერსონალური ხმის შექმნის საშუალებას აძლევს. MAI-Image-2 კი ვიდეოგენერირების მოდელია.
ახლა უკვე სამივე მოდელი ხელმისაწვდომია Microsoft Foundry-ზე, ხოლო ტრანსკრიფციისა და ხმის მოდელების გამოყენება MAI Playground-ზეცაა შესაძლებელი.
მოდელები შეიქმნა Microsoft-ის MAI Superintelligence გუნდის მიერ, რომელსაც ხელმძღვანელობს Microsoft AI-ს აღმასრულებელი დირექტორი, Mustafa Suleyman.
"ჩვენ ვქმნით ჰუმანისტურ AI-ს. მოდელების შექმნისას გვაქვს მკაფიო ხედვა — დავაყენოთ ადამიანი ცენტრში, მოვახდინოთ ოპტიმიზაცია იმის მიხედვით, თუ როგორ ურთიერთობენ ადამიანები რეალურად და გავწვრთნათ ისინი პრაქტიკული გამოყენებისთვის," — წერს Suleyman თავის ბლოგპოსტში.
გაჯერებულ LLM ბაზარზე, MAI-ს მთავარი კონკურენტული უპირატესობა დაბალი ფასებია — ისინი Google-ისა და OpenAI-ს მოდელებზე იაფია. MAI-Transcribe-1-ის ფასი საათში $0.36-დან იწყება, MAI-Voice-1 — $22-დან 1 მილიონ სიმბოლოზე, ხოლო MAI-Image-2-ის ფასი ტექსტური შენატანისთვის $5-ია 1 მილიონ ტოკენზე, გამოსახულების გენერირებისთვის კი — $33 (1 მილიონ ტოკენზე).
საკუთარი მოდელების გამოშვების მიუხედავად, Suleyman-მა დაადასტურა Microsoft-ის ვალდებულება OpenAI-სთან პარტნიორობის მიმართ. კომპანიას 13 მილიარდ დოლარზე მეტი აქვს ინვესტირებული ამ AI ლაბორატორიაში და მათ მოდელებს საკუთარ პროდუქტებში იყენებს. Microsoft ანალოგიურ მიდგომას იყენებს ჩიპებთან დაკავშირებითაც: ის როგორც თავად აწარმოებს მათ, ისე გარე მომწოდებლებისგან ყიდულობს.
წყარო: techcrunch.com







