
შონ შენის (Shawn Shen) აზრით, AI-ს დასჭირდება დაიმახსოვროს ის, რასაც ხედავს, რათა ფიზიკურ სამყაროში წარმატებას მიაღწიოს. შენის კომპანია Memories.ai იყენებს Nvidia AI ინსტრუმენტებს ისეთი ინფრასტრუქტურის შესაქმნელად, რომელიც wearables-სა და რობოტიკას ვიზუალური მოგონებების დამახსოვრებისა და გახსენების შესაძლებლობას მისცემს.
Memories.ai-მ ორშაბათს GTC კონფერენციაზე ნახევარგამტარების გიგანტ Nvidia-სთან თანამშრომლობის შესახებ განაცხადა. ამ პარტნიორობის ფარგლებში, Memories.ai იყენებს Nvidia-ს Cosmos-Reason 2-ს (reasoning vision language model) და Nvidia Metropolis-ს (ვიდეო ძიებისა და შეჯამების აპლიკაცია) თავისი ვიზუალური მეხსიერების ტექნოლოგიის განვითარებისთვის.
შენმა TechCrunch-ს განუცხადა, რომ მას და მის თანადამფუძნებელსა და CTO-ს, ბენ ჟოუს (Ben Zhou), კომპანიის შექმნის იდეა Meta-ს Ray-Ban სათვალეების უკან მდგარი AI სისტემის შექმნისას გაუჩნდათ. AI სათვალეების შექმნამ ისინი დააფიქრა იმაზე, თუ როგორ გამოიყენებდნენ ადამიანები ამ ტექნოლოგიას რეალურ ცხოვრებაში, თუ მომხმარებლები ვერ შეძლებდნენ იმ ვიდეო მონაცემების გახსენებას, რომლებსაც იწერდნენ.
მათ დაიწყეს ძიება, რათა ენახათ, ქმნიდა თუ არა ვინმე მსგავსი ტიპის ვიზუალური მეხსიერების გადაწყვეტას AI-სთვის. როდესაც ვერავინ იპოვეს, გადაწყვიტეს Meta-დან წამოსულიყვნენ და ის თავად შეექმნათ.
"AI უკვე ძალიან კარგად მუშაობს ციფრულ სამყაროში. მაგრამ რა ხდება ფიზიკურ სამყაროში?" - თქვა შენმა. "AI wearables-სა და რობოტიკასაც სჭირდებათ მეხსიერება... საბოლოო ჯამში, აუცილებელია, რომ AI-ს ჰქონდეს ვიზუალური მეხსიერება. ჩვენ გვჯერა ამ მომავლის."
ზოგადად, AI სისტემების დამახსოვრების უნარი შედარებით ახალია. OpenAI-მ ChatGPT განაახლა, რათა 2024 წელს წარსული ჩატების დამახსოვრება დაეწყო და ეს ფუნქცია 2025 წელს დახვეწა. ელონ მასკის xAI-მ და Google Gemini-მ ასევე გამოუშვეს თავიანთი მეხსიერების ინსტრუმენტები ბოლო ორი წლის განმავლობაში.
მაგრამ ეს მიღწევები დიდწილად ორიენტირებული იყო ტექსტურ მეხსიერებაზე, თქვა შენმა. ტექსტური მეხსიერება ბევრად უფრო სტრუქტურირებულია და მისი ინდექსირება უფრო ადვილია, მაგრამ ის არ არის საკმარისად სასარგებლო ფიზიკური AI აპლიკაციებისთვის, რომლებიც სამყაროსთან ძირითადად მხედველობისა და ვიზუალის საშუალებით ურთიერთქმედებენ.
Memories.ai 2024 წელს ამოქმედდა და ამ დრომდე 16 მილიონი დოლარი მოიზიდა (8 მილიონი დოლარი seed რაუნდში 2025 წლის ივლისში და 8 მილიონი დოლარის ექსტენცია). რაუნდს ლიდერობდა Susa Ventures და მასში ასევე მონაწილეობდნენ Seedcamp, Fusion Fund, Crane Venture Partners და სხვები.
შენის თქმით, ამ ვიზუალური მეხსიერების ფენის წარმატებით შექმნას ორი რამ სჭირდებოდა: ინფრასტრუქტურის აშენება, რომელიც აუცილებელია ვიდეოების დასანერგად და ინდექსირებისთვის ისეთ მონაცემთა ფორმატში, რომლის შენახვა და გახსენებაც შესაძლებელია, და მოდელის სავარჯიშოდ საჭირო მონაცემების შეგროვება.
კომპანიამ თავისი დიდი ვიზუალური მეხსიერების მოდელი (large visual memory model - LVMM) 2025 წლის ივლისში გამოუშვა. შენმა თქვა, რომ ის შეიძლება შევადაროთ Gemini Embedding 2-ის (მულტიმოდალური ინდექსირებისა და მოძიების მოდელი) მცირე ვერსიას, რომელიც ამ თვის დასაწყისში გამოვიდა.
მონაცემთა შეგროვებისთვის, კომპანიამ შექმნა LUCI, აპარატურული მოწყობილობა, რომელსაც კომპანიის "მონაცემთა შემგროვებლები" ატარებენ და რომელიც იწერს ვიდეოს მოდელის სავარჯიშოდ. შენის თქმით, ისინი არ გეგმავენ გახდნენ hardware კომპანია, ან გაყიდონ ეს მოწყობილობები, არამედ მათ შექმნეს საკუთარი, რადგან არ იყვნენ კმაყოფილი სტანდარტული ვიდეო ჩამწერებით, რომლებიც ფოკუსირებული იყო მაღალ გარჩევადობასა და ბატარეის სწრაფად მწოველ ვიდეო ფორმატებზე.
კომპანიამ გამოუშვა ამ LVMM-ის მეორე თაობა და ხელი მოაწერა პარტნიორობას Qualcomm-თან, რათა მიმდინარე წლის ბოლოდან Qualcomm-ის პროცესორებზე იმუშაოს.
Memories.ai ასევე მუშაობს ზოგიერთ მსხვილ wearable კომპანიასთან, თქვა შენმა, თუმცა უარი თქვა მათი ვინაობის გამჟღავნებაზე. მიუხედავად იმისა, რომ ახლა გარკვეული მოთხოვნა არსებობს, შენი ხედავს კიდევ უფრო დიდ შესაძლებლობებს wearables-სა და რობოტიკაში, რომელიც მომავალში გამოჩნდება.
„კომერციალიზაციის თვალსაზრისით, ჩვენ უფრო მეტად ფოკუსირებული ვართ მოდელსა და ინფრასტრუქტურაზე, რადგან საბოლოო ჯამში ვფიქრობთ, რომ wearables და რობოტიკის ბაზარი განვითარდება, უბრალოდ, შესაძლოა ეს ახლავე არ მოხდეს,“ - განაცხადა შენმა.
წყარო: techcrunch.com



