
Google-ის AI მკვლევარებმა წარმოადგინეს ახალი, ულტრა-ეფექტური AI მეხსიერების კომპრესიის ალგორითმი სახელად TurboQuant. ინტერნეტ სივრცეში მას უკვე ადარებენ HBO-ს პოპულარული სერიალის, Silicon Valley-ის გამოგონილ სტარტაპ Pied Piper-ს.
სერიალში Pied Piper-ის მთავარი მიღწევა იყო კომპრესიის ალგორითმი, რომელიც ფაილის ზომას ხარისხის დაკარგვის გარეშე ამცირებდა. Google Research-ის TurboQuant სწორედ მსგავს ექსტრემალურ კომპრესიას გვთავაზობს, რომელიც AI სისტემების მთავარ შეფერხებას აგვარებს.
მკვლევარების თქმით, ეს ტექნოლოგია AI-ის სამუშაო მეხსიერებას ამცირებს ისე, რომ მის წარმადობაზე უარყოფითად არ მოქმედებს. კომპრესიის მეთოდი იყენებს ვექტორულ კვანტიზაციას AI პროცესინგში ქეშის პრობლემების მოსაგვარებლად. შედეგად, AI მეტ ინფორმაციას იმახსოვრებს, ნაკლებ სივრცეს იკავებს და სიზუსტეს ინარჩუნებს.
Google ამ აღმოჩენას ICLR 2026 კონფერენციაზე წარადგენს ორ მეთოდთან ერთად, რომლებიც ამ კომპრესიას შესაძლებელს ხდის: კვანტიზაციის მეთოდი PolarQuant და ტრენინგისა და ოპტიმიზაციის მეთოდი QJL.
თუ TurboQuant რეალურ სამყაროში წარმატებით დაინერგება, ის AI-ის ოპერირებას მნიშვნელოვნად გააიაფებს, რადგან მისი გაშვებისას საჭირო სამუშაო მეხსიერება (KV cache) მინიმუმ 6-ჯერ შემცირდება. Cloudflare-ის CEO, Matthew Prince, ამ ფაქტს Google-ის DeepSeek მომენტსაც უწოდებს, რაც ჩინური AI მოდელის ეფექტურობის ზრდასა და ხარჯების შემცირებას უკავშირდება.
თუმცა, აღსანიშნავია, რომ TurboQuant ჯერ კიდევ ლაბორატორიულ ეტაპზეა და ფართოდ არ დანერგილა. ის ძირითადად inference მეხსიერებაზე ფოკუსირდება და არა ტრენინგზე, რომელსაც კვლავ უზარმაზარი რაოდენობის RAM სჭირდება.
წყარო: techcrunch.com







