
ბოლო პერიოდში Pixel 10 Pro-სა და Galaxy S26 Ultra-ზე Gemini-ს ამოცანების ავტომატიზაციის ახალ ფუნქციას ვტესტავდი, რომელიც პირველად აძლევს Gemini-ს საშუალებას, მართვის სადავეები აიღოს და აპლიკაციები თქვენ მაგივრად გამოიყენოს. ამჟამად ის მხოლოდ მცირე რაოდენობის სერვისებზეა (ძირითადად საკვების გამოძახების და ტრანსპორტირების აპლიკაციებზე) ხელმისაწვდომი და ჯერ ისევ ბეტა რეჟიმშია. ის ნელია, ხანდახან მოუქნელი და ტელეფონის გამოყენებისას არსებულ არცერთ სერიოზულ პრობლემას არ ჭრის. თუმცა, ის ნამდვილად შთამბეჭდავია და გადაჭარბებული არ იქნება თუ ვიტყვით, რომ ეს მომავლის ნათელი მაგალითია. წინ ჯერ კიდევ დიდი გზა გვაქვს, მაგრამ ეს არის პირველი შემთხვევა, როდესაც ტელეფონში ნამდვილი AI ასისტენტის რეალური მუშაობა ვიხილე და არა კონტროლირებად დემო ვერსიებში ან პრეზენტაციებზე.
პირველ რიგში: Gemini ბევრად უფრო ნელია ტელეფონის გამოყენებისას, ვიდრე თქვენ, ან თითქმის ნებისმიერი სხვა ადამიანი. თუ ახლავე გჭირდებათ Uber-ის გამოძახება, ამ საქმისთვის საუკეთესო კანდიდატი თავად ხართ. თუმცა, სანამ ამ ფუნქციაზე უარს იტყვით, გახსოვდეთ, რომ ამოცანების ავტომატიზაცია შექმნილია background (ფონურ) რეჟიმში სამუშაოდ, სანამ ტელეფონში სხვა საქმეს აკეთებთ. კიდევ უკეთესი, ის აგრძელებს მუშაობას მაშინაც კი, როდესაც ტელეფონს არ უყურებთ, ასე რომ შეგიძლიათ სხვა მნიშვნელოვან დეტალებზე გადაიტანოთ ყურადღება.
მაგრამ, თუ ჩემსავით ცნობისმოყვარე ხართ, შეგიძლიათ მთელ პროცესს თვალი ადევნოთ. მუშაობისას ეკრანის ბოლოში ჩნდება ტექსტი, რომელიც მიუთითებს რას აკეთებს Gemini მოცემულ მომენტში. მაგალითად: "კომბოსთვის Chicken Teriyaki-ს მეორე პორციის არჩევა", რაც მან მაშინ გააკეთა, როცა შაბათ საღამოს ვახშმის შეკვეთა დავავალე. პროცესზე დაკვირვება, თუ როგორ აგვარებს Gemini პრობლემებს რეალურ დროში, მართლაც საინტერესოა. მე ქათმის კომბო მენიუ მოვითხოვე; აპლიკაციაში არჩევანი ნახევარი პორციის ინკრემენტებით იყო წარმოდგენილი, ამიტომ მან სწორად დაამატა ქათმის ორი ნახევარი ულუფა.
ალბათ უკეთესია, რომ ავტომატიზაციის დაწყებისას, ნაგულისხმევი (default) ქცევით პროცესი ფონურ რეჟიმში მიმდინარეობს. თუ გსურთ დააკვირდეთ როგორ ასრულებს Gemini დავალებას, ცალკე ღილაკზე დაჭერა და სხვა ფანჯრის გახსნა მოგიწევთ. და ეს შეიძლება საკმაოდ გამაღიზიანებელიც იყოს. როდესაც უყურებთ, როგორ ცდილობს კომპიუტერი Uber Eats-ის მენიუში მწვანილის გარნირის პოვნას, მაშინ როცა ის ეკრანის თავშივეა, ჰგავს საშინელებათა ფილმის ყურებას, როცა იცით, რომ მკვლელი მთავარი გმირის გვერდითაა. Gemini-მ რამდენიმე არასწორი ნაბიჯი გადადგა ჩემი შეკვეთისას, თუმცა საბოლოოდ თავადვე გაერკვა სიტუაციაში. მიუხედავად ამისა, მთლიან პროცესს დაახლოებით ცხრა წუთი დასჭირდა, რაც ნამდვილად არ არის იდეალური შედეგი.
წესით, Gemini-მ თქვენი დავალება ზუსტად იმ ეტაპამდე უნდა მიიყვანოს, სანამ მანქანის ან ვახშმის საბოლოო დადასტურებისა და შეკვეთის ღილაკს დააჭერთ, რათა მისი ნამუშევრის გადამოწმება შეძლოთ. ვფიქრობ, ამჟამად ეს ფუნქციის გამოყენების ერთადერთი ლოგიკური გზაა. ბოლო ხუთი დღის განმავლობაში ჩატარებულ ტესტებში, არ ყოფილა შემთხვევა, რომ მას თვითნებურად დაესრულებინოს შეკვეთა. ის საოცრად ზუსტია; საბოლოო შეკვეთაში ძალიან მცირე შესწორებების შეტანა დამჭირდა. თუ ის ვერ ასრულებს ამოცანას — რაც რამდენჯერმე მოხდა — ეს ძირითადად პირველი ერთი ან ორი წუთის განმავლობაში ხდება, როცა აპლიკაციას ჩემი ჩართულობა სჭირდება, მაგალითად: ლოკაციის გამოყენებაზე ნებართვის გაცემა. ასეთ შემთხვევებში პრობლემის მოგვარება თავად მიწევდა, მაგრამ ამის შემდეგ ავტომატიზაციის გადატვირთვა უპრობლემოდ შემეძლო.
მაგრამ ის, რამაც ნამდვილად გამაოცა, შემდეგია: კალენდარში მომდევნო დღეს სან-ფრანცისკოში ფრენის ივენთი დავამატე. Gemini-ს მივეცი ზოგადი დავალება (prompt), დაეჯავშნა Uber, რომელიც აეროპორტში ხვალინდელი ფრენისთვის დროულად მიმიყვანდა. რადგან Gemini-ს ჩემს ელფოსტასა და კალენდარზე წვდომა აქვს, მას შეუძლია ამ ინფორმაციის მოძიება. მართალია, მას მცირე დამატებითი მითითება დასჭირდა, მაგრამ მან იპოვა ფრენის ინფორმაცია, შემომთავაზა სახლიდან 11:30 ან 11:45 საათზე გასვლა და მკითხა, მსურდა თუ არა რომელიმე ამ დროისთვის მგზავრობის დაჯავშნა. დრო დავადასტურე და მან დაახლოებით სამ წუთში დაასრულა პროცესი, ჩემი მხრიდან ყოველგვარი დამატებითი ჩართულობის გარეშე.
ეს კიდევ უფრო შთამბეჭდავია, თუ გავითვალისწინებთ, რომ Uber მგზავრობის წინასწარ დაგეგმვას პირდაპირ რეზერვაციას უწოდებს. სწორედ ეს არის მთავარი განსხვავება ძველ ციფრულ ასისტენტებსა და ახალ AI ასისტენტებს შორის. კომპიუტერთან ბუნებრივი ენით საუბრის შესაძლებლობა დიდ სხვაობას იძლევა. თუ კომპიუტერი დაიბნევა და დაზუსტებას მოგთხოვთ მაშინ, როცა დაგავიწყდებათ კონკრეტული ტერმინის ხსენება, მაშინ ის არც ისე სასარგებლოა, ვიდრე ის ასისტენტები, რომლებსაც ბოლო ათწლეულის განმავლობაში მხოლოდ ტაიმერის დასაყენებლად ვიყენებდით.
ამის მიუხედავად, როცა უყურებ, როგორ მართავს Gemini აპლიკაციას, ერთი რამ ნათელი ხდება: თუ თქვენ აპლიკაციას სპეციალურად AI-სთვის შექმნიდით, ის არაფრით დაემსგავსებოდა იმას, რაც დღეს გვაქვს — ანუ ადამიანებისთვის შექმნილ ინტერფეისებს. AI ასისტენტი არ ცდუნდება ბანერით, რომელიც 30%-იან ფასდაკლებას გვთავაზობს. შესაკვეთი კერძის კარგად დადგმული ფოტო მისთვის ისეთივე არაფრისმთქმელია, როგორც უხარისხო სურათი. AI-ს მონაცემთა ბაზა (database) სჭირდება და არა უამრავი ვიზუალური ნაგავი. ინდუსტრია სწორედ ამ მიმართულებით მუშაობს ისეთი ტექნოლოგიების შექმნაზე, როგორიცაა Model Context Protocol (MCP).
AI მოდელის მცდელობა, გაერკვეს ადამიანზე ორიენტირებულ ინტერფეისში, ყველაზე არაპრაქტიკულ გზად მიმაჩნია. ამოცანების ავტომატიზაციის ეს ვერსია დროებით გამოსავალს ჰგავს, სანამ დეველოპერები უფრო ძლიერ მეთოდებს — MCP-ს ან Android-ის აპლიკაციების ფუნქციებს (app functions) დანერგავენ. Google-ის Android-ის ხელმძღვანელის, Sameer Samat-ის თქმით, Gemini მსჯელობის (reasoning) მიდგომას იყენებს სხვა ალტერნატივების არარსებობის გამო. შესაძლოა, ეს ვერსია იმის პრევიუა, თუ რისი მიღწევაა შესაძლებელი, ან ერთგვარი ბიძგი დეველოპერებისთვის ახალი მეთოდების დასანერგად. ნებისმიერ შემთხვევაში, ეს მობილური ასისტენტების გამოყენების ახალი გზისკენ გადადგმული მნიშვნელოვანი, თუმცა ჯერ კიდევ ნელი და მოუქნელი, მაგრამ ძალიან პერსპექტიული პირველი ნაბიჯია.
წყარო: theverge.com



