
ცოტა ხნის წინ ჩემს OpenClaw აგენტს რეალური რობოტის მკლავი მივუერთე. შედეგებმა ჩემი საკუთარი ნეირონული ქსელიც კი განაცვიფრა.
AI აგენტმა შეძლო მკლავის კონფიგურაცია, მისი გამოყენებით საგნების დანახვა და ნელა ჩავლა, და სხვა AI მოდელის გაწვრთნაც კი, რათა კონკრეტული ობიექტები აეღო და გადაეადგილებინა. და ამის შემდეგ ამბობენ, რომ AGI-მდე ჯერ კიდევ წლებია დარჩენილი!
შედეგებმა დამარწმუნა, რომ შესაძლოა რობოტოტექნიკის რევოლუციის ზღვარზე ვიყოთ. რობოტების წვრთნა და მართვა ადრე დიდ ცოდნას მოითხოვდა, დღეს კი AI მოდელები ამას საოცრად ამარტივებენ.
„AI-ზე დაფუძნებული კოდირება ძალიან ამაღელვებელია, რადგან მას შეუძლია ხიდი გადოს ტრადიციულ საინჟინრო მეთოდებსა (რომლებიც საიმედოა, მაგრამ არაუნივერსალური) და თანამედროვე vision-language-action მოდელებს შორის,“ - ამბობს კენ გოლდბერგი, რობოტოტექნიკოსი UC Berkeley-დან.
მე შევიძინე მზა რობოტის მკლავი LeRobot 101, რომელიც HuggingFace-ის ღია კოდის (open-source) პროექტის ნაწილია. OpenClaw-ისა და Codex-ის დახმარებით, მარტივად შევძელით პროგრამის დაწერა (ეგრეთ წოდებული vibe coding), რომელმაც წითელი ბურთის დანახვისას რობოტის მარწუხი შეკრა. Codex-მა შეასრულა რობოტთან კავშირის რთული კონფიგურაცია, დააკალიბრა სახსრების პოზიციები და დაწერა Python სკრიპტი ბურთის იდენტიფიცირებისთვის.
Code as Policy
იდეა, რომ AI-ზე დაფუძნებულ კოდირებას შეუძლია რობოტების შექმნის ახალი გზა შემოგვთავაზოს, პირველად 2022 წლის კვლევაში გამოჩნდა, რომელსაც „code as policy“ (კოდი, როგორც პოლიტიკა) ეწოდა. მას შემდეგ AI-ის კოდირების შესაძლებლობები საოცარი სიჩქარით განვითარდა.
გოლდბერგის ჯგუფმა, Nvidia-ს, Carnegie Mellon-ისა და Stanford-ის მკვლევრებთან ერთად, შეიმუშავა ახალი ბენჩმარკი CaP-X. საინტერესოა, რომ CaP-X-ის მიხედვით, რობოტების პროგრამირებისთვის საუკეთესო მოდელი არა Claude ან ChatGPT, არამედ Gemini აღმოჩნდა — შესაძლოა იმიტომ, რომ Google DeepMind ფოკუსირებულია მულტიმოდალურ მოდელებზე, რომელთაც ფიზიკური სამყაროს აღქმა შეუძლიათ.
სპენსერ ჰუანგი (Nvidia-ს დამფუძნებლის, ჯენსენ ჰუანგის ვაჟი), რომელიც ამ კვლევებში მონაწილეობს, აღნიშნავს: „ფაქტობრივად ნებისმიერს შეუძლია ჩაერთოს რობოტოტექნიკაში, რაც ნამდვილი წმინდა გრაალია“. ადამიანებისთვის რობოტების ხმოვანი ან ტექსტური ბრძანებებით მართვის შესაძლებლობა კრიტიკული ნაბიჯია რობოტების საზოგადოებაში ინტეგრაციისთვის.
წყარო: wired.com







