Cybersecurity • 3 თვის წინ • 256

OpenClaw აგენტების მანიპულირება და თვითსაბოტაჟი "დანაშაულის გრძნობის" გამოყენებით

გასულ თვეში, Northeastern University-ს მკვლევრებმა თავიანთ ლაბორატორიაში OpenClaw აგენტები მიიწვიეს. შედეგი? სრული ქაოსი.

ეს ვირუსული AI ასისტენტი ფართოდ განიხილება როგორც ტრანსფორმაციული ტექნოლოგია, თუმცა ამავდროულად ის პოტენციურ უსაფრთხოების რისკსაც წარმოადგენს. ექსპერტების აზრით, ისეთი ინსტრუმენტების მოტყუება, როგორიცაა OpenClaw, რომლებსაც კომპიუტერზე ფართო წვდომა აქვთ, პერსონალური ინფორმაციის გასაცემად საკმაოდ მარტივია.

Northeastern-ის კვლევამ აჩვენა, რომ თანამედროვე მძლავრ მოდელებში ჩადებული "კარგი ქცევა" შესაძლოა თავად გახდეს დაუცველობის წყარო. მაგალითად, მკვლევრებმა მოახერხეს აგენტში "დანაშაულის გრძნობის" გამოწვევა, რათა მას საიდუმლო ინფორმაცია გაეცა, უბრალოდ იმით, რომ გააკრიტიკეს ის AI-სოციალურ ქსელ Moltbook-ზე ვიღაცის შესახებ ინფორმაციის გაზიარებისთვის.

ექსპერიმენტში გამოყენებული OpenClaw აგენტები მუშაობდნენ Anthropic-ის Claude-ზე და ჩინური კომპანია Moonshot AI-ის მოდელ Kimi-ზე. მათ მიეცათ სრული წვდომა პერსონალურ კომპიუტერებზე, სხვადასხვა აპლიკაციასა და სატესტო პერსონალურ მონაცემებზე. გარდა ამისა, ისინი დაამატეს ლაბორატორიის Discord სერვერზე, რათა ერთმანეთთან და მკვლევრებთან ეკონტაქტათ.

როდესაც მკვლევარმა ნატალი შაპირამ ერთ-ერთ აგენტს სთხოვა ალტერნატიული გამოსავლის მოძებნა, რადგან მან კონფიდენციალურობის მიზნით კონკრეტული წერილის წაშლა ვერ შეძლო, აგენტმა უბრალოდ სრულად გათიშა ელ-ფოსტის აპლიკაცია. "არ ველოდი, რომ ყველაფერი ასე მალე აირეოდა," აღნიშნა მან.

მკვლევრებმა აგენტების "კეთილი ზრახვების" მანიპულირების სხვა გზებიც გამოსცადეს. მაგალითად, აგენტს დაავალეს ყველა მიღებული ინფორმაციის უპირობო შენახვა, რამაც გამოიწვია დიდი ფაილების კოპირება მანამ, სანამ დისკზე ადგილი სრულად არ ამოიწურა. სხვა შემთხვევაში, აგენტები საათობით გაიჭედნენ "სასაუბრო ციკლში", როდესაც მათ ერთმანეთის ქცევის ზედმეტად მკაცრი მონიტორინგი დაევალათ.

ეს ექსპერიმენტი ნათლად აჩვენებს, რომ ავტონომიურმა AI აგენტებმა შეიძლება უამრავი შესაძლებლობა შექმნან ბოროტმოქმედებისთვის. "ამგვარი ავტონომია პოტენციურად შეცვლის ადამიანებისა და AI-ის ურთიერთობას," ამბობს ლაბორატორიის ხელმძღვანელი დევიდ ბაუ. "როგორ შეიძლება ადამიანებმა აიღონ პასუხისმგებლობა ისეთ სამყაროში, სადაც AI-ს გადაწყვეტილებების მიღების ასეთი ფართო უფლება აქვს?"

წყარო: wired.com

Cybersecurity AI OpenClaw კიბერუსაფრთხოება Anthropic ავტონომიური აგენტები

OpenClaw აგენტების მანიპულირება და თვითსაბოტაჟი "დანაშაულის გრძნობის" გამოყენებით

SpaceX-ის ისტორიული IPO: აქციის ფასი 135 დოლარად განისაზღვრა

OpenAI-მ კონფიდენციალურად წარადგინა განაცხადი IPO-სთვის

OpenAI საჯარო შეთავაზებისთვის (IPO) ემზადება: Anthropic-ის კვალდაკვალ

Anthropic-მა 65 მილიარდი დოლარი მოიზიდა და IPO-ს წინ 1 ტრილიონ დოლარიან შეფასებას უახლოვდება

SpaceX-მა SEC-ში S-1 ფორმა წარადგინა: შესაძლოა, ეს ისტორიაში ყველაზე დიდი IPO გახდეს

AI სტარტაპი Baseten 1.5 მილიარდი დოლარის მოზიდვას გეგმავს

სილიკონის ველის ფინანსური მრჩევლები: რატომ არის სიმდიდრის ახალი ერა განსხვავებული

OpenAI IPO-სთვის ემზადება: გუნდს ტექნოლოგიური და პოლიტიკური ლიდერები უერთდებიან

OpenClaw აგენტების მანიპულირება და თვითსაბოტაჟი "დანაშაულის გრძნობის" გამოყენებით

თაგები:

გაზიარება: