AI-ის არასწორი ქცევის შესახებ შეტყობინების ახალი სისტემა: FLARE-AI

ხელოვნური ინტელექტის (AI) მოდელების არასწორი ან სახიფათო ქცევა ტექნოლოგიური სამყაროსთვის ახალი გამოწვევაა. ამ პრობლემის გადასაჭრელად, მკვლევართა ჯგუფმა შექმნა პლატფორმა FLARE-AI (Flaw Reporting for AI), რომელიც მომხმარებლებს საშუალებას აძლევს, ოპერატიულად დააფიქსირონ AI-ის მიერ გამოვლენილი ხარვეზები — იქნება ეს მავნე პროგრამების გენერირება, პერსონალური მონაცემების გაჟონვა თუ დეზინფორმაცია.

FLARE-AI ფუნქციონირებს როგორც ერთგვარი „Downdetector“ ხელოვნური ინტელექტისთვის. სისტემა ღია კოდზეა დაფუძნებული და საშუალებას იძლევა, შეტყობინებები პირდაპირ მიეწოდოს მოდელების შემქმნელებსა და ისეთ ორგანიზაციებს, როგორიცაა MITRE. პროექტის თანაავტორის, HuggingFace-ის მკვლევარ ავიჯიტ გოშის თქმით, დღეს ინდუსტრიაში არ არსებობს ცენტრალიზებული და ანგარიშვალდებული მექანიზმი AI-ის ხარვეზების აღსარიცხად.

ექსპერტები აღნიშნავენ, რომ AI მოდელები ხშირად „შავი ყუთის“ პრინციპით მუშაობენ, რაც ართულებს პრობლემების იდენტიფიცირებას. გარდა ტექნიკური ხარვეზებისა, სისტემა ყურადღებას ამახვილებს დისკრიმინაციაზე, მიკერძოებულობასა და ფსიქოლოგიურ ზიანზე. მიუხედავად იმისა, რომ ინიციატივა პერსპექტიულია, ისეთი გამოწვევები, როგორიცაა შეტყობინებების დიდი ნაკადის მართვა და სანდოობის უზრუნველყოფა, კვლავ აქტუალური რჩება.

აშშ-ის კონგრესში უკვე განიხილება კანონპროექტი, რომელიც მთავრობას დაავალდებულებს, შექმნას AI-ის ხარვეზების ერთიანი მონაცემთა ბაზა. ეს ნაბიჯი დეველოპერებს აიძულებს, მეტი პასუხისმგებლობით მოეკიდონ სისტემების უსაფრთხოებას, რაც განსაკუთრებით მნიშვნელოვანია ავტონომიური და ე.წ. „აგენტური“ სისტემების განვითარების ფონზე.

წყარო: wired.com