AI • 2 საათის წინ • 1

AI-ის არასწორი ქცევის შესახებ შეტყობინების ახალი სისტემა: FLARE-AI

ხელოვნური ინტელექტის (AI) მოდელების არასწორი ან სახიფათო ქცევა ტექნოლოგიური სამყაროსთვის ახალი გამოწვევაა. ამ პრობლემის გადასაჭრელად, მკვლევართა ჯგუფმა შექმნა პლატფორმა FLARE-AI (Flaw Reporting for AI), რომელიც მომხმარებლებს საშუალებას აძლევს, ოპერატიულად დააფიქსირონ AI-ის მიერ გამოვლენილი ხარვეზები — იქნება ეს მავნე პროგრამების გენერირება, პერსონალური მონაცემების გაჟონვა თუ დეზინფორმაცია.

FLARE-AI ფუნქციონირებს როგორც ერთგვარი „Downdetector“ ხელოვნური ინტელექტისთვის. სისტემა ღია კოდზეა დაფუძნებული და საშუალებას იძლევა, შეტყობინებები პირდაპირ მიეწოდოს მოდელების შემქმნელებსა და ისეთ ორგანიზაციებს, როგორიცაა MITRE. პროექტის თანაავტორის, HuggingFace-ის მკვლევარ ავიჯიტ გოშის თქმით, დღეს ინდუსტრიაში არ არსებობს ცენტრალიზებული და ანგარიშვალდებული მექანიზმი AI-ის ხარვეზების აღსარიცხად.

ექსპერტები აღნიშნავენ, რომ AI მოდელები ხშირად „შავი ყუთის“ პრინციპით მუშაობენ, რაც ართულებს პრობლემების იდენტიფიცირებას. გარდა ტექნიკური ხარვეზებისა, სისტემა ყურადღებას ამახვილებს დისკრიმინაციაზე, მიკერძოებულობასა და ფსიქოლოგიურ ზიანზე. მიუხედავად იმისა, რომ ინიციატივა პერსპექტიულია, ისეთი გამოწვევები, როგორიცაა შეტყობინებების დიდი ნაკადის მართვა და სანდოობის უზრუნველყოფა, კვლავ აქტუალური რჩება.

აშშ-ის კონგრესში უკვე განიხილება კანონპროექტი, რომელიც მთავრობას დაავალდებულებს, შექმნას AI-ის ხარვეზების ერთიანი მონაცემთა ბაზა. ეს ნაბიჯი დეველოპერებს აიძულებს, მეტი პასუხისმგებლობით მოეკიდონ სისტემების უსაფრთხოებას, რაც განსაკუთრებით მნიშვნელოვანია ავტონომიური და ე.წ. „აგენტური“ სისტემების განვითარების ფონზე.

წყარო: wired.com

AI ხელოვნური ინტელექტი AI უსაფრთხოება FLARE-AI ტექნოლოგიური რისკები AI ეთიკა

AI-ის არასწორი ქცევის შესახებ შეტყობინების ახალი სისტემა: FLARE-AI

SpaceX-ის ისტორიული IPO: აქციის ფასი 135 დოლარად განისაზღვრა

OpenAI-მ კონფიდენციალურად წარადგინა განაცხადი IPO-სთვის

OpenAI საჯარო შეთავაზებისთვის (IPO) ემზადება: Anthropic-ის კვალდაკვალ

Anthropic-მა 65 მილიარდი დოლარი მოიზიდა და IPO-ს წინ 1 ტრილიონ დოლარიან შეფასებას უახლოვდება

SpaceX-მა SEC-ში S-1 ფორმა წარადგინა: შესაძლოა, ეს ისტორიაში ყველაზე დიდი IPO გახდეს

ინდოეთის ციფრული გადახდების ლიდერი: AI იქნება შემდეგი ეტაპის მთავარი მამოძრავებელი ძალა

TechCrunch Mobility: Tesla-ს FSD სისტემის ირგვლივ გაზრდილი ყურადღება

Bending Spoons-ის წარმატებული დებიუტი: აქციების ფასი 40%-ით გაიზარდა

AI-ის არასწორი ქცევის შესახებ შეტყობინების ახალი სისტემა: FLARE-AI

თაგები:

გაზიარება: