The Atlantic-მა AI-ის წვრთნისთვის გამოყენებული მუსიკალური მონაცემთა ბაზა შექმნა

The Atlantic-ის რეპორტიორმა ალექს რეისნერმა აღმოაჩინა ოთხი მასშტაბური მონაცემთა ბაზა, რომლებიც ხელოვნური ინტელექტის (AI) მოდელების წვრთნისთვის გამოიყენება. მან ეს მონაცემები საჯაროდ ხელმისაწვდომი და საძიებო გახადა. ორ მათგანს უზარმაზარი მოცულობა აქვს — 12 და 9 მილიონი მუსიკალური ტრეკი, ხოლო დანარჩენი ორი 100 000-ზე მეტ სიმღერას მოიცავს.

რეისნერის თქმით, აღნიშნული ბაზები ათასობითჯერ არის ჩამოტვირთული. მიუხედავად იმისა, რომ რთულია ზუსტი მომხმარებლების იდენტიფიცირება, Google-მა და Stability-მ სამეცნიერო ნაშრომებში უკვე დაადასტურეს მათი გამოყენება. ზოგიერთი წყარო, მაგალითად Free Music Archive, პირადი მოხმარებისთვის უფასოა, თუმცა კომერციული მიზნებისთვის ლიცენზირებას საჭიროებს.

AI-ის დეველოპერები ხშირად იყენებენ ავტომატიზებულ ინსტრუმენტებს YouTube-სა და Spotify-დან აუდიო ფაილების ჩამოსატვირთად, რაც ხშირად არღვევს ამ პლატფორმების მომსახურების პირობებს, რადგან გვერდს უვლის რეკლამებსა და ავტორიზაციის მექანიზმებს. მონაცემთა ბაზაში გვხვდება როგორც პოპ-ვარსკვლავების, ისე ალტერნატიული მუსიკოსების ნამუშევრები, მათ შორის Lady Gaga, Radiohead, Aphex Twin და Wu-Tang Clan. დაინტერესებულ პირებს შეუძლიათ ეწვიონ The Atlantic-ის AI Watchdog-ის ვებგვერდს და თავად დაათვალიერონ ის მუსიკალური და ლიტერატურული მასალა, რომელიც თანამედროვე AI მოდელების განვითარებას უდევს საფუძვლად.

წყარო: theverge.com