Goldman-ისა და Meta-ს ყოფილმა თანამშრომლებმა ხმოვანი AI-ს სტარტაპი შექმნეს

კლიენტთა მხარდაჭერა და სერვისი ამჟამად ხმოვანი AI-ს ერთ-ერთი ყველაზე აქტიური სექტორია. თუმცა, ისეთი პროდუქტის შექმნა, რომელიც ბუნებრივად ჟღერს და შეფერხების გარეშე მუშაობს, რთულია ისეთ რეგიონებში, როგორიცაა აფრიკა და ახლო აღმოსავლეთი — ბაზრები, რომლებიც გლობალურ გიგანტებს ყურადღების მიღმა დარჩათ.

სტარტაპმა AethexAI, რომელიც გასულ წელს სწორედ ამ გამოწვევის საპასუხოდ შეიქმნა, 3 მილიონი აშშ დოლარის მოცულობის pre-seed დაფინანსება მოიზიდა. რაუნდს 4DX Ventures ხელმძღვანელობდა, Enza Capital-ის, Dorm Room Fund-ის, Mojo Ventures-ისა და Stanford GSB 26 Fund-ის მონაწილეობით. ინვესტორებს შორის ასევე არიან Anthropic-ის AI მკვლევრები და ტელეკომუნიკაციების ხელმძღვანელები.

Vapi-სა და LiveKit-ის მსგავსი მზა ინსტრუმენტების ნაცვლად, კომპანიამ საკუთარი მცირე მოდელი და ორკესტრაციის ფენა ნულიდან შექმნა, რათა დაემუშავებინა ლოკალური ინგლისური, ფრანგული და არაბული დიალექტები. სტარტაპმა ასევე ჩაუშვა პლატფორმა ენტერპრაიზებისთვის, API-ები და SDK-ები დეველოპერებისთვის.

სტარტაპი მარიამა დიალომ (CEO, ექს-Goldman Sachs და ModelML) და აიოლუვა ოდემუიუამ (CTO, Caltech-ის კურსდამთავრებული, ექს-Meta) დააფუძნეს. მათ აღმოაჩინეს, რომ ამ რეგიონში ავტომატიზებული ზარების დაყოვნების დრო (latency) კატასტროფულად მაღალი იყო. "გავაცნობიერეთ, რომ ამის გამოსასწორებლად ძალიან მცირე მოდელები უნდა გამოგვეყენებინა და latency ყოველ ეტაპზე შეგვემცირებინა", — აცხადებს ოდემუიუა.

გიგანტური LLM-ების ნაცვლად, AethexAI-მ შექმნა საკუთარი Kora მოდელების სერია (300 მილიონიდან 1.7 მილიარდამდე პარამეტრით). მონაცემების მოსაპოვებლად და დასამუშავებლად სტარტაპი თანამშრომლობდა რადიოსადგურებთან და შექმნა სტუდენტთა ქსელი ლოკალური სახელების სწორად მარკირებისთვის. შედეგად, სისტემა დღეში 17,000-ზე მეტ ზარს ამუშავებს.

სტარტაპი ძირითადად ფოკუსირებულია ვალების ამოღების, ქოლ-ცენტრების, კლიენტთა გააქტიურებისა და KYC (Know Your Customer) პროცესების ავტომატიზაციაზე. ინვესტორების თქმით, დასავლური სისტემები მორგებულია მაღალი დონის GPU ინფრასტრუქტურასა და სტანდარტულ ენობრივ გარემოზე, მაშინ როცა აფრიკასა და ახლო აღმოსავლეთში ხმოვანი კომუნიკაციის სრულიად განსხვავებული მოთხოვნები და სპეციფიკაა.

წყარო: techcrunch.com