
Artificial intelligence მოდელები სწრაფად მრავლდება და კონკურენციაც იზრდება. ბაზარზე არსებული სიმრავლის ფონზე, რომელი იქნება საუკეთესო და ვინ წყვეტს ამას? Arena, რომელიც ადრე LM Arena-ს სახელით იყო ცნობილი, მოწინავე LLM-ებისთვის დე ფაქტო საჯარო ლიდერბორდად ჩამოყალიბდა და მნიშვნელოვან გავლენას ახდენს დაფინანსებაზე, პროდუქტების გაშვებასა და PR ციკლებზე. სულ რაღაც შვიდ თვეში სტარტაპმა UC Berkeley-ს სადოქტორო კვლევითი პროექტიდან 1.7 მილიარდი დოლარის შეფასებამდე მიაღწია. Equity-ს წამყვანი, Rebecca Bellan, Arena-ს თანადამფუძნებლებს, Anastasios Angelopoulos-სა და Wei-Lin Chiang-ს ესაუბრა იმის შესახებ, თუ როგორ იქცა მათი პლატფორმა მოწინავე AI მოდელების მთავარ ლიდერბორდად და როგორ ცდილობენ ისინი ნეიტრალური ბენჩმარკის შექმნას მაშინაც კი, როცა პროექტს მხარს უჭერენ ისეთი კომპანიები, როგორიცაა OpenAI, Google და Anthropic. ისინი დეტალურად განიხილავენ, თუ როგორ მუშაობს Arena და რატომ არის მისი მანიპულირება უფრო რთული, ვიდრე სტატიკური ბენჩმარკების. რას ნიშნავს სინამდვილეში სტრუქტურული ნეიტრალიტეტი, რატომ ლიდერობს ამჟამად Claude იურიდიულ და სამედიცინო მიმართულებებში და როგორ ცდება კომპანია მხოლოდ ჩატის ფარგლებს, რათა ახალი ენთერფრაიზ პროდუქტით აგენტები, კოდირება და რეალური ამოცანები შეაფასოს.
წყარო: techcrunch.com



