GPT-4 jest uznawany za najlepszy model AI dla chatbotów
Usługa LMSYS Chatbot Arena zaktualizowała ocenę dużych modeli językowych sztucznej inteligencji. Pozwala to ocenić, które modele osiągają obecnie najlepsze wyniki.
LMSYS Chatbot Arena to otwarta platforma crowdsourcingowa do oceny dużych modeli językowych (LLM). Ponad 300 000 osób jest ocenianych w celu opracowania rankingu. ludzkie opinie na temat wydajności modeli przy użyciu systemu oceny Elo.
Jak działa test: użytkownicy wprowadzają zapytanie i wybierają najlepszą odpowiedź spośród kilku opcji z różnych modeli. W oparciu o tysiące testów przeprowadzonych przez użytkowników, tworzony jest top i ranking.
Według nowego rankingu areny chatbotów, GPT4 jest obecnie liderem wśród LLM. Niedawne twierdzenia Claude’a, że ich model jest lepszy, nie zostały potwierdzone. Zajęła trzecie miejsce. Tuż za nim plasuje się model Bard (Gemini Pro) od Google. Wszystkie te modele otrzymały ocenę Elo powyżej 1200.
Szczegółowe, aktualne wyniki rankingu dostępnych dużych modeli językowych można znaleźć pod następującym adresem.