Secondo i risultati del benchmark LMSYS, GPT 4 di OpenAI é stato superato da Claude-3 di Anthropic perdendo il suo primato di "miglior" modello di linguaggio in commercio.
Il cambio di guardia segna un momento significativo nel settore, dato che GPT 4 é stato a lungo considerato il punto di riferimento per le prestazioni degli LLM.
In questo contesto competitivo, Claude 3 Opus ha ottenuto un punteggio di 1253, superando di misura GPT 4 che si é fermato a 1251.