Тем временем Anthropic зарелизили Claude 3.5 Sonnet и цифры... / AI Forge / Telegram Center

Тем временем Anthropic зарелизили Claude 3.5 Sonnet и цифры по математическому бенчмарку GSM8K переваливают за 95% Надо признать, что GSM8K не только проверяет способность модели выдавать правильный ответ на задачку, но и ее способность правильно решать эту задачу Вот кстати интересная статья про то как SurgeAI помогали OpenAI в создании бенчмарка GSM8K – https://www.surgehq.ai//blog/how-we-built-it-openais-gsm8k-dataset-of-8500-math-problems

https://t.center/ai_forge/82

2.3K viewsАлексей Макаров, Jun 20 at 18:26

Love Center - Dating, Friends & Matches, NY, LA, Dubai, Global

Бот для знакомств