LLM Benchmark - December 2024 Вышел полный отчет по бенчмаркам моделей в business automation за декабрь 2024. Там написано про DeepSeek v3, o1 pro, Gemini 2.0 Flash и еще много других моделей. English / Deutsch Содержание: - Benchmarking Llama 3.3, Amazon Nova - nothing outstanding - Google Gemini 1206, Gemini 2.0 Flash Experimental - TOP 10 - DeepSeek v3 - Manual benchmark of OpenAI o1 pro - Gold Standard. - Base o1 (medium reasoning effort) - 3rd place - Our thoughts about recently announced o3 - Our predictions for the 2025 landscape of LLM in business integration - Enterprise RAG Challenge will take place on February 27th Ваш, @llm_under_hood 🤗 PS: Для тех, кто видит бенчмарки впервые, подробнее про них написано тут.