GPT-4o vs Qwen 2.5 Coder 32B

Side-by-side comparison of GPT-4o (OpenAI) and Qwen 2.5 Coder 32B (Alibaba) — benchmarks, pricing, and capabilities.

Share:

	GPT-4o OpenAI	Qwen 2.5 Coder 32B Alibaba
Category	LLMs	Code Models
Specifications
Context Window	128K	128K
Pricing (per 1M tokens)
Input Cost	$2.50	—
Output Cost	$10.00	—
Performance
Overall Score	92.5	88.0
ARC-Challenge	96.3	—
BigBench Hard	87.2	—
Chatbot Arena ELO	1150.0	—
DROP	88.1	—
GSM8K	95.3	—
HumanEval	92.0	92.7
LiveCodeBench	—	42.8
MATH	76.6	—
MBPP	—	90.2
MMLU	88.7	—
SWE-bench Verified	—	33.5
TruthfulQA	72.2	—
WinoGrande	89.9	—
Community
User Rating	★ 4.7	★ 4.5
Reviews	1240	175

Open in Interactive Comparison Tool View GPT-4o View Qwen 2.5 Coder 32B

People Also Compare

GPT-4ovsGPT-o1 Qwen 2.5 Coder 32BvsGPT-o1

GPT-4ovsDeepSeek R1 Qwen 2.5 Coder 32BvsDeepSeek R1

GPT-4ovsClaude 3.5 Sonnet Qwen 2.5 Coder 32BvsClaude 3.5 Sonnet

GPT-4ovsGemini 1.5 Pro Qwen 2.5 Coder 32BvsGemini 1.5 Pro

GPT-4ovsClaude 3 Opus Qwen 2.5 Coder 32BvsClaude 3 Opus

GPT-4ovsDeepSeek V3 Qwen 2.5 Coder 32BvsDeepSeek V3