1. DeepSeek系列
基础模型V3适用于通用任务,深度思考R1擅长复杂推理
由幻方量化旗下深度求索公司开发,采用数据蒸馏技术优化训练效率
2. Kimi(月之暗面)
支持20万汉字长文本处理,学术分析与实时联网检索能力突出
Moonshot AI开发,在长上下文任务中表现独特
3. 文心一言(百度)
中文多模态生成(文本/图像/语音)领先,金融教育领域应用成熟
ERNIE 4.0版本在SuperCLUE基准测试中表现优异
4. 通义千问(阿里云)
Qwen2.5-Max全球排名第七,数学和编程单项能力第一
采用MoE架构,20万亿token预训练数据
5. 豆包(字节跳动)
多模态交互功能丰富,生态完善适合日常场景
客观评测得分75.96分,国产模型中排名前列
6. 讯飞星火(科大讯飞)
数学计算与逻辑推理能力强,集成人形机器人应用
2024年用户量突破1.5亿
7. 智谱清言(GLM-4)
清华团队研发,复杂语言任务处理能力突出
悟道模型衍生技术支撑
8. 华为盘古大模型
行业解决方案覆盖广,硬件协同优化显著
在制造业、医疗等领域应用深入
9. 百川智能(Baichuan4)
文科/理科能力均衡,开源生态活跃
2024年国内大模型评测排名第一
10. MiniMax abab6.5
创业公司代表,超过70分进入第一梯队
对话流畅度与创意生成受认可
国际对比:GPT-4 Turbo仍保持复杂逻辑优势,但国产模型在中文场景商业化落地更快,DeepSeek以1/10参数实现接近GPT-4的推理能力。