全球大模型竞争升级，中国大模型五虎到位-TopMarketing|TopMarketing官方网站

全球大模型竞争升级，中国大模型五虎到位

2024.05.13

赞 13浏览 2956评论 0收藏 1

大模型浪潮的席卷速度，超越了历史上任何一场技术革命。

年初，OpenAI发布Sora，马斯克、周鸿祎不惜溢美之词，狂热蔓延全世界。正当大家还在惊叹“未来已来”，Anthropic公司宣布Claude-3正式发布，并宣布在AI逻辑基准测试中超过了ChatGPT-4。与此同时，Google和马斯克同时跳入开源大战，分别推出Gemma和Grok。

全球大模型的竞争热潮，从小众圈层向外扩散，像涟漪一样，播散向全世界。一场大模型的无限竞争就此打响。全球科技巨头携带着大笔充沛的资金、漂亮履历的技术人才将战场烧的更加火热。

但冷静一看，目前世界上公认的大模型领军者，大多却是年轻的AI企业：估值高达290亿美元的OpenAI，成立于2015年；被称为OpenAI“最强竞争对手”的大模型公司Anthropic成立于2021年；“欧洲新秀”Mistra创立至今，刚到一年。三家闪耀的AI明星公司的员工加起来却可能不到一千人，只是科技大厂的一个部门的人数。

为什么这场对大模型王冠的追逐战，不在巨头的射程范围内？

为什么荣光属于AI企业？

首先，打破一个认知误区：大模型并不是一场单单依靠资源的军备竞赛。

在ChatGPT横空出世后，一个广为流传的说法是，OpenAI成功的关键在于背靠微软Azure云上的数万张A100卡，成本高达数亿美元。更有甚者认为大模型的胜率取决于资源的充沛程度。

然而，今年3月，美国初创公司 Databricks 突然公布旗下开源大语言模型 DBRX，号称是全球最强开源大模型，参数规模达到 1320 亿，表现更是超越 Meta 的 Llama2、Mistral AI 的 Mixtral，以及马斯克旗下 xAI 公司刚刚开源的 Grok-1。

更重要的是，他们只花了 2 个月和 1000 万美元，在性能全面超越 GPT-3.5 的同时，训练时间和成本都只有 GPT-3.5 的一小部分。

事实上，资源对于任何领域的竞争都很重要，但资源在大模型领域却不是万能的、更不是唯一因素。而AI企业相比科技巨头，有一个得天独厚的优势，就在于技术探索上的灵活性。

Google曾是人工智能深度学习领域里当之无愧的王者。2016年，击败人类围棋冠军李世石的阿尔法go就是出自谷歌Deepmind，而在自然语言模型领域，谷歌也曾遥遥领先。

然而，2022年ChatGPT横空出世。实际上拉开身位差距的是技术路线上的分歧。谷歌追逐的自然语言模型应该是一系列的垂类，参数相对较小、适用场景面相对较窄的模型，而OpenAI认为应该做一个通用的海量参数，海量数据训练的超级大模型。

OpenAI当年的梦想看来是天方夜谭。但即便在与谷歌的较量中长期落于下风，OpenAI也没有放弃将GPT作为唯一路线。阿尔特曼的一句话给出了答案——“创业公司做什么都很难，那不如抓住大机会。”（Startups are very hard no matter what you do , you may as well go after a big opportunity.）

相比于AI企业的灵活性，科技巨头在押注技术路线上却很难如此孤注一掷，这也一定程度上造成了动作的迟缓。这也注定了，AI的最新方向大概率要靠AI企业去探索。

海外AI明星公司鳞次栉比、星光璀璨。那么问题来了，中国领域的AI明星公司在哪？

“ 中国大模型五虎”浮出水面

一张SuperCLUE评测榜单揭开了中国大模型五虎的秘密。

刨除BAT，榜单上展现着中国最强AI企业的身影，分别是百川智能、智谱AI、月之暗面、MiniMax、云从科技。

百川智能成立于 2023 年 4 月，创始人为前搜狗公司 CEO 王小川。成立后短短数月，百川智能便跻身科技独角兽行列，成立至今更是连续发布了11款基础大模型。

智谱AI成立于2019年，今年初已完成新一轮融资。创始人张鹏，毕业于清华大学计算机科学与技术系。几年来，公司连续发布了GLM系列大模型、ChatGLM、CodeGeeX代码大模型等，已成为国内最早也是最有大模型研发经验的企业之一。

MiniMax成立于2021年，背后的掌舵者闫俊杰毕业于中科院自动化所，在商汤科技担任副总裁期间，负责搭建深度学习的工具链和底层算法，以及通用智能的技术发展。联合创始人杨斌，则是闫俊杰在中科院的校友。

同样来势汹汹的还有月之暗面（Moonshot AI）——2023年，月之暗面接连完成两轮共计近20亿人民币的融资，估值超25亿美金。月之暗面成立于2023年3月由三位清华校友创办，带头人则是90后学霸杨植麟。

至此，加上云从科技，中国AI大模型五虎呼之欲出。

云从科技曾是“AI四小龙”中A股第一股，也是国内AI三驾马车中，唯一一家具备全内资背景的企业。在业内，云从科技与商汤科技、旷视科技、依图科技并称“AI四小龙”，但论起光环与热度，最年轻的云从科技，却是最“顶流”的存在。

“AI国家队选手”、“中国科学院孵化企业”、“中国AI第一梯队企业”、“首个同时承担国家发展和改革委人工智能基础平台、应用平台，科技部开放平台等重大项目建设任务、并参与国家及行业标准制定的人工智能企业”等称号，让云从科技自2015年诞生以来，始终处于行业聚光灯下。去年五月，正式发布了AI智能体（AI-agent）领域的战略级产品——“从容多模态大模型”。不只是对话体验，从容大模型还可以编程、写作、解题等。云从还对“从容”与ChatGPT进行横向对比演示，在对同一真题的解答过程中，从容大模型的答题速度相较更快，但推理能力、语义理解能力已超过GPT 3.5，略低于GPT4.0。