+
全球大模型竞争升级,中国大模型五虎到位
松果财经
2024.05.13
赞 0浏览 480评论 0收藏 0

大模型浪潮的席卷速度,超越了历史上任何一场技术革命。

年初,OpenAI发布Sora,马斯克、周鸿祎不惜溢美之词,狂热蔓延全世界。正当大家还在惊叹“未来已来”,Anthropic公司宣布Claude-3正式发布,并宣布在AI逻辑基准测试中超过了ChatGPT-4。与此同时,Google和马斯克同时跳入开源大战,分别推出Gemma和Grok。

全球大模型的竞争热潮,从小众圈层向外扩散,像涟漪一样,播散向全世界。一场大模型的无限竞争就此打响。全球科技巨头携带着大笔充沛的资金、漂亮履历的技术人才将战场烧的更加火热。

但冷静一看,目前世界上公认的大模型领军者,大多却是年轻的AI企业:估值高达290亿美元的OpenAI,成立于2015年;被称为OpenAI“最强竞争对手”的大模型公司Anthropic成立于2021年;“欧洲新秀”Mistra创立至今,刚到一年。三家闪耀的AI明星公司的员工加起来却可能不到一千人,只是科技大厂的一个部门的人数。

为什么这场对大模型王冠的追逐战,不在巨头的射程范围内?

为什么荣光属于AI企业?

首先,打破一个认知误区:大模型并不是一场单单依靠资源的军备竞赛。

在ChatGPT横空出世后,一个广为流传的说法是,OpenAI成功的关键在于背靠微软Azure云上的数万张A100卡,成本高达数亿美元。更有甚者认为大模型的胜率取决于资源的充沛程度。

然而,今年3月,美国初创公司 Databricks 突然公布旗下开源大语言模型 DBRX,号称是全球最强开源大模型,参数规模达到 1320 亿,表现更是超越 Meta 的 Llama2、Mistral AI 的 Mixtral,以及马斯克旗下 xAI 公司刚刚开源的 Grok-1。

更重要的是,他们只花了 2 个月和 1000 万美元,在性能全面超越 GPT-3.5 的同时,训练时间和成本都只有 GPT-3.5 的一小部分。

事实上,资源对于任何领域的竞争都很重要,但资源在大模型领域却不是万能的、更不是唯一因素。而AI企业相比科技巨头,有一个得天独厚的优势,就在于技术探索上的灵活性。

Google曾是人工智能深度学习领域里当之无愧的王者。2016年,击败人类围棋冠军李世石的阿尔法go就是出自谷歌Deepmind,而在自然语言模型领域,谷歌也曾遥遥领先。

然而,2022年ChatGPT横空出世。实际上拉开身位差距的是技术路线上的分歧。谷歌追逐的自然语言模型应该是一系列的垂类,参数相对较小、适用场景面相对较窄的模型,而OpenAI认为应该做一个通用的海量参数,海量数据训练的超级大模型。

OpenAI当年的梦想看来是天方夜谭。但即便在与谷歌的较量中长期落于下风,OpenAI也没有放弃将GPT作为唯一路线。阿尔特曼的一句话给出了答案——“创业公司做什么都很难,那不如抓住大机会。”(Startups are very hard no matter what you do , you may as well go after a big opportunity.)

相比于AI企业的灵活性,科技巨头在押注技术路线上却很难如此孤注一掷,这也一定程度上造成了动作的迟缓。这也注定了,AI的最新方向大概率要靠AI企业去探索。

海外AI明星公司鳞次栉比、星光璀璨。那么问题来了,中国领域的AI明星公司在哪?

“ 中国大模型五虎”浮出水面

一张SuperCLUE评测榜单揭开了中国大模型五虎的秘密。

刨除BAT,榜单上展现着中国最强AI企业的身影,分别是百川智能、智谱AI、月之暗面、MiniMax、云从科技。

百川智能成立于 2023 年 4 月,创始人为前搜狗公司 CEO 王小川。成立后短短数月,百川智能便跻身科技独角兽行列,成立至今更是连续发布了11款基础大模型。

智谱AI成立于2019年,今年初已完成新一轮融资。创始人张鹏,毕业于清华大学计算机科学与技术系。几年来,公司连续发布了GLM系列大模型、ChatGLM、CodeGeeX代码大模型等,已成为国内最早也是最有大模型研发经验的企业之一。

MiniMax成立于2021年,背后的掌舵者闫俊杰毕业于中科院自动化所,在商汤科技担任副总裁期间,负责搭建深度学习的工具链和底层算法,以及通用智能的技术发展。联合创始人杨斌,则是闫俊杰在中科院的校友。

同样来势汹汹的还有月之暗面(Moonshot AI)——2023年,月之暗面接连完成两轮共计近20亿人民币的融资,估值超25亿美金。月之暗面成立于2023年3月由三位清华校友创办,带头人则是90后学霸杨植麟。

至此,加上云从科技,中国AI大模型五虎呼之欲出。

云从科技曾是“AI四小龙”中A股第一股,也是国内AI三驾马车中,唯一一家具备全内资背景的企业。在业内,云从科技与商汤科技、旷视科技、依图科技并称“AI四小龙”,但论起光环与热度,最年轻的云从科技,却是最“顶流”的存在。

“AI国家队选手”、“中国科学院孵化企业”、“中国AI第一梯队企业”、“首个同时承担国家发展和改革委人工智能基础平台、应用平台,科技部开放平台等重大项目建设任务、并参与国家及行业标准制定的人工智能企业”等称号,让云从科技自2015年诞生以来,始终处于行业聚光灯下。去年五月,正式发布了AI智能体(AI-agent)领域的战略级产品——“从容多模态大模型”。不只是对话体验,从容大模型还可以编程、写作、解题等。云从还对“从容”与ChatGPT进行横向对比演示,在对同一真题的解答过程中,从容大模型的答题速度相较更快,但推理能力、语义理解能力已超过GPT 3.5,略低于GPT4.0。

经第三方机构SuperClue、C-Eval等综合评测,从容大模型综合性能位列全球前五。同时,从容大模型具备多模态能力,在视觉、跨模态领域10次刷新世界纪录。

如今全球大模型竞争风起云涌,新的科技浪潮席卷各行各业,中国人工智能领域在焦虑和追赶中又一次走到了十字路口。如何书写这一次新的篇章,是所有中国AI企业迫切的使命。

本文由作者原创发布于TopMarketing,内容为作者独立观点, 不代表TopMarketing立场。如有转载需求,请联系作者本人。
创作不易,点个赞鼓励作者吧~
收藏 0
0
评论请文明发言,异常行为可能被禁言
2000
全部评论0
一键投稿
营销日历
2024 7
认领材料
*可补充证明材料,比如发布后台截图、名片、认证截图等
*如无其他证明,请点击请点击《认领声明》
+