事件概览

日期:2025-12-14 19:51:53 / 人气:7



彭博社在12月10日报道称,Meta组建新团队TBD Lab,在新模型“牛油果”(Avocado)训练中通过蒸馏方式使用了多家第三方模型,包括谷歌 Gemma、OpenAI 的 gpt-oss以及阿里巴巴的 Qwen。该模型预计在明年春季亮相,且可能以闭源形式发布。Meta 方面回应称“训练按计划进行,时间表无实质变化”。受消息刺激,阿里巴巴美股盘前一度上涨约4%,收盘涨约2.53%。

为何转向“师从中国开源”

• Llama 4 失利与口碑受挫:作为开源“盟主”的旗舰,Llama 4 在2025年4月发布后未获开发者广泛认可,且在 LMArena 榜单的排名被曝出存在“作弊嫌疑”,负面评价增多。  

• 中国开源崛起、份额反超:以Qwen为代表的中国开源模型在性能与生态上快速逼近甚至对标头部闭源模型;2024年8月Qwen 的衍生模型数首次超过 Llama,2025年10月全球下载量也完成反超,Meta 在“数量与质量”两端失去开源第一的位置。  

• 战略与组织调整:Llama 4 翻车后,Meta 对内部进行“大清洗”,并由扎克伯格亲自挂帅推进新项目,引入Alexandr Wang执掌新实验室,转向更“闭源、集中化”的路线以寻求突破。

“蒸馏”的技术含义与行业影响

• 蒸馏是什么:在 AI 语境中,蒸馏通常指“用更强模型(教师模型)引导训练更轻、更快的学生模型”,或在训练流程中跨模型迁移知识,以提升效果/效率。此次报道明确提到 Avocado“蒸馏自”多家第三方模型,意味着其并非从零起步,而是站在“开源强者”的肩膀上优化。  

• 对开源生态的信号:当全球头部实验室开始“蒸馏”中国开源模型,意味着Qwen 等已成为事实上的“教师模型”,中国开源的影响力从“可用”走向“被默认标准之一”。这也会进一步加速全球开发者基于 Qwen 的二次创新与产业落地。

关键时间线与数据

时间 事件 影响/数据

2024-08 Qwen 衍生模型数首次超过 Llama 开源生态“数量”领先

2025-04 Llama 4发布,口碑与榜单争议 开源旗舰承压

2025-10 Qwen 全球下载量超过 Llama 开源生态“质量/采用”领先

2025-12-10 彭博社称 Avocado 训练“蒸馏”自 Gemma / gpt-oss / Qwen,或闭源发布 Meta 策略转向;阿里美股当日收盘+2.53%

2026年春季(预计) Avocado 计划亮相 关注“闭源形态”与“蒸馏细节”落地

争议与看点

• “闭源回归”与开源叙事的张力:Meta 曾以开源 Llama 凝聚开发者生态,如今新旗舰被曝“蒸馏多家、可能闭源”,外界将审视其“开源—闭源”的边界与承诺变化。  

• 人才与组织的高投入:为追赶对手,Meta 以上亿美元级签约金与高薪在全球“挖角”,新团队被视为“梦之队”。如何把“高薪+强将”转化为稳定产出,仍需时间检验。  

• 中国开源的全球渗透:除 Meta 外,亚马逊、Airbnb等公司已在新业务中大量使用 Qwen;英伟达、微软、Meta等基于 Qwen 开发衍生模型;斯坦福李飞飞团队、艾伦AI研究所等机构也在用 Qwen 做前沿创新。Qwen 已成为全球开发者的重要“底座”之一。

作者:杏耀注册登录平台




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 杏耀注册登录平台 版权所有