北京时间4月1日凌晨,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)在社交媒体X平台上宣布,OpenAI将在未来几个月内发布一个“强大的带有推理能力的全新开放权重(open-weight)模型”。这是自2019年发布GPT-2以来,OpenAI时隔六年再次宣布新的开放模型计划。
回顾OpenAI的发展历程,虽然其以“开放”命名,但自GPT-3开始,OpenAI逐步转向封闭。特别是ChatGPT问世后,OpenAI模型只能通过其自家平台或微软Azure等合作伙伴访问或使用API接口,用户无法自行部署运行或二次开发。然而,随着DeepSeek等开放模型的迅速崛起,OpenAI感受到了压力。在今年2月,奥尔特曼公开承认DeepSeek削弱了OpenAI在AI领域的地位,并表示OpenAI需要想出一个不同的开源策略。
此次OpenAI计划发布的开放权重模型,并非完全开源。奥尔特曼在X平台上发起的民意调查显示,用户更倾向于一个虽然体积小但仍需要GPU运行的模型,如o3-mini级别。但奥尔特曼也透露,新模型将与o3-mini类似,但有所不同,并会保留一些“秘方”,如模型训练数据、预训练细节或关键架构组件等。
开放权重模型的发布意味着什么呢?奥尔特曼表示,OpenAI希望与开发者深入探讨如何最大化发挥其作用,并将在旧金山、欧洲和亚太地区举办开发者活动,以收集反馈并提供早期原型试用机会。他期待看到开发人员的成果,以及大公司和政府如何使用这一模型。这表明,此次开放模型主要针对开发人员、企业和政府,而非个人用户。
对于企业和政府而言,开放模型可以本地部署,在特殊应用场景中具有更大优势。它们可以在自己的服务器上运行模型,无需连接外网或接入云端算力,从而保护隐私、摆脱对OpenAI平台的依赖,并避免云服务带来的延迟、安全和成本问题。同时,开放模型的可控性和可审计性增强,开发者可以深入理解模型运行机制,更容易调试和调整策略。
然而,对于普通个人用户而言,能够流畅运行开放模型的硬件成本仍然较高。云端模型在算力和易用性方面仍具有明显优势,尤其在面对复杂任务时。不过,随着英伟达等推出个人AI超级计算机,企业和开发者能够以相对较低的成本运行开放模型,这或许会为开放模型的发展带来新的机遇。