OpenAI计划发布开放权重模型 - 全球简讯

北京时间4月1日凌晨，OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)在社交媒体X平台上宣布，OpenAI将在未来几个月内发布一个“强大的带有推理能力的全新开放权重(open-weight)模型”。这是自2019年发布GPT-2以来，OpenAI时隔六年再次宣布新的开放模型计划。

回顾OpenAI的发展历程，虽然其以“开放”命名，但自GPT-3开始，OpenAI逐步转向封闭。特别是ChatGPT问世后，OpenAI模型只能通过其自家平台或微软Azure等合作伙伴访问或使用API接口，用户无法自行部署运行或二次开发。然而，随着DeepSeek等开放模型的迅速崛起，OpenAI感受到了压力。在今年2月，奥尔特曼公开承认DeepSeek削弱了OpenAI在AI领域的地位，并表示OpenAI需要想出一个不同的开源策略。

此次OpenAI计划发布的开放权重模型，并非完全开源。奥尔特曼在X平台上发起的民意调查显示，用户更倾向于一个虽然体积小但仍需要GPU运行的模型，如o3-mini级别。但奥尔特曼也透露，新模型将与o3-mini类似，但有所不同，并会保留一些“秘方”，如模型训练数据、预训练细节或关键架构组件等。

开放权重模型的发布意味着什么呢?奥尔特曼表示，OpenAI希望与开发者深入探讨如何最大化发挥其作用，并将在旧金山、欧洲和亚太地区举办开发者活动，以收集反馈并提供早期原型试用机会。他期待看到开发人员的成果，以及大公司和政府如何使用这一模型。这表明，此次开放模型主要针对开发人员、企业和政府，而非个人用户。

对于企业和政府而言，开放模型可以本地部署，在特殊应用场景中具有更大优势。它们可以在自己的服务器上运行模型，无需连接外网或接入云端算力，从而保护隐私、摆脱对OpenAI平台的依赖，并避免云服务带来的延迟、安全和成本问题。同时，开放模型的可控性和可审计性增强，开发者可以深入理解模型运行机制，更容易调试和调整策略。

然而，对于普通个人用户而言，能够流畅运行开放模型的硬件成本仍然较高。云端模型在算力和易用性方面仍具有明显优势，尤其在面对复杂任务时。不过，随着英伟达等推出个人AI超级计算机，企业和开发者能够以相对较低的成本运行开放模型，这或许会为开放模型的发展带来新的机遇。