Inicio Boletín Detalle

OpenAI planea lanzar un modelo de pesos abiertos

2025-04-02 10:01

En la madrugada del 1 de abril, hora de Pekín, el director ejecutivo de OpenAI, Sam Altman, anunció en la plataforma de redes sociales X que OpenAI lanzará en los próximos meses un "poderoso modelo de pesos abiertos (open-weight) con capacidades de razonamiento". Este será el primer anuncio de un nuevo modelo abierto de OpenAI desde el lanzamiento de GPT-2 en 2019, tras seis años.

Revisando la historia de OpenAI, aunque lleva el nombre de "abierto", desde GPT-3 la compañía comenzó a cerrarse gradualmente. Especialmente tras el lanzamiento de ChatGPT, los modelos de OpenAI solo podían accederse a través de su propia plataforma o socios como Microsoft Azure mediante interfaces API, sin posibilidad de que los usuarios los desplegaran o desarrollaran secundariamente. Sin embargo, con el rápido ascenso de modelos abiertos como DeepSeek, OpenAI sintió presión. En febrero de este año, Altman admitió públicamente que DeepSeek había debilitado la posición de OpenAI en el campo de la IA y señaló que la compañía necesitaba idear una nueva estrategia de código abierto.

El modelo de pesos abiertos que OpenAI planea lanzar no será completamente de código abierto. Una encuesta iniciada por Altman en X mostró que los usuarios prefieren un modelo pequeño pero que aún requiera GPU para ejecutarse, como el nivel de o3-mini. Sin embargo, Altman reveló que el nuevo modelo será similar a o3-mini pero diferente, reteniendo algunos "ingredientes secretos" como los datos de entrenamiento, detalles de preentrenamiento o componentes clave de la arquitectura.

Para empresas y gobiernos, los modelos abiertos pueden desplegarse localmente, ofreciendo mayores ventajas en escenarios específicos. Pueden ejecutarse en servidores propios sin necesidad de conexión a internet o computación en la nube, protegiendo la privacidad, eliminando la dependencia de la plataforma de OpenAI y evitando los retrasos, riesgos de seguridad y costos asociados con los servicios en la nube. Además, los modelos abiertos ofrecen mayor control y auditabilidad, permitiendo a los desarrolladores comprender mejor su funcionamiento y ajustar estrategias con facilidad.

Sin embargo, para los usuarios individuales, el costo del hardware necesario para ejecutar modelos abiertos de manera fluida sigue siendo alto. Los modelos en la nube aún tienen ventajas claras en términos de potencia computacional y facilidad de uso, especialmente para tareas complejas. No obstante, con el lanzamiento de supercomputadoras personales de IA por parte de empresas como Nvidia, las empresas y desarrolladores podrían ejecutar modelos abiertos a un costo relativamente bajo, lo que podría abrir nuevas oportunidades para su desarrollo.

Este boletín se compila y reproduce desde el Internet y socios estratégicos, solo para proporcionar comunicación a los lectores, si hay infracción u otros problemas, infórmenos a tiempo, este sitio será modificado o eliminado. Correo electrónico: news@wedoany.com
Boletín
El gobierno italiano considera invertir en Newcleo Argentina exporta gas natural de Vaca Muerta a Brasil por primera vez a través de un gasoducto boliviano Estados Unidos elimina la política de plazos para exportaciones de gas natural licuado Siria sufre un apagón nacional; equipos técnicos trabajan urgentemente para aliviar la presión por la escasez de electricidad El embalse regulador de Hondas en el proyecto de la central hidroeléctrica Ivirizu II en Bolivia logra con éxito la acumulación de agua Sungrow y SunBeat Energy profundizan su cooperación estratégica Las ventas de Tesla continúan cayendo en varios países europeos Iberdrola vende el 100% de Maine Natural Gas a Unitil TotalEnergies y European Energy firman una declaración conjunta BW Energy obtiene la renovación de un campo petrolero marino en Brasil OpenAI completa la mayor ronda de financiación en la historia de una empresa privada con 40 mil millones de dólares Enlight asegura 773 millones de dólares en financiación para el proyecto solar Country Acres en California El primer proyecto de generación de energía a partir de residuos a gran escala en Costa Rica, construido por Oriental International, avanza DeepSeek supera la barrera lingüística en el rescate de Myanmar en 7 horas China Power Construction logra un avance "cero" en el sector de energías renovables en Perú Ventas de vehículos de pasajeros de BYD en los primeros tres meses alcanzan 986.000 unidades, un aumento del 58% El director de la Agencia Nacional de Energía de China, Wang Hongzhi, se reúne con el ministro de Energía de Chile, Diego Pardo Exportaciones de pollo de Brasil en enero y febrero alcanzan un récord histórico Shell completa la venta de activos de refinería y químicos en Singapur Ministerio de Agricultura de Rusia: La producción de uvas en Rusia alcanza un récord histórico en 2024