La noche del 24 de marzo, DeepSeek lanzó una actualización del modelo: DeepSeek-V3-0324. Esta actualización corresponde a una nueva versión del modelo DeepSeek V3, y no se trata del DeepSeek-V4 o R2 que el mercado había estado esperando. Actualmente, su versión de código abierto ya está disponible en Hugging Face. Se informó que el modelo de código abierto tiene un tamaño de 685 mil millones de parámetros.
El mismo día, DeepSeek anunció en su grupo oficial de comunicación que el modelo DeepSeek V3 había completado una actualización menor, invitando a los usuarios a probar la experiencia en su sitio web oficial, aplicación o mini programa (con el modo de pensamiento profundo desactivado), mientras que la interfaz API y el método de uso permanecen sin cambios.
Según los comentarios de pruebas realizadas por usuarios, la capacidad de codificación de V3 se acerca a la de Claude 3.7, y su habilidad matemática también ha mejorado, pudiendo resolver problemas como un modelo de razonamiento.
El modelo DeepSeek-V3, lanzado previamente en diciembre de 2024, se destacó por su alta relación costo-beneficio, con un costo de “5,576 millones de dólares comparable al rendimiento de Claude 3.5”. Sus resultados en múltiples pruebas superaron a otros modelos de código abierto como Qwen2.5-72B y Llama-3.1-405B, y su rendimiento estuvo a la par de los mejores modelos de código cerrado del mundo, como GPT-4o y Claude-3.5-Sonnet. Sin embargo, hasta ahora no ha aparecido ninguna lista de pruebas de referencia sobre las capacidades de la nueva versión de DeepSeek-V3.
Posteriormente, en enero de 2025, DeepSeek lanzó el modelo DeepSeek-R1, con un rendimiento comparable a la versión oficial de OpenAI o1. Este modelo utilizó a gran escala técnicas de aprendizaje por refuerzo en la etapa de post-entrenamiento, mejorando significativamente su capacidad de razonamiento con muy pocos datos etiquetados.
El 25 de febrero de 2025, también surgieron rumores en el mercado de que el lanzamiento del modelo DeepSeek-R2 podría adelantarse. Reuters informó que DeepSeek está acelerando el lanzamiento del sucesor de DeepSeek-R1, el DeepSeek-R2. Según se sabe, DeepSeek-R2 estaba originalmente programado para mayo, pero la compañía ahora espera lanzarlo antes.