Inicio Boletín Detalle

Actualización de la versión del modelo DeepSeek V3

2025-03-26 09:00

La noche del 24 de marzo, DeepSeek lanzó una actualización del modelo: DeepSeek-V3-0324. Esta actualización corresponde a una nueva versión del modelo DeepSeek V3, y no se trata del DeepSeek-V4 o R2 que el mercado había estado esperando. Actualmente, su versión de código abierto ya está disponible en Hugging Face. Se informó que el modelo de código abierto tiene un tamaño de 685 mil millones de parámetros.

El mismo día, DeepSeek anunció en su grupo oficial de comunicación que el modelo DeepSeek V3 había completado una actualización menor, invitando a los usuarios a probar la experiencia en su sitio web oficial, aplicación o mini programa (con el modo de pensamiento profundo desactivado), mientras que la interfaz API y el método de uso permanecen sin cambios.

Según los comentarios de pruebas realizadas por usuarios, la capacidad de codificación de V3 se acerca a la de Claude 3.7, y su habilidad matemática también ha mejorado, pudiendo resolver problemas como un modelo de razonamiento.

El modelo DeepSeek-V3, lanzado previamente en diciembre de 2024, se destacó por su alta relación costo-beneficio, con un costo de “5,576 millones de dólares comparable al rendimiento de Claude 3.5”. Sus resultados en múltiples pruebas superaron a otros modelos de código abierto como Qwen2.5-72B y Llama-3.1-405B, y su rendimiento estuvo a la par de los mejores modelos de código cerrado del mundo, como GPT-4o y Claude-3.5-Sonnet. Sin embargo, hasta ahora no ha aparecido ninguna lista de pruebas de referencia sobre las capacidades de la nueva versión de DeepSeek-V3.

Posteriormente, en enero de 2025, DeepSeek lanzó el modelo DeepSeek-R1, con un rendimiento comparable a la versión oficial de OpenAI o1. Este modelo utilizó a gran escala técnicas de aprendizaje por refuerzo en la etapa de post-entrenamiento, mejorando significativamente su capacidad de razonamiento con muy pocos datos etiquetados.

El 25 de febrero de 2025, también surgieron rumores en el mercado de que el lanzamiento del modelo DeepSeek-R2 podría adelantarse. Reuters informó que DeepSeek está acelerando el lanzamiento del sucesor de DeepSeek-R1, el DeepSeek-R2. Según se sabe, DeepSeek-R2 estaba originalmente programado para mayo, pero la compañía ahora espera lanzarlo antes.

Este boletín se compila y reproduce desde el Internet y socios estratégicos, solo para proporcionar comunicación a los lectores, si hay infracción u otros problemas, infórmenos a tiempo, este sitio será modificado o eliminado. Correo electrónico: news@wedoany.com
Boletín
Gran avance de la fusión nuclear controlable de China ASCENZA lanza en Portugal un nuevo producto de feromonas para la protección duradera de cultivos de olivo y limón El presidente de Turquía anuncia planes para construir su propio reactor de investigación Uruguay establece exportación de ganado a Azerbaiyán Potencial de exportación de productos agrícolas rusos a Brasil: superará los 250 millones de dólares para 2030 La producción de cobre en Perú creció un 7% en enero Tesla comienza a producir una versión no lanzada del nuevo Model Y La nueva planta de vehículos eléctricos de Hyundai en Georgia inicia operaciones Google confirma que dejará de dar soporte al proyecto de código abierto de Android Empresas de EE.UU. y Brasil colaboran en el desarrollo de tuberías flexibles para aguas profundas con alto contenido de CO2 La Autoridad del Canal de Panamá lanza el plan "NetZero Slot" para acelerar la descarbonización del transporte marítimo Schneider Electric lanza "Una Plataforma de Red Digital" Liang Wenfeng de DeepSeek entra por primera vez en la lista mundial de multimillonarios Metro de São Paulo, Brasil, inicia licitación para la Línea 19 y avanza en la planificación de la Línea 14 El proyecto del puerto de Montevideo de CCCC Shanghai entra en la recta final Última subasta de energía eólica terrestre y solar en Alemania supera las expectativas Repsol y Schroders Greencoat adquieren proyectos de energía renovable en España Nueva ruta para el C919 Inauguran nuevo tramo de la autopista Pachuca-Huejutla en México Trump anuncia aranceles del 25% a todos los autos importados