Publicado 28/01/2025 12:34

Nvidia y OpenAI subrayan el avance en IA generativa que ofrece el modelo de razonamiento de DeepSeek R1

27 January 2025, United Kingdom, London: In this photo illustration, the DeepSeek app is seen on a phone screen with the DeepSeek website in the background. Major US technology firms have seen their shares fall as Chinese developers launch the low-cost De
27 January 2025, United Kingdom, London: In this photo illustration, the DeepSeek app is seen on a phone screen with the DeepSeek website in the background. Major US technology firms have seen their shares fall as Chinese developers launch the low-cost De - Vuk Valcic/SOPA Images via ZUMA / DPA

   MADRID, 28 Ene. (Portaltic/EP) -

   Compañías del sector tecnológico y de Inteligencia Artificial (IA), como Nvidia y OpenAI, se han pronunciado ante el auge del asistente de IA generativa DeepSeek, subrayando el avance en inteligencia artificial que ofrece, en concreto, en referencia a su modelo R1 capaz de razonar.

   El asistente DeepSeek, desarrollado por la tecnológica china con el mismo nombre, es un asistente de IA generativa gratuito que, tras su lanzamiento el pasado 11 de enero en la App Store, ha conseguido ocupar la primera posición en la tienda de Apple en Estados Unidos, por delante del 'chatbot' de OpenAI, ChatGPT, que es el más popular en el país desde hace más de dos años.

   Ante el auge de DeepSeek, compañías del sector como Nvidia y OpenAI han subrayado sus capacidades, poniendo sobre la mesa el avance en IA generativa que supone este asistente, sobre todo, en referencia a sus modelos de razonamiento R1, a pesar de que su éxito ha provocado el desplome en bolsa de la propia Nvidia y otras firmas tecnológicas.

   Concretamente Nvidia anunciaba este lunes una caída de alrededor de un 17%, lo que supone una reducción de su capitalización de en torno a 500.000 millones de dólares (casi 480.000 millones de euros), y que se refleja como la mayor pérdida intradía jamás registrada. Lo mismo ha ocurrido con AMD (-4,77%), Arm Holdings (-8,4%), Micron (-9,8%) y ASM International (-11%).

   Esta caída se debe, en parte, al impacto que puede tener DeepSeek en la demanda de microchips de alta gama, ya que la firma china tiene como objetivo ofrecer un rendimiento competitivo, a pesar de utilizar chips de menor coste y menor cantidad de datos con un modelo de código abierto. Esto permite reducir el precio de uso de su tecnología de IA.

   No obstante, Nvidia se ha pronunciado subrayando la familia de modelos de razonamiento recientemente presentada DeepSeek-R1-Zero y DeepSeek-R1, que ha calificado como "un excelente avance en inteligencia artificial" y un ejemplo de "cómo se pueden crear nuevos modelos" utilizando la técnica de escalado de tiempo de prueba, tal y como ha detallado en un comunicado recogido por Bloomberg.

   Esta técnica de escalado en tiempo de prueba se basa en que, los modelos pueden proporcionar mejores respuestas si utilizan potencia informática adicional que les permita razonar al hacer predicciones o generar texto e imágenes.

   Siguiendo esta línea, la tecnológica ha destacado cómo DeepSeek ha aprovechado "modelos ampliamente disponibles y computación que cumple totalmente con el control de exportaciones" de Estados Unidos, en referencia a los chips que ha utilizado la firma china para entrenar sus modelos, que son versiones de las GPU de Nvidia destinadas al mercado chino.

   Asimismo, Nvidia también ha subrayado que la inferencia en la IA "requiere un número significativo de GPUs Nvidia y redes de alto rendimiento", por lo que el avance de DeepSeek continuará impulsando los productos del fabricante de chips estadounidense.

UN MODELO IMPRESIONANTE, SEGÚN OPENAI

   Por su parte, el director ejecutivo de OpenAI, Sam Altman, también se ha pronunciado respecto a las capacidades del modelo R1 de DeepSeek, al que ha definido como "un modelo impresionante", tal y como ha compartido en una publicación en X (antigua Twitter).

   En concreto, Altman ha subrayado este modelo de razonamiento "especialmente teniendo en cuenta lo que puede ofrecer por el precio", dado que, por el momento, el asistente permite llevar a cabo todas sus funciones de forma gratuita para los usuarios, y ha sido entrenado con chips más económicos.

   Siguiendo esta línea, Altman ha señalado igualmente que "es realmente estimulante" tener un nuevo competidor como DeepSeek y que, desde OpenAI, ofrecerán modelos "mucho mejores" en sus próximos lanzamientos.

   Con todo ello, ha reflejado que seguirán ejecutando su hoja de ruta de investigación y que "ahora más que nunca" deben contar con más recursos informáticos para conseguir sus propósitos de avance con éxito. "Esperamos poder ofrecerles AGI y más", ha sentenciado, en referencia a la Inteligencia Artificial General en la que están trabajando.

SOLUCIONES CREATIVAS PARA AVANZAR EN MATERIA DE IA A MENOR COSTE

Además de todo ello, el antiguo CEO de Intel, Pat Gelsinger, también ha compartido los avances que presenta DeepSeek para el sector tecnológico y de la IA, sobre todo, reflejando la habilidad de ofrecer un alto rendimiento de IA a un menor coste.

Tal y como ha detallado en una publicación en X, las capacidades que ofrece DeepSeek recuerdan "tres enseñanzas importantes de la historia de la informática". En concreto, Gelsinger ha indicado que conseguir menores costes para el desarrollo de esta tecnología permitirá ampliar el mercado de la IA.

Asimismo, ha apuntado que la ingeniería "tiene limitaciones" y que, tal y como ha mostrado DeepSeek, a pesar de tener recursos limitados, los ingenieros pueden "encontrar soluciones creativas". Finalmente, ha destacado que la firma china "ayudará a restablecer el mundo cada vez más cerrado de los modelos de IA fundacionales", gracias al uso de modelos abiertos.

En este marco, Gelsinger ya está utilizando el modelo R1 de DeepSeek en su propia empresa de mensajería Gloo. Según ha compartido en declaraciones a TechCrunch, su equipo está utilizando este modelo para desarrollar un servicio de IA al que se refiere como Kallm, que tendrá un formato de 'chatbot', entre otras opciones.

Así, ha señalado que está utilizando R1 porque, aunque sus ingenieros podrían haber ejecutado el modelo o1 de OpenAI, "solo pueden acceder a o1 a través de las API". Sin embargo, el modelo de DeepSeek es de código abierto, por lo que lo han podido utilizar integramente para construir su servicio Kallm.

Tal y como ha concluido Gelsinger, DeepSeek puede demostrar que la IA avanza "mediante la creatividad en la ingeniería, sin invertir más potencia de 'hardware' y recursos informáticos en el problema".

Contador