Publicado 09/04/2025 13:27

Así son los modelos híbridos de Deep Cogito, la empresa de IA que pretende avanzar hacia la superinteligencia general

Logo de Deep Cogito.
Logo de Deep Cogito. - DEEP COGITO

   MADRID, 9 Abr. (Portaltic/EP) -

   Deep Cogito ha entrado en el sector de los modelos de Inteligencia Artificial (IA) con la presentación de sus modelos de código abierto Cogito v1, que se basan en modelos híbridos capaces de alternar entre capacidades de razonamiento y respuestas instantáneas, superando en rendimiento a los modelos equivalentes de Meta o DeepSeek, con lo que pretende avanzar hacia la superinteligencia general.

   La tecnológica fue fundada en junio del pasado año con sede en San Francisco (California, Estados Unidos) y pretende desarrollar una "superinteligencia general" capaz de realizar cualquier tipo de tarea, "no solo para igualar las capacidades humanas, sino también para descubrir capacidades completamente nuevas", a través del razonamiento avanzado y la "autosuperación iterativa".

   En este sentido, Cogito v1 se presenta como una serie de modelos de gran tamaño (LLM) de código abierto, que están basados en un funcionamiento híbrido, es decir, que permiten utilizar sus capacidades para ofrecer respuestas directas ante solicitudes sencillas, así como para reflexionar antes de responder ante cuestiones más complejas, de cara a utilizar sus recursos de forma más óptima.

   Tal y como ha puntualizado la compañía en un comunicado en su blog, Cogito v1 se ha presentado en los tamaños 3B, 8B, 14B, 32B y 70B, todos ellos desarrollados por "un pequeño equipo" en aproximadamente 75 días.

   Aunque estos modelos están basados en los modelos abiertos de Meta y Qwen de Alibaba, Deep Cogito ha asegurado que superan a "los mejores modelos abiertos del mismo tamaño", lo que incluye los modelos de Llama desarrollados por Meta, así como los modelos de DeepSeek.

   Concretamente, la compañía ha subrayado que el modelo Cogito v1 de 70B supera en al recientemente anunciado Llama 4 109B MoE en la prueba de IA de propósito general LiveBench. Siguiendo esta línea, según los resultados de evaluación compartidos, la versión más grande también supera al modelo de razonamiento R1 de DeepSeek en la mayoría de tareas de matemáticas y lenguaje.

   Para alcanzar estas capacidades, Deep Cogito ha matizado que sus modelos han sido entrenados utilizando métodos de Destilación y Amplificación Iterada (IDA), "una estrategia de alineación escalable y eficiente para la superinteligencia general mediante la automejora iterativa".

   Tal y como han explicado, al utilizar la destilación y la amplificación, utilizan más recursos computacionales para que el modelo alcance una mejor solución y, tras ello, consiguen reducir el proceso de pensamiento a los parámetros propios del modelo.

    "A media que el LLM mejora su inteligencia, el propio proceso de pensamiento se vuelve más potente", han sentenciado, al tiempo que ha determinado que se crea un ciclo de retroalimentación positiva en el que las capacidades del modelo se determinan cada vez más por los recursos computacionales y la eficacia del proceso de amplificación y destilación, en lugar de "por las limitaciones del supervisor original".

   Con todo ello, estos modelos Cogito v1 ya están disponibles para su descarga a través de Huggingface, Ollama, o a través de la API en Fireworks AI o Together AI. Igualmente, Deep Cogito ha señalado que, de cara a los próximos meses, lanzarán modelos más grandes, incluyendo los tamaños de 109B, 400B, 671B.

Contador