Revela un método de entrenamiento para su IA que reduce costos en un 88%

La compañía china High-Flyer ha causado un gran impacto en el mercado de la inteligencia artificial (IA) desde su irrupción a fines de enero. Con su innovador producto, Deepseek, ha logrado establecerse por encima de sus competidores gracias a su enfoque abierto y a las diversas ventajas que ofrece. Sin embargo, el debate genuino ha tomado un nuevo giro en las últimas semanas, especialmente en relación con el costo de capacitar a sus modelos. Según los desarrolladores de este sistema, han invertido apenas $5.6 millones en este proceso, un número que sigue siendo sorprendente más de tres meses después, lo que invita a mirar esta cifra con cierta desconfianza.

A pesar de esto, Deepseek ha demostrado que es posible enfrentar la capacitación de nuevos modelos de IA gastando considerablemente menos en comparación con las gigantescas empresas estadounidenses como OpenAi, Google o Anthropic. Uno de los actores más relevantes en este contexto es el gigante tecnológico chino Alibaba, que está siguiendo una tendencia similar a la de Deepseek. Alibaba afirma haber desarrollado un sistema de capacitación de modelos de IA que logra reducir los costos en casi un 90%, lo que podría tener un efecto transformador en las capacidades de búsqueda de IA.

El tesoro de Alibaba se llama Rustoch

La estrategia que han implementado los ingenieros de Alibaba para disminuir los costos de capacitación de sus modelos de IA es realmente asombrosa. En lugar de interactuar con motores de búsqueda reales durante este proceso, han introducido un enfoque innovador, denominado tecnología de simulación, que permite realizar funciones de búsqueda de manera efectiva. Para entender por qué este método resulta mucho más económico, es crucial considerar que los gastos asociados con el acceso a motores de búsqueda comerciales suelen ser considerablemente altos.

Alibaba ha establecido un modelo que actúa como un motor de búsqueda, permitiendo que otros modelos de IA se capaciten a través de él.

Según Alibaba, se puede enviar 64,000 consultas al motor de búsqueda de Google por medio de una API a un costo aproximado de $586.70, mientras que las respuestas necesarias para la capacitación son generadas por un modelo de IA que cuenta con 14,000 millones de parámetros. Esto representa una disminución de costos del 88% en comparación. De hecho, los ingenieros de Alibaba parecen haber encontrado una solución muy efectiva al desarrollar un modelo que puede actuar como un motor de búsqueda, capacitándose a sí mismo y permitiendo que otros modelos de IA puedan resolver consultas más eficientemente. Esta estrategia presenta una ventaja clara: la capacitación ya no depende de la interacción con infraestructuras de búsqueda externas.

Como es de conocimiento general, Alibaba es una compañía enorme en el sector tecnológico. Sin embargo, esta estrategia innovadora podría ser adoptada por muchas empresas más pequeñas, permitiéndoles capacitar sus propios modelos de IA sin tener que realizar una gran inversión financiera. Además, esta tecnología tiene el potencial de mejorar significativamente no solo las funciones de búsqueda de los modelos de IA, sino también su capacidad para llevar a cabo procesos de razonamiento más complejos. Alibaba Zerostoch ha demostrado su extraordinario potencial al combinar funciones tanto de búsqueda en Internet como de razonamiento avanzado en tan solo tres días tras su creación, lo que le permite ofrecer respuestas precisas a consultas complejas.

Imagen | Markus Spiske

Más información | SCMP

En | Samsung se está preparando para darle a TSMC una barra en la que más duele: la producción de chips para IA