El laboratorio indio Sarvam ha presentado una nueva generación de modelos de lenguaje extensos, apostando por soluciones de IA abiertas, más pequeñas y eficientes para competir con sistemas costosos de grandes rivales estadounidenses y chinos.
Innovación en modelos de lenguaje de gran escala
Sarvam anunció en el India AI Impact Summit de Nueva Delhi el lanzamiento de modelos con 30.000 y 105.000 millones de parámetros, además de soluciones de texto a voz, voz a texto y visión para análisis de documentos. Estos avances representan una mejora significativa respecto al modelo Sarvam 1 de 2.000 millones de parámetros lanzado en octubre de 2024.
Arquitectura eficiente y entrenamiento desde cero
Ambos modelos emplean una arquitectura mixture-of-experts, que activa solo una fracción de los parámetros para reducir costes computacionales. El modelo de 30B ofrece una ventana de contexto de 32.000 tokens para conversaciones en tiempo real, mientras que el de 105B amplía esta capacidad a 128.000 tokens para tareas de razonamiento complejo.
A diferencia de otros sistemas, estos modelos fueron entrenados desde cero. El modelo de 30B utilizó aproximadamente 16 billones de tokens de texto y el de 105B fue entrenado en múltiples idiomas indios.
Aplicaciones en tiempo real y soporte multilingüe
Los nuevos modelos están diseñados para aplicaciones en tiempo real, como asistentes de voz y sistemas de chat en lenguas indias. El modelo de 30B compite directamente con Gemma 27B de Google y GPT-OSS-20B de OpenAI, mientras que el de 105B se posiciona frente a GPT-OSS-120B y Qwen-3-Next-80B de Alibaba.
Apoyo institucional y estrategia de escalado
El desarrollo de estos modelos contó con recursos del programa IndiaAI Mission, infraestructura de Yotta y soporte técnico de Nvidia. Sarvam planea escalar sus modelos de forma estratégica, priorizando aplicaciones prácticas por encima del tamaño bruto de los modelos.
La compañía tiene previsto liberar como código abierto los modelos de 30B y 105B, aunque no ha detallado si incluirá los datos de entrenamiento o el código completo.
Nuevos productos y respaldo financiero
Sarvam también desarrollará sistemas de IA especializados, como modelos para programación y herramientas empresariales bajo la línea Sarvam for Work, además de una plataforma de agentes conversacionales llamada Samvaad. Fundada en 2023, la empresa ha recaudado más de 50 millones de dólares y cuenta con el respaldo de importantes fondos de inversión como Lightspeed Venture Partners, Khosla Ventures y Peak XV Partners.