Alibaba ha lanzado Qwen 3.5, un nuevo modelo de lenguaje de código abierto que está marcando un hito en el campo de la inteligencia artificial para empresas. A pesar de contar con 397 mil millones de parámetros totales, solo activa 17 mil millones por token, lo que le permite competir e incluso superar a modelos mucho más grandes, como el propio Qwen3-Max de Alibaba con más de un billón de parámetros, pero a una fracción del costo.

Este avance representa un cambio significativo para los líderes de TI que evalúan infraestructuras de IA. Qwen 3.5 demuestra que los modelos que se pueden ejecutar, poseer y controlar localmente ahora son capaces de rivalizar con los servicios que tradicionalmente se alquilan. La arquitectura del modelo se basa en el experimental Qwen3-Next, ampliando drásticamente el número de expertos de 128 a 512. Esto se traduce en una latencia de inferencia notablemente menor, ya que la huella de cómputo se asemeja más a un modelo denso de 17B que a uno de 400B, mientras aprovecha la profundidad de su conjunto de expertos para razonamientos especializados.
Las mejoras en velocidad son impresionantes: Qwen 3.5 es 19 veces más rápido que Qwen3-Max y 7.2 veces más rápido que el modelo Qwen 3 de 235B-A22B. Además, Alibaba afirma que su ejecución es un 60% más barata que la de su predecesor y ocho veces más eficiente para manejar cargas de trabajo concurrentes masivas, cifras cruciales para la optimización de costos de inferencia. El modelo también adopta la predicción multi-token y hereda un sistema de atención optimizado para contextos largos, permitiendo operar cómodamente con ventanas de hasta 256K tokens, y hasta 1 millón en la variante alojada Qwen3.5-Plus.
Una característica destacada es su naturaleza multimodal nativa. A diferencia de los enfoques anteriores, Qwen 3.5 se entrenó simultáneamente con texto, imágenes y video, integrando el razonamiento visual en su núcleo. Esto mejora su rendimiento en tareas que requieren una estrecha interacción texto-imagen, superando a modelos como Claude Opus 4.5 en tareas multimodales y compitiendo con GPT-5.2, todo ello con una cantidad de parámetros significativamente menor.
En cuanto a la cobertura de idiomas, Qwen 3.5 ha expandido su vocabulario a 250k tokens y soporta 201 idiomas y dialectos, lo que resulta en una codificación más eficiente para escrituras no latinas y, por ende, menores costos de inferencia y tiempos de respuesta más rápidos. Alibaba lo posiciona también como un modelo agéntico, capaz de realizar acciones autónomas multi-paso, y se integra con el framework OpenClaw. Aunque su ejecución local requiere hardware considerable (GPU nodes), su licencia Apache 2.0 permite uso comercial sin restricciones, facilitando su adopción empresarial. Alibaba ya ha confirmado que esta es la primera de una familia de modelos, anticipándose lanzamientos más pequeños y configuraciones adicionales.
Fuente Original: https://venturebeat.com/technology/alibabas-qwen-3-5-397b-a17-beats-its-larger-trillion-parameter-model-at-a
Artículos relacionados de LaRebelión:
- Nuevo Ataque SmartLoader Trojaniza Servidor Oura para Robar Datos
- Irlanda Renta Basica para Artistas Un Mundo Nuevo
- Windows 11 Permisos estilo movil para apps
- Windows 11 26H1 Exclusivo para Nuevas PCs con Arm
- OpenAI Mejora API Mas Habilidades y Terminal para Agentes
Artículo generado mediante LaRebelionBOT



