Parece que la llegada de Mustafa Suleyman desde Google Deepmind empieza a traer sus frutos poco a poco. Desde los primeros filtros “neural style” hasta los modelos que pintan escenas fotorrealistas a partir de un texto, la IA generativa ha vivido varias olas.
Lo cierto es que el gigante de Redmond había navegado esas aguas apoyándose en socios externos hasta ahora. Sin embargo, ahora sube un peldaño: MAI-Image-1, su primer modelo propio de texto-a-imagen, ya está desplegándose en Bing Image Creator y en Copilot Audio Expressions. Eso sí, con una salvedad importante: aún no está disponible en la UE, aunque “llegará pronto”, según Mustafa Suleyman.
Qué es MAI-Image-1 y cuales son sus límites
Desde Microsoft han indicado que MAI-Image-1 destaca en iluminación realista (rebotes de luz, reflejos), paisajes y un nivel de detalle fotográfico que, en sus pruebas, compite con modelos más grandes pero más lentos. Eso si, no le pidas realismo en retratos de personas ya que en eso el modelo de momento falla.
El objetivo está claro, calidad y rapidez para iterar. Luego, ya habrá tiempo de llevar el resultado a otras herramientas de edición. Además, el modelo se estrenó entrando en el “top 10” de LMArena, el benchmark comunitario donde se votan salidas de modelos de imagen.
MAI-Image-1 ya está disponible en Bing Image Creator (web, app y barra de búsqueda) y Copilot Audio Expressions, como opción junto a otros motores. En la UE todavía no, pero Microsoft dice que está en camino.
Más allá del producto, hay una lectura en clave estratégica. Microsoft quiere reducir la dependencia de terceros y acelerar su hoja de ruta propia en IA. MAI-Image-1 se suma a MAI-Voice-1 y MAI-1-preview (texto), presentados este verano, evidenciando una línea MAI que empieza a cubrir voz, texto e imagen.
El arranque en Top-10 de LMArena no es baladí pero tampoco un trofeo definitivo. Es una señal de madurez en un debut. Para equipos de diseño o marketing, este rendimiento inicial abre la puerta a A/B tests entre modelos (p. ej., comparar prompts entre DALL·E 3 y MAI-Image-1 con el mismo brief).


Quiero que generes un Windows 12.