En el Conferencia de desarrolladores Google I/O 2024 el martesGoogle anunció que está construyendo Gemini Nano, el más pequeño de sus modelos de IA, directamente en el cliente de escritorio Chrome, comenzando con Chrome 126.
Esto, según la compañía, permitirá a los desarrolladores utilizar el modelo en el dispositivo para potenciar sus propias funciones de IA. El propio Google planea utilizar esta nueva capacidad para potenciar funciones como la herramienta existente “ayúdame a escribir” de Workspace Lab en Gmail, por ejemplo.
La compañía dice que es el trabajo reciente sobre la compatibilidad con WebGPU y WASM en Chrome lo que permite que estos modelos se ejecuten a una velocidad razonable en un amplio conjunto de hardware.
En una sesión informativa previa al anuncio del martes, Jon Dahlke, director de gestión de productos de Google para Chrome, señaló que Google estaba en conversaciones con otros proveedores de navegadores para habilitar esta (o una característica similar) también en sus navegadores.
“Hemos comenzado a interactuar con otros navegadores y abriremos un programa de vista previa para los desarrolladores”, escribió Dahlke en el anuncio del martes. “Con webGPU, WASM y Gemini integrados en Chrome, creemos que la web ESTÁ preparada para la IA. “
Sin embargo, dudo que la mayoría de los competidores de Chrome quieran apostar únicamente por los modelos de inteligencia artificial de Google. Lo que tiene más sentido es permitir que los navegadores (y los desarrolladores) ejecuten el modelo de su elección. Google claramente optaría por ejecutar Gemini para sus aplicaciones, pero estos modelos son lo suficientemente pequeños como para permitir a los desarrolladores elegir el que quieran para sus aplicaciones.
La apuesta de Google, sin embargo, es habilitar una serie de API de alto nivel en Chrome para traducir, subtitular y transcribir texto en el navegador utilizando sus modelos Gemini.
“Para ofrecer esta característica, ajustamos nuestra versión más eficiente de Gemini y optimizamos Chrome”, dijo Dahlke durante la conferencia magistral para desarrolladores de hoy en I/O. “Ahora queremos darte acceso a los modelos Gemini en Chrome. Nuestra visión es brindarle los modelos de IA más potentes en Chrome para llegar a miles de millones de usuarios sin tener que preocuparse por la ingeniería, el ajuste, la capacidad y el costo rápidos. Todo lo que tienes que hacer es llamar a algunas API de alto nivel: traducir, subtitular, transcribir. Este es un gran cambio para la web y queremos hacerlo bien”.
Para los desarrolladores, Google ahora también está utilizando el modelo Gemini Nano integrado para impulsar algunas funciones nuevas en Chrome DevTools Console. Gracias a esto, las herramientas de desarrollo de Chrome ahora pueden explicar errores y proporcionar soluciones de depuración directamente en la consola.
¡Estamos lanzando un boletín informativo sobre IA! Inscribirse aquí para comenzar a recibirlo en sus bandejas de entrada el 5 de junio.