Lenguage de animales: Cómo la IA de Google ayuda a decodificar la comunicación de los delfines

14 de abril de 2025  Google
Autores: Dra. Denise Herzing Directora de investigación/fundadora del Proyecto Delfines Salvajes 
 Dr. Thad Starner Científico investigador de Google DeepMind y profesor de Georgia Tech 
DDolphinGemma, un gran modelo de lenguaje desarrollado por Google, está ayudando a los científicos está ayudando a los científicos a estudiar cómo se comunican los delfines y, con suerte, a descubrir también qué dicen.
 Durante décadas, comprender los chasquidos, silbidos y pulsos explosivos de los delfines ha sido una frontera científica. 
¿Qué pasaría si no solo pudiéramos escuchar a los delfines, sino también comprender los patrones de su compleja comunicación con la suficiente precisión como para generar respuestas realistas? 
 Hoy, en el Día Nacional del Delfín, Google, en colaboración con investigadores de Georgia Tech y la investigación de campo del Proyecto Delfín Salvaje (WDP), anuncia avances en DolphinGemma: un modelo fundamental de IA entrenado para aprender la estructura de las vocalizaciones de los delfines y generar nuevas secuencias de sonidos similares a las de estos. 
Este enfoque, en la búsqueda de la comunicación interespecies, amplía los límites de la IA y nuestra posible conexión con el mundo marino.
 Investigando la sociedad de delfines durante décadas
 Comprender cualquier especie requiere un contexto profundo, y esa es una de las muchas cosas que ofrece el WDP. Desde 1985, el WDP ha llevado a cabo el proyecto de investigación submarina de delfines más antiguo del mundo, estudiando una comunidad específica de delfines moteados del Atlántico (Stenella frontalis) salvajes en las Bahamas a lo largo de generaciones. 
Este enfoque no invasivo, 
"En su mundo, en sus propios términos", produce un conjunto de datos rico y único: décadas de video y audio submarinos, meticulosamente combinados con las identidades individuales de los delfines, sus historias de vida y sus comportamientos observados. 
 Delfines nadando en el agua Una manada de delfines moteados del Atlántico, Stenella frontalis

Un enfoque principal del WDP es observar y analizar la comunicación natural y las interacciones sociales de los delfines. El trabajo submarino permite a los investigadores vincular directamente los sonidos con comportamientos específicos, algo que la observación en superficie no puede lograr. 
Durante décadas, han correlacionado los tipos de sonido con los contextos conductuales.
A continuación, se presentan algunos ejemplos: Silbatos característicos (nombres únicos) que pueden usar las madres y sus crías para reunirse Los "graznidos" de pulsos explosivos se escuchan a menudo durante las peleas 
Los zumbidos de clic se utilizan a menudo durante el cortejo o la persecución de tiburones. Conocer a los delfines individuales involucrados es crucial para una interpretación precisa. 
El objetivo final de este trabajo observacional es comprender la estructura y el significado potencial de estas secuencias de sonidos naturales, buscando patrones y reglas que puedan indicar lenguaje. Este análisis a largo plazo de la comunicación natural constituye la base de la investigación de WDP y proporciona un contexto esencial para cualquier análisis de IA. Una imagen dividida: a la izquierda, un delfín tocando el fondo arenoso bajo el agua; a la derecha, un espectrograma con rayas verticales brillantes que indican sonidos de alta frecuencia. 

Izquierda: Una madre delfín moteado observa a su cría mientras busca alimento. Usa su característico silbido para llamarla cuando termina de comer. 
Derecha: Espectrograma para visualizar el silbido. 
 Presentando a DolphinGemma 
Analizar la comunicación natural y compleja de los delfines es una tarea monumental, y el vasto conjunto de datos etiquetados de WDP brinda una oportunidad única para la IA de vanguardia.  
Desarrollado por Google, este modelo de IA utiliza tecnologías de audio específicas de Google: el tokenizador SoundStream representa eficientemente los sonidos de los delfines, que luego son procesados ​​por una arquitectura de modelo adaptada a secuencias complejas. 
Este modelo de aproximadamente 400 millones de parámetros tiene el tamaño óptimo para ejecutarse directamente en los teléfonos Pixel que WDP utiliza en el campo. 
 Dos espectrogramas: el de la izquierda muestra tres patrones de sonido arqueados; el de la derecha muestra un patrón de sonido más uniforme. 

Izquierda: Silbidos (izquierda) y pulsos de ráfaga (derecha) generados durante las primeras pruebas de DolphinGemma. 
 Este modelo se basa en la información de Gemma , la colección de modelos abiertos, ligeros y de vanguardia de Google, creados con la misma investigación y tecnología que impulsa nuestros modelos Gemini. 
Entrenado extensamente con la base de datos acústica de delfines moteados del Atlántico salvajes de WDP, DolphinGemma funciona como un modelo de entrada y salida de audio que procesa secuencias de sonidos naturales de delfines para identificar patrones, estructurar y, en última instancia, predecir los probables sonidos posteriores en una secuencia, de forma similar a cómo los grandes modelos lingüísticos para el lenguaje humano predicen la siguiente palabra o elemento en una oración. El WDP está comenzando a implementar DolphinGemma esta temporada de campo, con beneficios potenciales inmediatos. 
Al identificar patrones de sonido recurrentes, grupos y secuencias fiables, el modelo puede ayudar a los investigadores a descubrir estructuras ocultas y posibles significados en la comunicación natural de los delfines, una tarea que antes requería un inmenso esfuerzo humano.
 Con el tiempo, estos patrones, complementados con sonidos sintéticos creados por los investigadores para referirse a objetos con los que a los delfines les gusta jugar, podrían establecer un vocabulario compartido con ellos para la comunicación interactiva. 

 Uso de teléfonos Pixel para escuchar y analizar sonidos de delfines 

Además de analizar la comunicación natural, el WDP también sigue un camino paralelo y diferenciado: explorar la posible interacción bidireccional mediante tecnología en el océano. 
Este esfuerzo condujo al desarrollo del sistema CHAT (Telemetría de Aumento Auditivo para Cetáceos), en colaboración con el Instituto Tecnológico de Georgia. CHAT es una computadora submarina diseñada no para descifrar directamente el complejo lenguaje natural de los delfines, sino para establecer un vocabulario compartido más simple. 
 El concepto se basa inicialmente en asociar silbidos sintéticos novedosos (creados por CHAT, distintos de los sonidos naturales de los delfines) con objetos específicos que los delfines disfrutan, como sargazo, pastos marinos o bufandas que usan los investigadores.
 Al demostrar el sistema entre humanos, los investigadores esperan que los delfines, con su curiosidad natural, aprendan a imitar los silbidos para solicitar estos objetos. 
Con el tiempo, a medida que se comprendan mejor los sonidos naturales de los delfines, también podrán incorporarse al sistema.

 Vídeo explicativo del CHAT 1:37 Para permitir la interacción bidireccional, el sistema CHAT primero debe: Escuche la mímica con precisión en medio del ruido del océano. Identifique qué silbato fue imitado en tiempo real. Informe al investigador (a través de auriculares conductores óseos que funcionan bajo el agua) qué objeto "solicitó" el delfín. 
Permita que el investigador responda rápidamente ofreciendo el objeto correcto, reforzando la conexión. Un Google Pixel 6 se encargó del análisis de alta fidelidad de los sonidos de los delfines en tiempo real. La próxima generación, centrada en el Google Pixel 9 (probablemente se lanzará en el verano de 2025), refuerza este esfuerzo integrando funciones de altavoz y micrófono y utilizando el procesamiento avanzado del teléfono para ejecutar simultáneamente modelos de aprendizaje profundo y algoritmos de coincidencia de plantillas. 
 Dos retratos: a la izquierda, una mujer en un barco sosteniendo un dispositivo; a la derecha, un hombre en un interior usando auriculares y sosteniendo un dispositivo similar. Izquierda: Dra. Denise Herzing con el logo "Chat Senior, 2012". Derecha: Charles Ramey, estudiante de doctorado de Georgia Tech, con el logo "Chat Junior, 2025". El uso de smartphones Pixel reduce drásticamente la necesidad de hardware personalizado, mejora el mantenimiento del sistema, disminuye el consumo de energía y reduce el coste y el tamaño del dispositivo: ventajas cruciales para la investigación de campo en alta mar. Por otro lado, la capacidad predictiva de DolphinGemma puede ayudar a CHAT a anticipar e identificar posibles imitadores en una fase más temprana de la secuencia de vocalización, lo que aumenta la velocidad de reacción de los investigadores ante los delfines y hace que las interacciones sean más fluidas y se refuercen. Teléfono Pixel dentro de una funda conectado a cables 
Un Google Pixel 9 dentro del último hardware del sistema CHAT. 

 Compartiendo DolphinGemma con la comunidad investigadora 
Reconociendo el valor de la colaboración en el descubrimiento científico, planeamos compartir DolphinGemma como modelo abierto este verano. 
Aunque se entrenó con los sonidos del delfín moteado del Atlántico, anticipamos su posible utilidad para investigadores que estudian otras especies de cetáceos, como los delfines mulares o los delfines tornillo. Podría ser necesario ajustar las vocalizaciones de diferentes especies, y la naturaleza abierta del modelo facilita esta adaptación. 
 Al proporcionar herramientas como DolphinGemma, esperamos brindarles a los investigadores de todo el mundo las herramientas para extraer sus propios conjuntos de datos acústicos, acelerar la búsqueda de patrones y profundizar colectivamente nuestra comprensión de estos mamíferos marinos inteligentes. 
 El camino para comprender la comunicación de los delfines es largo, pero la combinación de la investigación de campo dedicada de WDP, la experiencia en ingeniería de Georgia Tech y el poder de la tecnología de Google está abriendo nuevas y emocionantes posibilidades. Ya no solo escuchamos. Estamos empezando a comprender los patrones de los sonidos, allanando el camino para un futuro donde la brecha entre la comunicación entre humanos y delfines podría reducirse un poco.
 Puede obtener más información sobre el Proyecto Delfines Salvajes en su sitio web


Comentarios

Entradas populares de este blog

Como criar en acuario a la anguila criolla, Synbranchus marmoratus,

La anguila de agua dulce: Uno de los peces de las acequias del vivero de la Reserva natural Delta Terra, en la 1ª. Sección del Delta, Tigre.

El pez mas grande del Amazonas se enfrenta con la extinción