IA para la tos y los resfriados: Google utiliza su poder de datos

Cada enfermedad "tose" de forma un poco diferente. (Imagen: pixabay/Sambeetarts)

YouTube contiene miles de millones de grabaciones de voces humanas. La IA sanitaria HeAR demuestra que Google puede utilizarla para generar algo más que ingresos publicitarios y burbujas de filtros.

Mario Petzold (traducido por Ninh Duy), Publicado 03/24/2024 🇺🇸 🇩🇪 ...

AI Science

En YouTube se pueden encontrar fácilmente más de 300 millones de fragmentos de audio con voces. Y cada vídeo subido puede ser utilizado y analizado por la empresa matriz Alphabet, es decir, Google.

Esto significa que existe un tesoro de datos que, a diferencia de algunas controversias actuales en torno al entrenamiento de diversos sistemas de IA, pueden analizarse legalmente y sin problemas jurídicos.

Y al fin y al cabo, los investigadores de Google y de varias otras instituciones de investigación la han utilizado para entrenar una IA bastante interesante que se va a utilizar como herramienta de diagnóstico de enfermedades respiratorias. Se llama HeAR, que significa "Representación Acústica de la Salud".

Este tipo de análisis existen en la investigación médica desde hace mucho tiempo; después de todo, suele ser muy fácil oír cuando otra persona está resfriada. Para ello se utilizaban y se utilizan generalmente datos preexaminados. Así, se sabe que la voz en cuestión resuena una enfermedad concreta o que está sana.

El problema, sin embargo, es que la cantidad de estos datos es muy limitada. No es el caso del entrenamiento de HeAR: el sistema se entrenó con el conjunto de datos realmente enorme de 300 millones de archivos de audio completamente sin etiquetar.

Después se añadieron algunas voces adicionales con enfermedades identificadas. En este caso, se trataba de tuberculosis, COVID-19 y el hecho de que alguien fume. Para un sistema recién desarrollado, los resultados del 74% de detección correcta de la tuberculosis y del 71% para el COVID-19 parecen bastante impresionantes.

El siguiente paso es continuar con ensayos clínicos controlados. Esta sería la primera oportunidad de obtener un diagnóstico inicial utilizando únicamente la voz. Aunque todavía se pueden mejorar los resultados, se trata de una prueba basada únicamente en la palabra hablada, ni invasiva ni costosa.