Notebookcheck Logo

Whisperfile por el equipo de Mozilla Ocho ofrece ASR local y fácil

proyecto llamafile (Fuente de la imagen: Mozilla)
proyecto llamafile (Fuente de la imagen: Mozilla)
El equipo conocido por su innovación y sus experimentos en Mozilla ha integrado el sistema de reconocimiento automático del habla Whisper de OpenAI en su proyecto llamafile. El objetivo del proyecto es ofrecer modelos lingüísticos de gran tamaño compatibles con el hardware local en un único archivo ejecutable. La posibilidad de ejecutar localmente el software de transcripción puede beneficiar a los usuarios preocupados por la privacidad que deseen transcribir audio sensible.

Para aquellos que no estén familiarizados con el llamafile el equipo de Mozilla Ocho está trabajando para eliminar la complejidad que rodea a la instalación de LLM combinando llama.cpp y Cosmopolitan Libc, que utilizan el lenguaje de programación C/C++. Llamafile utiliza la inferencia de LLaMA de Meta de Meta proporcionada por llama.cpp y la combina con la transformación build-once run-anywhere de C de Cosmopolitan Libc. Cosmopolitan Libc también elimina la necesidad de un intérprete o una máquina virtual para ejecutar C en máquinas Linux, Mac y Windows.

La última incorporación al proyecto llamafile, Whisperfileha sido detallada en el perfil Hugging Face de Mozilla. Según su página, "Whisperfile es una implementación de alto rendimiento de OpenAI's Whisper creada por Mozilla Ocho como parte del proyecto llamafile, basada en el software whisper.cpp escrito por Georgi Gerganov, et al" Para el proyecto, el equipo empaquetó todos los pesos necesarios para el modelo en "whisperfiles" que mantienen las características encontradas en Cosmopolitan Libc permitiendo que el modelo funcione en la mayoría de los sistemas.

La documentación "Primeros pasos con Whisperfile" en el perfil GitHub del equipo detalla un sencillo proceso de instalación que consta de sólo tres pasos. Una vez que un usuario descarga el modelo, construye el software y ejecuta el programa puede elegir entre tres modelos diferentes para empezar a transcribir audio. Los modelos van desde los más pequeños a los más grandes, y la velocidad se intercambia por la precisión en el proceso de transcripción. Además, Whisperfile puede traducir diferentes idiomas al inglés utilizando el modelo multilingüe y la bandera "--translate".

Para obtener información sobre llamafile, Whisperfile y detalles adicionales sobre el proceso de instalación, visite los recursos que se indican a continuación.

Fuente(s)

Please share our article, every link counts!
> Análisis y pruebas de ordenadores portátiles y móviles teléfonos > Noticias > Archivo de noticias > Archivo de noticias 2024 08 > Whisperfile por el equipo de Mozilla Ocho ofrece ASR local y fácil
Stephen Pereyra, 2024-08-23 (Update: 2024-08-23)