Notebookcheck Logo

Open NotebookLM adopta un enfoque de código abierto para convertir PDF en podcasts.

Open NotebookLM (Fuente de la imagen: gabrielchua en Hugging face)
Open NotebookLM (Fuente de la imagen: gabrielchua en Hugging face)
El desarrollador Gabriel Chua ha lanzado su respuesta al cada vez más popular conversor de PDF a podcast de Google, notebookLM. Open NotebookLM reproduce las capacidades de Google combinando varios modelos de código abierto.

Para quienes no estén familiarizados con el experimento de IA de Google, NotebookLM es una plataforma de asistente de investigación que toma los documentos cargados por el usuario y utiliza Gemini 1.5 pro para ofrecer un enfoque basado primero en la toma de notas para interactuar con la información que se encuentra en el documento. NotebookLM genera un resumen de todos los documentos cargados en el cuaderno del usuario y permite a éste formular preguntas sobre el material. Una vez procesada la información, NotebookLM responde con citas apropiadas de los documentos cargados. Sin embargo, la característica más impresionante es la capacidad de generar podcasts basados en los documentos que han cargado. El podcast generado por Gemini toma la información seleccionada por la IA de los documentos. Crea un archivo de audio de una discusión entre dos oradores sobre temas encontrados en el material, con clips de audio de entre cinco y treinta minutos. Sin embargo, algunos usuarios pueden tener dudas a la hora de subir material a un LLM propietario, que es donde Open NotebookLM se diferencia.

Con una interfaz de usuario sencilla y directa, Open NotebookLM se construyó utilizando varios modelos de código abierto y de conversión de texto a voz para convertir los PDF en podcasts. Para procesar el PDF, Open NotebookLM utiliza Llama 3.1 con un límite de caracteres de 100 mil. Aunque no es tan capaz como Gemini, MeloTTS proporciona un sólido rendimiento de texto a voz para el proyecto, y los usuarios pueden ajustar el tono de la IA entre "divertido" y "formal" Además, Open NotebookLM admite algo más de diez idiomas, con español, francés y alemán entre las opciones. Actualmente, los usuarios pueden probar el proyecto en la página Hugging face de Chua o construirlo localmente a partir de los recursos disponibles en el repositorio GitHub del proyecto.

Fuente(s)

Gabriel Chua en Cara de abrazo y en Github

Please share our article, every link counts!
Mail Logo
> Análisis y pruebas de ordenadores portátiles y móviles teléfonos > Noticias > Archivo de noticias > Archivo de noticias 2024 10 > Open NotebookLM adopta un enfoque de código abierto para convertir PDF en podcasts.
Stephen Pereyra, 2024-10- 2 (Update: 2024-10- 2)