Investigadores de la Universidad Tsinghua construyen un Hospital Agente virtual para el entrenamiento de médicos con IA sin intervención humana
Los investigadores de la Universidad Tsinghua del Instituto de Investigación de la Industria Inteligente (AIR) https://air.tsinghua.edu.cn/en/ y del Departamento de Informática y Tecnología https://www.cs.tsinghua.edu.cn/csen/ han construido un Hospital Agente virtual para el entrenamiento de médicos con IA sin intervención humana. Primero crearon una simulación de un hospital entero junto con el personal y los pacientes. A continuación, encomendaron a los médicos de IA la responsabilidad de diagnosticar y tratar a miles de pacientes virtuales sin intervención humana. Los médicos aprendieron rápidamente de sus errores y su destreza a la hora de examinar, diagnosticar y tratar aumentó considerablemente.
Las simulaciones virtuales, o simulacros, reproducen un entorno del mundo real para un entrenamiento seguro y rápido de la IA. El ordenador no necesita esperar a que aparezca un paciente enfermo, sino que pueden programarse cientos, miles e incluso millones de pacientes enfermos para que aparezcan como se desee. El coste de estas simulaciones es también mucho menor que el del entrenamiento real.
Los investigadores de Tsinghua pudieron entrenar rápidamente a médicos virtuales de IA con 10.000 pacientes virtuales en la simulación del Hospital de Agentes utilizando su proceso denominado método MedAgent-Zero. Éstos se crearon alimentando modelos de gran lenguaje con información sobre ocho tipos de enfermedades para crear historiales médicos electrónicos para 10.000 pacientes virtuales, cada uno de los cuales tenía una gravedad y una presentación diferentes. Estas ocho enfermedades eran nasofaringitis aguda, rinitis aguda, asma bronquial, bronquitis crónica, COVID-19, gripe A, gripe B e infección por micoplasma. Se creó un conjunto separado de 500 historiales de pacientes para las pruebas.
Durante las simulaciones, el médico virtual impulsado por gpt-3.5-turbo-1106 desarrolló rápidamente sus habilidades. Después de ver a 10.000 pacientes virtuales, el médico tuvo tasas de éxito en el examen, diagnóstico y tratamiento de pacientes tan altas como el 88%, 95,6% y 77,6% dependiendo de la enfermedad.
La GPT está mejorando rápidamente, por lo que los investigadores de Tsinghua también probaron su método de entrenamiento MedAgent-Zero utilizando la más potente gpt-4-1106-preview. Compararon el rendimiento de los médicos de IA gpt-3 y gpt-4 utilizando 1.273 preguntas de la base de datos MedQAun amplio conjunto de preguntas de opción múltiple que son similares a las preguntas sobre licencias médicas que se encuentran en exámenes como el USMLE. El rendimiento de los médicos virtuales en las preguntas sobre enfermedades respiratorias fue del 93,06% gpt-4 frente al 84,72% gpt-3.
El rendimiento sin precedentes de estos médicos de IA se consiguió con sólo unos días de entrenamiento virtual, y el simulacro del Hospital de Agentes abre el camino al desarrollo de métodos de entrenamiento para futuros médicos de IA, así como para médicos reales, que sean significativamente más rápidos y eficaces.
Los lectores que no sepan qué trabajos quedarán en un futuro impulsado por la IA sólo tienen que decirles a sus robots humanoides 1X que hagan la cena y limpien la casa por ellos. Los que quieran crear IA deberían equipar sus PC con una GPU Nvidia rápida(como éstaen Amazon) o comprar uno de los portátiles más rápidos del planeta(como éste en Amazon) para empezar a entrenar a la IA para que se haga cargo de muchos trabajos.
Fuente(s)
Traducido automáticamente por el navegador Edge:
AIR crea un hospital virtual para realizar la auto-evolución de los médicos AI
Tiempo de publicación: 2024-05-24
El Instituto de Investigación de la Industria Inteligente (AIR) de la Universidad de Tsinghua y el Departamento de Informática y Tecnología de la Universidad de Tsinghua han cooperado para construir un hospital virtual, el Hospital AgenteSe propone MedAgent-Zero, un método de autoevolución para agentes médicos, que permite a los agentes médicos mejorar continuamente sus capacidades médicas generando una gran cantidad de datos sin anotación manual en hospitales virtuales, y se verifica en conjuntos de datos del mundo real. Todos los pacientes, enfermeras y médicos del Hospital de Agentes son interpretados por agentes autónomos dirigidos por grandes modelos, que simulan el proceso de bucle cerrado "pre-hospital-in-hospital-post-hospital" de inicio, triaje, registro, consulta, examen, diagnóstico, medicación, rehabilitación y seguimiento. A partir de la base de conocimientos y el modelo básico, el Hospital Agente simula el proceso de generación y desarrollo de la enfermedad de los pacientes virtuales. Los médicos virtuales aprenden (es decir, leen la literatura médica) y practican (es decir, interactúan con los pacientes virtuales y toman decisiones de diagnóstico y tratamiento) en el Agent Hospital, resumen constantemente la experiencia de los casos de diagnóstico y tratamiento con éxito, reflexionan sobre las lecciones de los casos fallidos y mejoran continuamente la precisión de las múltiples tareas de diagnóstico y tratamiento. Tras tratar a casi 10.000 pacientes virtuales (los médicos humanos tardan unos 2 años), los médicos virtuales fueron capaces de superar a los mejores métodos actuales en el subconjunto de enfermedades respiratorias del conjunto de datos MedQA, alcanzando una tasa de precisión del 93,06%. El estudio, del que son coautores el profesor adjunto Ma Weizhi de AIR y el profesor Yang Liu, decano ejecutivo de AIR y decano asociado del Departamento de Informática, ha recibido una gran atención y debate por parte de la comunidad de inteligencia artificial y la comunidad médica nacional e internacional tras su publicación en arXiv.
- Título del artículo: Agent Hospital: Un simulacro de hospital con agentes médicos evolutivos
- Enlace al artículo: arxiv.org/pdf/2405.02957v1
En los últimos años, los modelos lingüísticos a gran escala se han desarrollado vigorosamente, y la tecnología de agentes basada en grandes modelos lingüísticos ha atraído mucha atención. Estudios anteriores han utilizado la tecnología de agentes para lograr la simulación del mundo real, incluyendo escenarios de interacción y juego como "Stanford Town" y "Werewolf Killing Game". Al mismo tiempo, la tecnología de agentes también se utiliza en el proceso de planificación y colaboración de diversas tareas, pero este proceso depende en su mayor parte del apoyo de datos anotados manualmente de alta calidad. Por lo tanto, la cuestión de investigación es si la simulación en el mundo real puede ayudar a mejorar la capacidad de procesamiento de tareas de los agentes.
La atención sanitaria inteligente ha atraído una gran atención debido a su importancia y valor de aplicación, y el equipo de investigación ha prestado gran atención a la aplicación de grandes modelos de lenguaje y tecnología de agentes en escenarios médicos. En respuesta a las preguntas de investigación anteriores, el equipo cree que el entorno de modelos reales puede ayudar a mejorar y evolucionar la capacidad de tareas de los agentes, por lo que llevó a cabo la investigación del Hospital de Agentes que combina la simulación del mundo real y la mejora de la capacidad médica. En este trabajo, el equipo se compromete a construir un entorno de simulación hospitalaria y a explorar la evolución autónoma de los agentes médicos en este entorno. El propósito es permitir que los agentes acumulen de forma autónoma conocimientos médicos en el proceso de diagnóstico y tratamiento y de aprendizaje, al igual que los médicos humanos, y realizar la evolución continua de las capacidades médicas.
El equipo de investigación se centró primero en utilizar agentes modelo a gran escala para simular procesos médicos críticos del mundo real. En el Hospital de Agentes, el equipo diseñó y cubrió 8 escenarios típicos desde la generación de la enfermedad hasta la recuperación, a saber: inicio, triaje, registro, consulta, examen, diagnóstico, prescripción y recuperación, y los pacientes participarán activamente en la retroalimentación de seguimiento. Todos los procesos se apoyan en grandes modelos en los que los roles pueden interactuar de forma autónoma.
Ejemplos de grandes sesiones de diagnóstico y tratamiento
El diagrama anterior ilustra un enfoque de bucle cerrado: cuando Kenneth Morgan, el agente del paciente, enferma, acude al hospital en busca de ayuda. La enfermera de triaje Katherine Li comprende los síntomas de Morgan, lo analiza y lo triajea a un departamento específico. Después de que Morgan complete el registro, la consulta y el examen médico de acuerdo con las instrucciones del médico, el doctor Robert le dará el diagnóstico final y el plan de tratamiento, y Morgan se irá a casa a descansar de acuerdo con las instrucciones del médico y dará parte al hospital para recuperarse, hasta la próxima vez que enferme y entonces irá al hospital.
Como puede ver en el ejemplo anterior, el equipo de investigación diseñó dos tipos principales de roles para el hospital: el personal médico y los pacientes. Toda la información de los personajes está generada por un modelo de gran tamaño (GPT-3.5), por lo que se puede escalar y añadir fácilmente. La información específica de algunos de los personajes se muestra en la siguiente figura, el paciente Kenneth Morgan, de 35 años, padece actualmente rinitis aguda, antecedentes de hipertensión y una serie de síntomas como vómitos persistentes; Zhao Lei es un radiólogo experimentado, y la internista Elise Martin tiene excelentes dotes de comunicación y está especializada en el diagnóstico y tratamiento de enfermedades médicas agudas y crónicas. Estos completos fondos de información sobre los personajes aumentan el realismo de la simulación hospitalaria.
Una introducción a la información del personaje virt
ual
En el proceso de simulación médica mencionado, la generación de enfermedades es la clave del mismo. En concreto, la información del historial médico actual se genera mediante un gran modelo de lenguaje combinado con conocimientos médicos para generar un historial médico completo del paciente, que incluya el tipo de enfermedad, los síntomas, la duración y los distintos resultados de los exámenes (para más detalles, consulte el apéndice del documento). Cabe señalar que, para garantizar al máximo la precisión de todo el proceso de simulación, el agente paciente sólo percibirá los síntomas de su enfermedad, pero no la enfermedad concreta, mientras que el agente médico sólo podrá comprender la información hablando con el agente paciente y prescribiéndole pruebas. El examen que debe realizar el agente paciente, el tipo de enfermedad y la gravedad de la enfermedad se utilizarán como tres tareas clave para evaluar la capacidad del agente médico para diagnosticar y tratar a los pacientes virtuales.
La mayoría de los métodos tradicionales de entrenamiento de modelos médicos se basan en el preentrenamiento, el ajuste fino y otras tecnologías, por lo que necesitan el apoyo de una gran cantidad de datos médicos y algunos datos de alta calidad anotados manualmente. Sin embargo, el equipo de investigación cree que el proceso de mejora de la capacidad de los médicos humanos no depende de datos tan masivos, y a menudo pueden acumular experiencia de la práctica clínica en el proceso de diagnóstico y tratamiento, y también mejorarán leyendo literatura médica para acumular conocimientos clave. Los agentes médicos de los hospitales virtuales deberían ser capaces de lograr una evolución similar de sus capacidades.
Por ello, el equipo diseñó un algoritmo de autoevolución de agentes denominado "MedAgent-Zero", que, al igual que AlphaGo-Zero, no depende de los datos de anotación manual, sino que utiliza el aprendizaje (es decir, la lectura de literatura médica) y la práctica (es decir, la interacción con pacientes virtuales y la toma de decisiones de diagnóstico y tratamiento) en el hospital virtual para lograr la mejora de la capacidad. Acumulará experiencia de forma autónoma en las tres tareas de diagnóstico de enfermedades y recomendaciones de tratamiento; Por otro lado, los agentes médicos también aprenderán de forma autónoma, simulando el proceso de aprendizaje de documentos médicos a partir de las preguntas médicas generadas por el LLM.
Diagrama de flujo de la política MedAgent-Zero
Como se muestra en la figura anterior, la evolución de MedAgent-Cero incluye dos enfoques: 1) Resumir la experiencia de los casos exitosos, para los problemas de diagnóstico y tratamiento que pueden responderse correctamente, el organismo inteligente acumulará experiencia en la base de datos de casos como un médico humano; 2) Reflexionar sobre las lecciones aprendidas de los fracasos, y al responder errores, el agente tomará la iniciativa de reflexionar sobre los errores y reflexionar sobre ellos. Si las lecciones de la reflexión ayudan al agente a responder a la pregunta, se conservarán y almacenarán en el fondo de experiencia.
Finalmente, el equipo de investigación llevará a cabo la acumulación y evolución de los dos aspectos anteriores en el proceso de entrenamiento sobre datos virtuales. En cada proceso de inferencia, el agente recupera el contenido más similar de las dos bases de datos y lo añade al Prompt para el aprendizaje en contexto, y acumula historiales médicos o resume la experiencia en función de las respuestas correctas e incorrectas, con el fin de mejorar continuamente la capacidad del agente.
En el hospital virtual, el equipo de investigación construyó los historiales médicos de decenas de miles de pacientes virtuales para los experimentos de evolución autónoma de los agentes médicos, incluyendo 8 enfermedades relacionadas con las vías respiratorias, como la gripe A, la gripe B y la nueva corona, con más de 10 exámenes médicos diferentes. Basándose en el cálculo de que los médicos humanos tratan a unos 100 pacientes a la semana, los médicos humanos pueden tardar dos años en diagnosticar a 10.000 pacientes, pero los médicos inteligentes sólo tardan unos días en hacerlo.
El equipo evaluó principalmente la capacidad de los agentes médicos en los hospitales virtuales desde dos aspectos. El primero es la evaluación de la competencia médica en el entorno virtual: como muestra la figura siguiente, en el proceso de entrenamiento del agente médico (izquierda), con el aumento del número de pacientes diagnosticados y tratados, la precisión del agente médico en las tres tareas clave sigue aumentando y se estabiliza gradualmente. En el experimento de 500 historias clínicas de prueba, se comprobó (derecha) que la precisión del agente fluctuaba ligeramente a medida que aumentaba el número de pacientes, pero mostraba una tendencia general al alza.
La precisión de la tarea del agente médico en el conjunto de entrenamiento (izquierda) y en el conjunto de prueba (derecha).
Posteriormente, el equipo de investigación comparó la precisión diagnóstica de los agentes médicos sobre diversas enfermedades antes y después de su evolución, y comprobó que todas habían mejorado mucho, lo que verificaba la eficacia de su evolución autónoma.
Manifestaciones diagnósticas de distintas enfermedades antes y después de la evolución de los agentes
Por otro lado, el equipo utilizó un subconjunto de enfermedades respiratorias del conjunto de datos externo MedQA para evaluar la capacidad del agente médico en la medicina del mundo real. Sorprendentemente, incluso sin utilizar ningún dato anotado artificialmente en el proceso de evolución del agente, después de tratar a casi 10.000 pacientes, el agente médico fue capaz de superar al mejor método actual en el conjunto de datos y alcanzar la mayor tasa de precisión del 93,06%, lo que verifica la eficacia de la evolución autónoma de los agentes médicos en el entorno simulado.
Precisión de los distintos métodos en un subconjunto de MedQA
Además, el equipo de investigación llevó a cabo una verificación experimental de la ablación, y los resultados mostraron que tanto los ejemplos acumulados de los éxitos como las lecciones aprendidas de los fracasos pueden ayudar a mejorar las capacidades médicas del modelo.
Rendimiento del ensayo de ablación de MedAgent-Zero
En resumen, este trabajo de investigación construye el primer escenario de hospital virtual, Agent Hospital, y propone MedAgent-Zero, un algoritmo de evolución de agentes médicos que no depende de la anotación de datos artificiales. Los resultados experimentales de los datos virtuales y los datos reales verifican preliminarmente la eficacia del entorno de simulación para la mejora de las capacidades de los agentes médicos, y proponen nuevas soluciones para la aplicación de la inteligencia artificial, especialmente los grandes modelos de lenguaje y la tecnología de agentes en escenarios médicos inteligentes. Sin embargo, todavía existen algunas limitaciones en este trabajo de investigación y, en el futuro, el equipo seguirá mejorando y optimizando los tipos de enfermedad cubiertos, la meticulosidad del entorno de simulación y la selección y optimización de la base de modelos.
Sobre el autor correspondiente
Ma Weizhi, investigador adjunto del Instituto de Industria Inteligente (AIR) de la Universidad Tsinghua, fue seleccionado como "Proyecto de elevación de jóvenes talentos" de la Asociación China para la Ciencia y la Tecnología. Sus intereses de investigación incluyen la adquisición inteligente de información y la atención médica inteligente. Página web personal: mawz12.github.io.
Liu Yang es catedrático de GDS, decano ejecutivo del Instituto de Industria Inteligente (AIR), vicedecano del Departamento de Informática de la Universidad Tsinghua y ganador del Fondo Nacional para Jóvenes Académicos Distinguidos. Sus intereses de investigación incluyen la inteligencia artificial, el procesamiento del lenguaje natural y la medicina inteligente. Página web personal: nlp.csai.tsinghua.edu.cn/~ly.
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck