¿Realmente puede confiar en las aplicaciones médicas de su teléfono?

Probé los probadores de síntomas Ada, Babylon y Your.MD para averiguar qué tan confiables son realmente.

Nunca ha sido tan fácil obtener asesoramiento médico. Una simple búsqueda en Google regresará con una serie de síntomas y afecciones. El médico se ha movido a su bolsillo y hay un número creciente de aplicaciones que prometen brindar un diagnóstico preciso.

La premisa de estos médicos de Google Play y la App Store de iOS es simple: una aplicación le dará una (o, en algunos casos, más) sugerencias … luego depende de usted buscar consejo médico donde sea necesario.

«Hay diferentes tipos de herramientas de diagnóstico», dice David Wong, profesor de informática de la salud en el Instituto de Informática de la Salud de Leeds. Wong, junto con mi colega Hamish Fraser, me ayuda a probar tres de las aplicaciones de prueba de síntomas basadas en inteligencia artificial más populares del Reino Unido: Ada, Your.MD y Babylon.

«Ada fue, con mucho, la mejor», dice Wong. «Hubo problemas con ambos. Fue sorprendente poder encontrar las cosas incorrectas en minutos, desde una perspectiva no clínica». La pareja dice que debe haber una gobernanza más sólida en torno a este tipo de aplicación. “La gran preocupación es que alguien pone información y tiene una enfermedad grave y se le asegura que está bien y que es una situación de falso negativo, que podría poner en peligro la vida”, dice Fraser. Añade que, en general, hay disponibles unos pocos verificadores de síntomas «razonablemente buenos».

En el Reino Unido, la Agencia Reguladora de Medicamentos y Medicamentos (MHRA) clasifica las aplicaciones que realizan un diagnóstico médico como dispositivos médicos. Esto significa que deben estar certificados por la agencia. Pero la guía MHRA dice que las aplicaciones móviles que hacen «recomendaciones generales para consejos adicionales» probablemente no son dispositivos médicos y, como tales, no tienen que cumplir con los estándares establecidos. «Si da un consejo de vida o muerte, debe ser correcto. Si está mal, ¿quién es el responsable?» Dice Wong.

En 2015, el British Medical Journal publicó un estudio que evaluaba los probadores de síntomas utilizados para el autodiagnóstico. La investigación analizó 23 verificadores de síntomas en inglés y determinó si enumeraban el diagnóstico correcto primero o dentro de hasta 20 opciones posibles. Para los verificadores de síntomas que luego ofrecieron una recomendación de atención, los académicos también analizaron el tipo de atención recomendada.

El documento concluyó que el 34 por ciento de las veces los verificadores lograron hacer el diagnóstico correcto. En los primeros 20 diagnósticos dados, fueron correctos el 58% de las veces. Los consejos de atención fueron correctos casi dos tercios de las veces (entre el 33 y el 78 por ciento). El estudio no comparó cómo los médicos humanos harían una recomendación o un diagnóstico si se les presentara la misma información que las mujeres.

«Para los pacientes, nuestros resultados implican que, en muchos casos, los verificadores de síntomas pueden dar al usuario una idea de los posibles diagnósticos, pero también pueden proporcionar una nota de precaución porque las herramientas a menudo son incorrectas y los consejos de clasificación son demasiado cautelosos». estudio concluido. También explicó que un verificador de síntomas «puede» ser más valioso que no buscar consejo médico «o simplemente usar un motor de búsqueda en Internet».

Pero obtener buenos consejos es confuso. El directorio de aplicaciones del NHS es confuso, aunque todavía está en fase beta. Varias aplicaciones en el sitio están ‘aprobadas por el NHS’, lo que significa que tienen ‘evidencia clínica para respaldar los resultados clínicos’. Otros están marcados como probados por el NHS, mientras que algunos no tienen ninguna etiqueta o recomendación. Ni Your.MD ni Ada figuran en el sitio web del NHS, Babylon se recomienda específicamente, pero no se recomienda.

Wong y Fraser van más allá en la evaluación de la industria del verificador de síntomas. «El estándar de oro para las aplicaciones debe cambiar en términos de uso», dice Wong. Sostiene que si una solicitud médica está dirigida a médicos y expertos, entonces puede permitirse no funcionar tan bien, porque debería informar sus decisiones, en lugar de ser una fuente totalmente autorizada.

«Con las aplicaciones en general en el Reino Unido, hay problemas con la forma en que se regula», dice, «principalmente porque las tecnologías se están moviendo más rápido de lo que pueden recuperar los reguladores».

Evaluación de los médicos de IA

Como probé: La prueba ad hoc de DyN Noticias involucró a Ada, Your.MD (beta) y Babylon. Las tres aplicaciones proporcionan alguna forma de verificación de síntomas y se han probado cuatro condiciones comunes. Los síntomas de las cuatro enfermedades (asma, herpes zóster, enfermedad hepática relacionada con el alcohol e infección del tracto urinario (ITU)) se han extraído del sitio web NHS Choices y se han introducido en las versiones de la aplicación para Android e iOS. Ambos investigadores probaron las aplicaciones por separado. Esto es lo que sucedió.

1. Ada

Ada fue seleccionada como la ganadora de la prueba DyN Noticias. Fraser dice que pregunta sobre los síntomas más importantes y brinda los mejores diagnósticos. «Las preguntas son claras y traducen el texto libre en sugerencias sensibles para que el usuario elija», dice.

Para el asma, preguntó sobre la duración de los síntomas, aunque no preguntó sobre los antecedentes del diagnóstico o los posibles desencadenantes. En todas las UIT, dice que ha habido «muchas buenas preguntas». En general, dice Fraser, “los mejores diagnósticos de los tres incluyen buenos diagramas que muestran cuáles de los síntomas de cada enfermedad estaban presentes y la fuerza del vínculo, así como un diagrama de la cantidad de personas de cada diez o 100 que probablemente tengan ese .diagnóstico «.

«Desde el principio, comenzamos a construir algo que tiene un profundo conocimiento médico, que cubre las enfermedades raras, así como las enfermedades comunes directas», dice la fundadora, la Dra. Claire Novorol. Ella explica que Ada comenzó como un servicio de plataforma para médicos y luego se modificó para enfocarse en partes que los pacientes pudieran entender. «Ahora somos una plataforma que conecta a pacientes y médicos. En el Reino Unido, al final de la evaluación, puede compartir su evaluación con un médico, que cuenta con la asistencia de la tecnología Ada a la que se enfrenta el médico en su lado de la plataforma. . «

2. You.MD

Wong dice que no fue posible que Your.MD diagnosticara el herpes zóster. «Me preguntó si antes tenía varicela (causada por el mismo virus) y me diagnosticaron meningitis», dice, pero ofreció el consejo adecuado para ver a un médico de familia. Sufrió correctamente el asma y la enfermedad hepática relacionada con el alcohol, pero falló con una infección urinaria, lo que sugiere otras afecciones de transmisión sexual.

«Sin embargo, debido a que la aplicación no preguntó sobre el sexo del paciente, presentó diagnósticos que eran imposibles para mí», dice Wong.

En respuesta a esto, Matteo Berlucchi, CEO de Your.MD, que tiene el verificador de síntomas en una etapa beta, explica que el problema ha sido identificado y solucionado. «Your.MD presenta condiciones basadas en su probabilidad», dice Berlucchi. «Si nuestro cerebro médico calcula que hay más resultados potenciales con una probabilidad similar, Your.MD tiene más condiciones». Desde que DyN Noticias probó la aplicación, se ha actualizado a la tercera versión.

3. Babilonia

Una de las fortalezas de Babylon es su capacidad para analizar sinónimos comunes en la UIT, dice Wong. Esto significa que pudo entender que «pipí, pipí, etc.» se estaban refiriendo a lo mismo. Sin embargo, se convirtió en la base de la prueba ad hoc. Wong y Fraser dicen que ofreció un curso de acción para el herpes zóster, pero no preguntó acerca de varios de los síntomas «relevantes». Wong dice que fue la menos precisa de las tres aplicaciones, pero señala que la verificación de síntomas es un complemento de su modelo comercial más amplio.

Babylon inicialmente dijo que no quería comentar sobre comparaciones con otros servicios. Después de la publicación, un portavoz dijo que la versión de la aplicación probada se ha actualizado desde entonces. «Hacer un diagnóstico integral, preciso y responsable requiere un mayor grado de capacidad de inteligencia artificial que la que está disponible públicamente», dijo su portavoz, y agregó que la compañía planea lanzar un «producto revolucionario» en los próximos meses, que utiliza inteligencia artificial. no solo proporciona triaje clínico, sino también diagnóstico.

En septiembre de 2017, Babylon respondió a una carta crítica en el British Medical Journal, afirmando que su verificador de síntomas de IA «redujo las consultas médicas el mismo día en un 40%, brindando atención alternativa en consecuencia».

Actualizado 02.10.17: Se ha agregado una declaración de Babylon

Gran parte de las noticias de la ciencia de todo el mundo en un sólo sitio. artículos de Ciencia.