DIAGNÓSTICO AUTOMATIZADO DE MELANOMA: LA INTELIGENCIA PUEDE SER ARTIFICIAL, LOS RESULTADOS NO DEBEN SERLO




A la hora de destacar avances en el estudio del melanoma en el último año podría comentarles el papel cada vez mejor perfilado que juegan las fusiones de genes de cinasas en el origen de algunos subtipos de lunares y melanomas, o podría extenderme en el papel de la competencia celular durante el desarrollo embriológico y el desarrollo de algunos tumores, que en mi opinión nos permitirá entender mejor el origen y la evolución de algunos melanomas. Pero si voy por aquí, creo que les aburriría pronto.

Sin embargo, hay otra línea de trabajo que ha generado multitud de publicaciones científicas en el último año y que probablemente les aburra menos y les motive más. ¿Se imaginan tener un pequeño objetivo dermatoscópico no demasiado caro acoplable a su teléfono móvil, tomar con él una imagen de cualquiera de sus lunares (o de todos ellos) y que una aplicación instalada en su móvil les diga de forma casi inmediata si es un melanoma? Sorpréndanse aún más: ningún ingeniero de imagen habrá diseñado esa aplicación elaborando previamente complejos algoritmos que enseñen a la aplicación a reconocer el melanoma como se hacía hasta hace poco. No. Partiendo de otro tipo de algoritmos, ¡aprenderá ella sola a hacerlo! Y cuando lo sepa hacer, usted se la instalará en su móvil…¡y a diagnosticar! (“usted” también podría ser su médico general, su dermatólogo, su mejor amigo, su vecino…hay para todos, esto es muy democrático y muy…transversal). Detrás de todo ello aparecen nombres a veces de significado un tanto críptico para los no introducidos en ese mundo: redes neuronales, aprendizaje profundo, metaaprendizaje…inteligencia artificial al fin y al cabo.

El objetivo de desarrollar sistemas de diagnóstico automatizado del melanoma no es nuevo, lleva más de 25 años en liza (en mi opinión con poco éxito hasta ahora en términos de práctica clínica habitual), pero sí es nuevo el hacerlo con redes neuronales que “autoaprenden” por ensayo y error según van evaluando miles de imágenes de casos ya extirpados y analizados por los patólogos, y es nuevo el impulso que esta línea de trabajo ha recibido en los últimos años, favorecido por el aura de innovación (absolutamente real) y eficacia (aún por demostrar en la práctica clínica habitual) que suele acompañar a todos los proyectos que invocan a la inteligencia artificial. Por otra parte, se acumulan los sistemas de diagnóstico automatizado disponibles y en desarrollo. En un reciente trabajo de notable complejidad metodológica publicado en la prestigiosa revista The Lancet Oncology  se comparaban entre sí 139 de estos sistemas, y se comparaban también con médicos más o menos expertos en este campo. En poco tiempo, el problema no será si decidimos incorporar la inteligencia artificial en nuestra rutina diagnóstica, sino por cuál de los centenares de sistemas disponibles nos decidimos.

Observando en detalle algunos de los trabajos publicados, especialmente los que vienen ilustrados con algunas de las imágenes empleadas, me llaman la atención dos cosas: por una parte, estos sistemas cometen a veces errores graves e incomprensibles (que también los humanos con poca experiencia podrían cometer); por otra parte, en general muchos de estos sistemas ofrecen ya mayor precisión diagnóstica que los médicos no expertos, y con frecuencia igualan e incluso superan algo a la precisión diagnóstica de los expertos. Pero cuidado, siempre en estudios retrospectivos con imágenes de lesiones ya extirpadas y analizadas, no sobre la piel de pacientes reales en estudios prospectivos, que aún no se han hecho y que es muy difícil que se hagan, por razones que más adelante comentaré. Queda claro tanto a la vista de nuestra experiencia clínica previa como de los resultados que van ofreciendo estos sistemas que en el diagnóstico precoz del melanoma el acierto absoluto no es una opción. Quien lo busque como objetivo es un ingenuo o es un inepto. Y debemos movernos buscando un razonable equilibrio entre sensibilidad y especificidad. En la medida que forcemos mayor sensibilidad (para que no se nos escape casi ningún melanoma) perderemos especificidad (muchos lunares atípicos benignos serán considerados como posibles melanomas y serán innecesariamente extirpados).

Uno de los mayores problemas que lastra la evaluación de todos estos sistemas y que hace que su empleo en condiciones de práctica clínica habitual ofrezca sistemáticamente peores resultados que en condiciones experimentales es la enorme diferencia entre la proporción de lesiones benignas y malignas que se dan en diferentes escenarios. Por razones logísticas y por la necesidad de trabajar con cifras que generen fácilmente significación estadística muchos estudios experimentales se hacen con una proporción de lesiones benignas frente a malignas que oscilan entre 1:1 (algo ciertamente ridículo) y 20:1 (algo más razonable pero aún muy lejos de la realidad). Fíjense en la realidad: en mis doce años de actividad con dermatoscopia digital en el IMO fotografié para vigilancia unos 80.000 lunares, y diagnostiqué en torno a 40 melanomas: ¡una relación de 2.000:1! Lo que nos funciona cuando la proporción de lesiones malignas es muy elevada (como en casi todos los estudios retrospectivos experimentales) puede mostrar unas cifras de especificidad inaceptables en condiciones de práctica clínica habitual, donde el tumor maligno es la excepción (afortunadamente para todos), no la regla. Y acertar en cuál es el tumor maligno cuando se trata de 1 entre 2.000 les aseguro que no es especialmente fácil para ningún médico ni para ningún sistema, cuando además se pretende que el diagnóstico sea muy precoz y su imagen, por ello, puede no ser especialmente informativa aún. La selección retrospectiva de los casos para los estudios experimentales, ya estudiados histológicamente, también puede introducir muchos sesgos que hacen difícilmente reproducibles los resultados en condiciones de práctica clínica real y con calidades de imagen muy variables. No seamos ingenuos: de momento, los resultados ofrecidos por estos sistemas son esperanzadores pero tan artificiales como la inteligencia que los sustenta. No sabemos bien qué pasará cuando les interroguemos sobre lesiones no extirpadas en pacientes reales y alguien decida seguir fielmente sus indicaciones.

Como el melanoma es infrecuente, un estudio en condiciones de práctica clínica real debería implicar a multitud de pacientes vigilados por muchísimos médicos durante un periodo muy prolongado de tiempo, probablemente en torno a 10 años, pues en menos tiempo muy pocos pacientes desarrollarán un melanoma incipiente que de verdad permita poner a prueba la sensibilidad de estos sistemas en un escenario real y con cifras que permitan alcanzar significación estadística. Aún muchos más años se necesitarían para evaluar cuándo el eventual retraso diagnóstico en algunos melanomas se podría traducir o no en mayor riesgo real de metástasis. Por razones de todo tipo, logísticas, económicas y éticas entre otras, es improbable que un estudio así se haga alguna vez. Y quienes han invertido su tiempo y su dinero en el desarrollo de estos sistemas no es esperable que estén dispuestos a esperar tanto (valga la redundancia) para ver si pueden rentabilizarlo. Y todo esto no nos debe sorprender ni debe provocar, per se, un rechazo firme a estas nuevas tecnologías. A día de hoy tampoco se ha completado ningún ensayo clínico prospectivo, aleatorizado  y metodológicamente riguroso que demuestre que la vigilancia de pacientes de riesgo de melanoma con dermatoscopiadigital salva vidas. La logística necesaria (número de médicos, de pacientes y de lesiones,  y tiempo de seguimiento en condiciones metodológicamente muy rigurosas) lo hace inviable, de costes inasumibles y éticamente cuestionable, puesto que a muchos de los pacientes de riesgo que participaran en el estudio se les debería de excluir aleatoriamente y durante mucho tiempo de esa vigilancia para poder comparar resultados. Sin embargo, los datos disponibles (en general derivados de series largas de pacientes en estudios retrospectivos) y la experiencia personal de los expertos en este campo sugieren que es así, y que a día de hoy la vigilancia periódica de los lunares con dermatoscopia digital es la mejor opción para los pacientes de riesgo de melanoma. A la hora de justificar nuestras decisiones en este campo deberemos de conformarnos con enormes dosis de sentido común y rigor profesional, junto con la frase que el cosmólogo Carl Sagan pronunciaba acerca de las posibilidades de vida extraterrestre en el Universo: “la ausencia de evidencia no es evidencia de la ausencia”.

Los sistemas de inteligencia artificial aplicada al diagnóstico del melanoma están viniendo para quedarse, aunque muy probablemente se empezarán a emplear en la práctica clínica sin una conciencia clara de su precisión, eficacia, eficiencia y seguridad en condiciones reales de uso. Las agencias reguladoras se lo tendrán que pensar mucho a la hora de autorizar estos sistemas y asumir o repartir responsabilidades, porque además van a tener a centenares de ellos encima de su mesa en los años venideros. Es cuestionable que sustituyan al experto, pero es muy probable que complementen al experto, y que usados de forma juiciosa la combinación “experto más sistema automatizado” pueda optimizar nuestra precisión diagnóstica. Por supuesto, ya hay sistemas disponibles en la red sin que ninguna agencia reguladora ni comité de expertos los haya testado de forma rigurosa. Esto no quiere decir que no puedan funcionar bien, pero sí que no están garantizados ni respaldados por agentes externos fiables y sin conflictos de intereses.

Algunos podrían pensar que estos sistemas pondrán en riesgo la actividad de los dermatólogos, reduciendo la necesidad de los pacientes de acudir a sus consultas. Nada más lejos de la realidad. En el esfuerzo porque no se escape ningún melanoma, con dramáticas consecuencias médicas y legales, en el desarrollo de estos sistemas acabará siempre primando la sensibilidad sobre la especificidad. Así que si cualquier persona con muchos lunares más o menos atípicos, bastantes queratosis seborreicas variopintas, lentigos, angiomas, etc., se pone a “jugar” con algunos de estos sistemas, lo más probable es que no tenga en verdad ningún melanoma pero el sistema le detecte varias lesiones (y a veces muchas lesiones) sospechosas de serlo. Así que es posible que no sólo las consultas de los dermatólogos rebosen de pacientes innecesariamente asustados y se generen muchas más extirpaciones y biopsias, sino que también se incrementarán las consultas de algunos psiquiatras especializados en trastornos de ansiedad, así como las recetas de ansiolíticos. Las personas hipocondríacas lo pueden pasar muy mal. También es seguro que más de un paciente salvará su vida gracias al diagnóstico precoz de un melanoma a partir del examen de sus lunares con alguno de estos sistemas.

De momento, los resultados de estos sistemas de diagnóstico automatizado de melanoma son tan artificiales como la inteligencia que subyace a su funcionamiento. Así es que contemplémoslos con un entusiasmo contenido y sin perder el sentido de la realidad. En el caso de que pronto se generalice su uso, que está por ver (yo no lo veo a corto plazo), es probable que sólo al final de la próxima década podamos disponer de resultados consistentes procedentes de la práctica clínica habitual para saber si su uso ha contribuido o no a reducir la incidencia y la mortalidad por melanoma.



www.clinicadermatologicainternacional.com

Comentarios

Entradas populares