Saltar al contenido

Estudios

Dibujar estructuras químicas a mano: Reconocimiento digital por IQS Tech Transfer

17 junio 2021

IQS Tech Transfer y la empresa Vision Arcanum colaboran en un proyecto para el reconocimiento digital de estructuras químicas dibujadas a mano, en pantalla táctil o en papel, utilizando modernas técnicas de visión por ordenador (Modern Computer Vision Techniques) basadas en Machine Learning.

dibujar estructuras químicas

 

 

IQS Tech Transfer y la empresa Vision Arcanum colaboran en un proyecto que tiene como objetivo el reconocimiento digital por dibujar estructuras químicas a mano, en pantalla táctil o en papel, utilizando modernas técnicas de visión por ordenador (Modern Computer Vision Techniques) basadas en Machine Learning.

Dibujar estructuras químicas es una representación gráfica, compacta y expresiva, de los compuestos químicos. La notación es bastante estándar y bien interpretada en diversos campos de aplicación. Para un químico, las fórmulas estructurales están en todas partes: apuntes, textos, anotaciones de laboratorio, publicaciones científicas, pizarras, servilletas, etc. Están escritas a mano o generadas usando herramientas de software. En algunos casos, es necesario convertir una fórmula estructural, que transmite mucha información a un ser humano, a un formato apto para un ordenador. De forma ideal, desearíamos que el ordenador reconociera y entendiera las fórmulas estructurales, pero esto no es siempre una tarea sencilla.

Existen tres niveles de dificultad, cuando se trata de reconocimiento de estructuras. En el caso más simple, la estructura a reconocer ha sido originalmente generada por un ordenador, procedente, por ejemplo, del pdf de un artículo científico, o escaneada de un libro o documento. Pueden ser unas imágenes ‘con ruido’, pero las líneas serán típicamente rectas y los niveles claramente legibles. En este caso, el reconocimiento puede, hasta cierto punto, realizarse mediante herramientas como OSRA, Imago, ChemOCR, etc.

El siguiente nivel de dificultad es el reconocimiento de estructuras dibujadas a mano en una pantalla. La información que proviene del movimiento del lápiz digital ayuda a descifrar posibles ambigüedades de la interpretación y es especialmente relevante para la detección de las etiquetas atómicas. Actualmente, este tipo de reconocimiento se vuelve más notable, cuando los sistemas de escritura de notas digitales son más comunes gracias a dispositivos como Apple iPad o Microsoft Surface.

El caso más difícil es el reconocimiento de estructuras dibujadas a mano utilizando lápiz y papel. Las fotos o los escaneos de los dibujos siempre presentan ruido visual adicional. Combinado con la escritura a mano desordenada, esta situación es el reto más duro. Es en esta compleja tarea donde surge la colaboración entre Vision Arcanum e IQS.

Vision Arcanum es una pequeña empresa especializada en el desarrollo de sistemas de reconocimiento de estructuras mediante soportes digitales, con el objetivo puesto en los dos últimos niveles de dificultad: estructuras dibujadas a mano en pantalla táctil o en papel. Esta aproximación permite resolver la variabilidad de “las entradas” dibujadas a mano, pero requiere de grandes cantidades de datos de alta calidad. En palabras de Ismael Zamora, “creemos que el dibujo a mano es la forma más natural de recuperar la información química, ya que se puede utilizar directamente tanto en educación, como en un entorno profesional en reuniones de conceptualización, así como generar las entradas para cálculos y búsquedas en bases de datos”.

Colaboración con IQS Tech Transfer

El proyecto de colaboración con IQS Tech Transfer tiene como objetivo recopilar los datos necesarios para el entrenamiento de sistemas basados en Machine Learning. Con la colaboración de los profesores del Departamento de Bioingeniería de IQS School of Engineering, la Dra. Magda Faijes, el Dr. Xevi Biarnés y el Dr. Antoni Planas – coordinadores del ensayo para la recogida de datos de dibujo de moléculas en una pantalla táctil –, se movilizaron los recursos necesarios – tabletas táctiles y lápices digitales – y se implicó a una cantidad importante de participantes voluntarios, con una gran variedad de perfiles: desde estudiantes universitarios de primer año hasta profesores de IQS.

Con la aportación de los datos desde la colaboración con IQS, podremos mejorar la precisión de nuestros modelos y aumentar el rendimiento general del reconocimiento”, son palabras de los responsables de Vision Arcanum.

Para IQS ha representado una oportunidad de brindar a la industria el talento de sus estudiantes y profesores. El proyecto ha permitido conocer de primera mano el desarrollo de una de las tecnologías más punteras de inteligencia artificial aplicada al reconocimiento de estructuras químicas”, afirman los coordinadores de IQS.

Uno de los colectivos que ha participado en el estudio ha sido el de los estudiantes de doctorado de IQS. Una de las participantes, investigadora del Laboratorio de Diseño Molecular del Grupo de Química Farmacéutica de IQS, afirma: “Participar como voluntaria en la recogida de datos de este proyecto ha sido muy enriquecedor a la vez que iluminador. Los que nos dedicamos a implementar Machine Learning en nuestros estudios sabemos el gran valor que suponen unas bases de datos extensas y con fuentes diversas para así mejorar y validar nuestros modelos. De modo que IQS, con su plantilla tan plural, suponía una población idónea para el ensayo. Considero que la herramienta que están elaborando en Vision Arcanum será de gran valía para los químicos, por lo que ha sido un honor formar parte de este estudio”.