image: Flower and digitalized pollen of Passiflora cumbalensis as part of the PollenGEO project collection.
Credit: Dominique Hämmerli and Carlos Jaramillo
Un equipo de investigadores del Instituto Smithsonian de Investigaciones Tropicales (STRI) está digitalizando imágenes de polen de más de 18,000 especies de plantas tropicales. Estas imágenes se están utilizando para entrenar un modelo de aprendizaje automático para identificar granos de polen, una tarea que normalmente requiere cientos de horas de trabajo con microscopios por parte de expertos. Las imágenes también permitirán realizar una amplia gama de nuevos análisis de polen. La base de datos, llamada PollenGEO, estará disponible gratuitamente en línea.
La colección de polen del Smithsonian, que se encuentra en el Instituto Smithsonian de Investigaciones Tropicales (STRI) y en el Museo Nacional de Historia Natural del Smithsonian (NMNH), contiene más de 18,000 especies, lo que la convierte en una de las colecciones de polen más grandes del mundo. Las bases de datos de referencia de polen, como PollenGEO, podrían desempeñar una gran variedad de funciones en muchos ámbitos de la ciencia y la medicina. Por ejemplo, la identificación rápida y precisa del polen puede ayudar a diagnosticar una alergia al polen, determinar el origen de la ropa encontrada en una escena de crimen, investigar cómo respondieron los bosques antiguos al cambio climático y datar los depósitos de hidrocarburos.
El valor del polen en la paleontología se deriva de su durabilidad: algunos granos de polen pueden durar cientos de millones de años, lo que ofrece una ventana a la historia de la Tierra precisa tanto en el tiempo como en el espacio. Además, el polen de cada especie vegetal es único y distinto del de otras especies.
Anteriormente, los especialistas identificaban los granos de polen uno por uno bajo el microscopio utilizando manuales ilustrados como referencia. Este proceso requiere mucho tiempo y puede resultar especialmente difícil en los trópicos, donde hay miles de especies de plantas, muchas de ellas aún sin identificar. También es difícil identificar el polen en capas rocosas antiguas, ya que muchas de las especies de plantas que lo produjeron están extintas.
Para resolver estos retos, más de 30 investigadores y estudiantes de STRI, dirigidos por el palinólogo Carlos Jaramillo, están digitalizando toda la colección palinológica del Smithsonian: subiendo más de 40 millones de fotos de granos de polen de especies vegetales conocidas para crear una enorme base de datos. Este conjunto de datos se utilizará para entrenar modelos de inteligencia artificial que ayuden a identificar el polen.
La mayoría de las muestras proceden de la Colección Palinológica Graham, donada a STRI en el 2008, que contiene alrededor de 18,000 especies de polen, en su mayoría tropical, en más de 23,000 portaobjetos de microscopio, cada uno de ellos acompañado de una ficha que describe la muestra. Un ejército de unos 100 voluntarios que trabajan en el Centro de Transcripción del Smithsonian ayudó a copiar la información de las fichas a la base de datos. La colección también incluye la colección Joan Nowicke, la colección de Isla Barro Colorado de Dave Roubik y Enrique Moreno, la colección del Amazonas de Paul Collinvaux y la colección Sian Ka'an, que contiene 650 especies del sureste de México. Además, se han escaneado aproximadamente 1,000 muestras de polen fósil de las colecciones del NMNH en Washington, D.C.
El entrenamiento de un modelo de IA para utilizar esta enorme base de datos con el fin de identificar muestras requirió la colaboración de expertos en diversos campos, desde la botánica hasta la informática. La profesora asociada Surangi Punyasena, de la Universidad de Illinois Urbana-Champaign, está construyendo el entorno de inteligencia artificial. El equipo de Jaramillo forma parte del proyecto Trans-Amazon Drilling, un proyecto a gran escala que utiliza el polen de los núcleos de perforación de toda la Amazonía para comprender la historia del bosque. Este proyecto incluye a investigadores de varias instituciones, como la Universidad Federal de Mato Grosso y la Universidad Federal de Acre en Brasil, además del Open University. La disponibilidad de PollenGEO y otras bases de datos de polen en línea transformará la identificación del polen de una actividad solitaria detrás de un microscopio a un proceso digital y universalmente accesible. Andrés Díaz, coordinador de PollenGEO presentó un seminario web sobre el proceso de digitalización de 40 millones de imágenes de polen.
La financiación de este trabajo provino de la Institución Smithsonian, la Anders Foundation, Gregory D y Jennifer Walston Johnson, el Fondo 1923, la Dotación Rubinoff Big Bet, el Smithsonian Women’s Committee y el Smithsonian Life on a Sustainable Planet Pathfinder.
Referencia: Jaramillo, C., et al. 2025. Digitizing collections to unlock the full potential of palynology: A case study with the Smithsonian palynology collection. Plants, People, Planet. https://nph.onlinelibrary.wiley.com/doi/10.1002/ppp3.70073
El Instituto Smithsonian de Investigaciones Tropicales, en ciudad de Panamá, Panamá, es una unidad de la Institución Smithsonian. El Instituto promueve la comprensión de la naturaleza tropical y su importancia para el bienestar de la humanidad, capacita estudiantes para llevar a cabo investigaciones en los trópicos, y fomenta la conservación mediante la concienciación pública sobre la belleza e importancia de los ecosistemas tropicales. Para más información refiérase a nuestro Video Institucional y visite nuestra página web. Síguenos también en redes sociales: Facebook, Twitter e Instagram.
Journal
Plants People Planet