BioCLIP 2 identifica más de un millón de especies con IA
El modelo BioCLIP 2, entrenado en GPUS de NVIDIA, es capaz de identificar más de un millón de especies. La herramienta, presentada en NeurIPS, funciona como una enciclopedia biológica y una plataforma científica para abordar la deficiencia de datos en conservación.
Un modelo más allá de la identificación
BioCLIP 2 distingue rasgos de especies y determina relaciones entre ellas sin ser entrenado explícitamente para ello. Por ejemplo, ordenó los pinzones de Darwin por el tamaño del pico automáticamente. Estas capacidades permiten a los investigadores usarlo como una herramienta de investigación interactiva con capacidades de inferencia.
Abordando la deficiencia de datos
El modelo ayuda a resolver un problema en biología de la conservación: la falta de datos para especies concretas. Tanya Berger-Wolf, directora del proyecto, señaló que «para especies icónicas como las orcas, carecemos de datos suficientes para determinar el tamaño de la población». Los modelos de IA pueden mejorar los esfuerzos de conservación existentes llenando este vacío.
El mayor conjunto de datos biológicos
El proyecto comenzó con la compilación de TREEOFLIFE-200M, un conjunto de 214 millones de imágenes de organismos que abarcan más de 925.000 clases taxonómicas. El modelo se entrenó en 32 GPUS NVIDIA H100 durante 10 días, mostrando después habilidades novedosas como distinguir entre adultos y juveniles o entre machos y hembras dentro de una especie.
Próximo objetivo: gemelos digitales de la vida salvaje
El siguiente proyecto del equipo es desarrollar un gemelo digital interactivo de la vida salvaje. Este permitiría visualizar y simular interacciones ecológicas entre especies y su entorno. El objetivo es proporcionar una forma segura de estudiar relaciones organismales con la menor huella posible en los ecosistemas reales.