Google facilita datos reales para entrenar inteligencia artificial
Google lanza el servidor MCP para Data Commons. La herramienta permite acceder a datos públicos mediante lenguaje natural. El objetivo es mejorar el entrenamiento de los sistemas de IA con información verificable.
Acceso simplificado a datos estructurados
El servidor MCP (Model Context Protocol) conecta conjuntos de datos públicos con sistemas de IA. Los desarrolladores pueden integrar esta información en sus aplicaciones usando consultas en lenguaje natural. Los datos proceden de fuentes como censos, organismos gubernamentales y estadísticas de la ONU.
Un antídoto contra las alucinaciones de la IA
Los modelos de IA se entrenan a menudo con datos web ruidosos y no verificados. Esto puede llevar a alucinaciones o invenciones. El acceso a datos estructurados y de calidad de Data Commons busca mitigar este problema.
Colaboración y aplicación práctica
Google se asoció con la organización sin ánimo de lucro ONE Campaign. Juntos lanzaron One Data Agent, una herramienta que utiliza el servidor MCP para ofrecer millones de puntos de datos financieros y sanitarios sobre África en lenguaje claro.
Un estándar abierto para la industria
El Protocolo Model Context Protocol (MCP) es un estándar abierto introducido por Anthropic. Compañías como OpenAI, Microsoft y Google ya lo han adoptado. Proporciona un marco común para que las IA accedan a fuentes de datos diversas.
Antecedentes: el origen de Data Commons
Google lanzó Data Commons en 2018. La plataforma agrupa datasets públicos de diversas fuentes, incluyendo administraciones locales y organismos globales. Su propósito siempre ha sido organizar y hacer accesible la información del mundo real.
Cierre: implicaciones para el desarrollo de IA
La medida de Google democratiza el acceso a datos de alta calidad para el entrenamiento de IA. Esto podría influir en el desarrollo de aplicaciones más precisas y fundamentadas en información verificable, reduciendo la dependencia de datos no estructurados de la web.