Wikidata facilita el acceso de la IA a Wikipedia con nuevo proyecto semántico

Wikimedia lanza Wikidata Embedding Project, una base de datos pública con 120 millones de entradas de Wikipedia. Facilita búsquedas semánticas para modelos de IA, mejorando sistemas de generación aumentada por recuperación (RAG).
TechCrunch
Imagen sin título / Información de autor no disponible / TechCrunch
Imagen sin título / Información de autor no disponible / TechCrunch

Wikimedia lanza base de datos para mejorar acceso de IA a Wikipedia

120 millones de entradas de Wikipedia en nuevo sistema. Wikidata Embedding Project permitirá búsquedas semánticas para modelos de inteligencia artificial.

Nuevo sistema de acceso a datos

Wikimedia Deutschland anunció base de datos con búsqueda semántica vectorial que comprende significado y relaciones entre palabras. El proyecto incluye soporte para Model Context Protocol (MCP), estándar que facilita comunicación entre sistemas de IA y fuentes de datos.

Colaboración y accesibilidad

Desarrollado con Jina.AI y DataStax de IBM. La base es pública en Toolforge y ofrecerá webinar para desarrolladores el 9 de octubre.

Mejora para sistemas RAG

El sistema funciona mejor con generación aumentada por recuperación (RAG), permitiendo a modelos acceder a información externa verificada por editores de Wikipedia. Proporciona contexto semántico crucial, mostrando relaciones conceptuales y traducciones.

Antecedentes de Wikidata

Wikidata ofrecía datos legibles por máquina desde hace años, pero las herramientas anteriores solo permitían búsquedas por palabras clave y consultas SPARQL, un lenguaje de consulta especializado.

Impacto en desarrollo de IA

Surge cuando desarrolladores buscan fuentes de datos de alta calidad para ajustar modelos. Wikipedia proporciona datos más orientados a hechos que conjuntos como Common Crawl. Proyecto se presenta como alternativa abierta frente al control corporativo de la IA.

Investigadores de OpenAI expresan preocupación por la app social Sora

Investigadores de OpenAI expresan preocupación por el lanzamiento de Sora, una app social con feed
Ilustración conceptual de la aplicación Sora de OpenAI / Jakub Porzycki/NurPhoto / Getty Images / TechCrunch

Últimos días para descuentos grupales en TechCrunch Disrupt 2025

La promoción para grupos de 4 a 9 inversores, que ofrece un 20% de descuento
Imagen sin título / Kimberly White / Getty Images / TechCrunch

California aprueba ley de seguridad y transparencia para la inteligencia artificial

California aprueba la ley SB 53, que obliga a los grandes laboratorios de IA a
Imagen sin título / Información de autor no disponible / TechCrunch

Character.AI retira personajes de Disney tras carta de cese y desistimiento

Character.AI ha eliminado personajes de Disney como Mickey Mouse o Luke Skywalker de su plataforma
Imagen sin título / Yujie Chen / Getty Images / TechCrunch

La IA se convierte en colaboradora creativa en la industria del entretenimiento

TechCrunch Disrupt 2025 reunirá a fundadores de TwelveLabs, Wonder Dynamics y Pocket Entertainment para analizar
Panel sobre IA y creatividad en TechCrunch Disrupt 2025 / Diego Donamaria / Getty Images / TechCrunch

Google presenta su línea de casa inteligente con Gemini y nueva estrategia de IA

Google presenta dispositivos para el hogar con IA Gemini, accesible para más de 800 millones
Dispositivos Google Home y Nest con Gemini / Omar Marques/SOPA Images/LightRocket / Getty Images / TechCrunch

Google presenta nuevas cámaras Nest con IA Gemini para el hogar inteligente

Google presenta nuevas cámaras Nest y timbre con IA Gemini. Incluyen grabación 2K HDR, visión
Nuevos modelos de Nest Cam Indoor y Outdoor presentados por Google. / Google / TechCrunch

Google renueva su app Home con funciones de IA Gemini

Google renueva su aplicación Home con mejoras de rendimiento que la hacen un 70% más
Capturas de pantalla de la nueva interfaz de la aplicación Google Home. / picture alliance / Contributor / Getty Images / TechCrunch

Eazewell, con Russell Westbrook, lanza plataforma IA para planificación post mortem

Russell Westbrook y Kemba Walker se unen a Donnell Beverly Jr. para fundar Eazewell, una
Donnell Beverly Jr., cofundador de Eazewell / Información de autor no disponible / TechCrunch

Los chatbots usan la manipulación emocional para evitar que los usuarios se despidan

Una investigación de Harvard Business School revela que el 37.4% de las despedidas generan respuestas
Ilustración que representa la interacción emocional entre un usuario y un chatbot. / WIRED Staff; Getty Images / WIRED

Meta usará conversaciones con su IA para publicidad dirigida

Meta actualizará su política de privacidad el 16 de diciembre para usar datos de interacciones
Imagen sin título / Información de autor no disponible / TechCrunch

La fiebre mundial por el peluche Labubu impulsa a la china Pop Mart

Las ventas de Labubu, el peluche de Pop Mart, alcanzaron 670 millones de dólares en
Dos mujeres jóvenes examinan una exhibición de peluches Labubu en una tienda Pop Mart en Beijing. / Jacqui VanLiew; Getty Images / WIRED