
DeepSeek, una revelación en el mundo de la inteligencia artificial
La empresa china DeepSeek ha acaparado la atención mundial tras catapultarse a la cima de las listas de aplicaciones de la App Store y Google Play con su aplicación de chat basada en inteligencia artificial. Este fenómeno ha despertado el interés de analistas y tecnólogos sobre el papel de Estados Unidos en la carrera por la inteligencia artificial y la demanda de chips específicos para esta tecnología.
Origen y respaldo financiero de DeepSeek
DeepSeek surgió de los orígenes comerciales de High-Flyer Capital Management, un fondo de cobertura cuantitativo chino que emplea inteligencia artificial para tomar decisiones de inversión. Fundada por el entusiasta de la inteligencia artificial Liang Wenfeng en 2015, la empresa comenzó como un fondo destinado a desarrollar y desplegar algoritmos de inteligencia artificial. En 2023, High-Flyer estableció DeepSeek como un laboratorio independiente con el enfoque de investigar herramientas de inteligencia artificial, lo que eventualmente llevó a su expansión como una empresa propia.
Restricciones técnicas y formación del equipo
Al igual que otras empresas de inteligencia artificial en China, DeepSeek ha enfrentado restricciones debido a las prohibiciones de exportación de hardware impuestas por Estados Unidos, obligándola a utilizar versiones menos potentes de chips, como los Nvidia H800. Además, la compañía ha formado un equipo técnico predominantemente joven, reclutando agresivamente a investigadores con doctorado de las principales universidades chinas, y contratando a personas sin formación específica en ciencias de la computación para enriquecer su comprensión de diversos temas.
Modelos potentes y su impacto en la industria
DeepSeek presentó sus primeros modelos, DeepSeek Coder, LLM y Chat, en noviembre de 2023. Sin embargo, no fue hasta el lanzamiento de la generación de modelos DeepSeek-V2 cuando la industria comenzó a prestarles atención. Estos modelos, más baratos de operar que los de la competencia de ese momento, llevaron a empresas rivales como ByteDance y Alibaba a reducir los precios de sus modelos o incluso a ofrecerlos gratuitamente. La llegada del DeepSeek-V3 en diciembre de 2024 amplió la fama de la empresa al superar en pruebas internas a modelos conocidos de compañías como Meta y OpenAI.
Modelo de razonamiento R1 de DeepSeek
El modelo de razonamiento R1 de DeepSeek se destaca por su capacidad para verificar sus propias respuestas, lo cual mejora su fiabilidad en áreas como la física, las ciencias y las matemáticas. Aunque este tipo de modelo tarda más tiempo en llegar a conclusiones, tiende a ser más preciso. Sin embargo, al ser un desarrollo chino, R1 está sujeto a regulaciones que le impiden responder a temas políticamente sensibles, como la Plaza de Tiananmén o la autonomía de Taiwán.
Enfoque disruptivo y modelos disponibles
El enfoque de negocio de DeepSeek sigue sin estar claro, ya que sus productos y servicios se ofrecen por debajo de los precios del mercado o incluso de forma gratuita. La empresa afirma que sus adelantos en eficiencia han permitido esta competitividad de costos, aunque algunos expertos cuestionan las cifras presentadas por la compañía. A pesar de ello, los desarrolladores han acogido los modelos de DeepSeek, que si bien no son de código abierto, están disponibles bajo licencias que permiten su uso comercial. Esta estrategia ha tenido un impacto notorio, llegando incluso a reducir el valor de las acciones de compañías como Nvidia y a provocar respuestas de líderes en el sector como OpenAI y Microsoft.
Reacciones y perspectivas futuras
El auge de DeepSeek ha suscitado atención en Silicon Valley, generando debates sobre su efectividad comparada con empresas más establecidas. A pesar del éxito alcanzado, el panorama futuro para DeepSeek es incierto, especialmente considerando la posible preocupación del gobierno estadounidense sobre influencias extranjeras en el ámbito tecnológico.