RELACIONADOS

La nueva inteligencia artificial china deepseek

MI LUCHA PERMANENTE: DESPERTAR CONCIENCIAS

En este año 2025, estamos siendo testigos de la puesta en marcha de manera gratuita de La nueva inteligencia artificial china DeepSeek (En chino: 深度求索; pinyin: shēndù qiúsuǒ; en español: “búsqueda profunda”) es una empresa china de inteligencia artificial que desarrolla modelos extensos de lenguaje (LLM Long Language Models) de código abierto. Deep Seek Búsqueda profunda  es el tema que nos convoca a realizar el presente documento.

DEEPSEEK DESAFÍA LAS NORMAS ESTABLECIDAS

En un mundo en donde la Inteligencia artificial se ha convertido en un nuevo campo de batalla en el que las superpotencias tecnológicas una Startud china, ha iniciado como un contendiente inesperado DeepSeek, está fundada por Lian Wenfeng que es un ex gestor de fondos de cobertura cuantitativos que ha desarrollado un modelo de Inteligencia Artificial, que no es solo el rival con los con los sistemas más avanzados de Open AI, sino que tambien desafía las normas establecidas de cómo se construyen  y como se financian estos modelos con un enfoque de eficiencia y en la innovación resulta que DeepSeek ha demostrado que es posible competir con la élite de la Inteligencia Artificial, sin depender de los recursos ilimitados que han caracterizado hasta hoy a los Gigantes Occidentales, y eso lo podría cambiar este hombre.

PERO COMO DIRÍA JACK EL DESTRIPADOR, VAYAMOS  POR PARTES

El pasado 20 de enero, hace nada más un par de meses pasaditos, DeepSeek lanzó su modelo DeepSeek R1, un sistema de código abierto que rápidamente se convirtió en el centro de atención de Silicon Valley, se pusieron un poquito sorprendidos, pero lo interesante de es que DeepSeek R1, no es solo un modelo un modelo de Inteligencia Artificial, más adelante va a ser clave para entender de lo que se está hablando y que se está viviendo en el día de hoy, pero sobre todo de lo que vamos a vivir en los próximos meses, pero por ahora volvamos al tema inicial, vamos a ver de dónde viene todo esto.

EFICACIA Y SU EFICACIA EN LOS COSTOS Y EN SU ENFOQUE DE CÓDIGO ABIERTO

Según un artículo publicado por el empresas DeepSeek R1, supera a los modelos líderes como Open AI 01, en varias pruebas de matemáticas y razonamiento, este logro no es solo impresionante por su capacidad técnica, sino que también lo es por su eficacia y su eficacia en los costos y en su enfoque de código abierto, lo que le convierte en una alternativa bastante atractiva para para investigadores, desarrolladores, DeepSeek R1 no solo iguala el rendimiento de los modelos occidentales, sino que lo hace utilizando una fracción de los recursos computacionales, y esta es la clave. Por ejemplo el modelo DeepSeek requirió una décima parte del poder de computo utilizado para entrenar por ejemplo al modelo Llama 31 de Meta, según el Instituto de Investigación EPOC AI, que es el que hizo esta prueba, y esta eficiencia es el resultado de una combinación de innovaciones técnicas como la Atención Latente Multicabeza (MLA) y el enfoque de mezcla de expertos que permite al modelo optimizar el uso de recursos sin sacrificar rendimiento.

DEEPSEEK UTILIZANDO TÉCNICAS DE APRENDIZAJE DE REFUERZO QUE PREMIAN

Voy a explicar el programa al igual que su contraparte estadounidense procesa las solicitudes mediante una cosa que se llama cadenas de pensamiento, que imitan con una precisión casi inquietante los procesos de razonamiento humano,  luego volveré a este detalle porque las cadenas de pensamiento son clave, pero que este sistema no nació de la nada fue entrenado a partir del funcionamiento de chatbot V3, también desarrollado por DeepSeek utilizando técnicas de aprendizaje de refuerzo que premian no solo la respuesta correcta, ojo con esto, sino también la capacidad del sistema para explicar su propio pensamiento y lo hace durante la resolución de problemas, pero eso no es todo, los investigadores dieron un paso más allá con este modelo al implementar una cosa que se llama arquitectura de mezcla de expertos.

ARQUITECTURA DE MEZCLA DE EXPERTOS

Es una Innovación, que permite al modelo decidir con una frialdad casi Maquiavélica ¿Qué redes de procesamiento se deben activar para cada tarea específica? el resultado es una máquina que no solo piensa, sino que lo hace de manera estratégica y eficiente, el costo de entrenar este prodigio tecnológico ronda los 6 millones de dólares, han leído bien, 6 millones de dólares, una cifra que en comparación con los más de 60 millones de Meta que invirtió en Llama parece casi irrisoria, o los miles de millones que están utilizando el resto.

DEEPSEEK R1 CUESTA UNA TRIGÉSIMA PARTE DE LO QUE IMPLICA UTILIZAR OPEN AI 01

Este ahorro monumental en recursos informáticos, no es solo un logro técnico, es un terremoto que sacude los cimientos de la industria, y ahora verás por qué, el acceso a DeepSeek R1 cuesta una trigésima parte de lo que implica utilizar Open AI 01 lo que no solo democratiza el uso de la Inteligencia artificial sino que también plantea una pregunta muy incómoda para los gigantes occidentales, ¿Cómo es posible que un modelo chino desarrollado en un contexto de restricciones y sanciones haya logrado semejante hazaña? Mario kren,  el director del Laboratorio de Ciencias Artificiales del Instituto Max Plank, ha escrito, ha comentado que, un experimento que antes costaba más de 300 libras con Open AI, ahora puede realizarse por menos de $10 dólares.

ALGO QUE HABÍAMOS OLVIDADO, TIKTOK, LA APLICACIÓN CHINA ESPIA

Esta es una diferencia abismal para el uso de esa tecnología, un cambio de paradigma, que no solo va a influir, sino que va a dominar la futura adopción de ese algoritmo chino, es cuestión de pasta, sus palabras no son una exageración, estamos ante un punto de inflexión en la carrera por la supremacía de la Inteligencia artificial que es la clave del futuro inmediato, un momento en el que la eficiencia y la innovación han demostrado ser más poderosas que los recursos ilimitados y el Poderío Financiero, ese que viene de Silicon Valley por ejemplo, Incluso en Europa, igual aquí se entiende algo que habíamos olvidado, TikTok.

LOS DATOS EN DEEPSEEK Y TIKTOK ¿OPERAN EN SECTORES APARENTEMENTE DISTINTOS?

Aunque DeepSeek y TikTok operan en sectores aparentemente distintos Inteligencia artificial y redes sociales respectivamente, hay puntos de conexión que podrían ser, yo diría que relevantes, especialmente en términos de datos. Datos para el entrenamiento de modelos de inteligencia artificial y la geopolítica,  una de las conexiones más evidentes entre DeepSeek y TikTok, es el uso de los datos para entrenar los modelos de Inteligencia artificial. Pues bien, TikTok es propiedad de la empresa china ByD es una de las plataformas más grandes del mundo y tienen más de 1000 millones de usuarios activos mensuales. Pues esta plataforma que genera una cantidad masiva de datos sobre el comportamiento de los usuarios, pues está bien no, porque sus preferencias, interacciones, patrones de consumo, contenidos, todo eso puede alimentar perfectamente a una Inteligencia artificial,

DEEPSEEK DESARROLLA MODELOS DE LENGUAJE Y ALGORITMOS DE APRENDIZAJE AUTOMÁTICOS

Por su parte, es esa empresa de Inteligencia artificial que desarrolla modelos de lenguaje y algoritmos de aprendizaje digamos automático, para entrenar esos modelos se necesitan grandes volúmenes de datos, y plataformas como TikTok podrían ser una fuente potencial de información valiosa, ¿imagina que se supone eso sin conceder?, aunque no hay evidencia de que DeepSeek utilice datos de TikTok, (déjame pensar mal), sería factible que empresas chinas de Inteligencia artificial puedan acceder a datos de redes sociales para mejorar sus algoritmos, siempre dan en un marco regulatorio chino y de empresas chinas, bueno, no se puede pensar mal (¿?), y por el otro lado seguramente lo que más asusta a las administraciones, y sobre todo a la administración de los estados Unidos es porque ambas empresas podrían beneficiarse de un enfoque similar, en la optimización de los recursos.

¿DEEPSEEK Y TIKTOK USAN SISTEMAS DE RECOMENDACIÓN Y ANÁLISIS DE DATOS EN COMÚN?

Por ejemplo, si DeepSeek desarrolla tecnologías que permiten entrenar modelos de Inteligencia artificial con menos recursos, pues resulta que TikTok podría adoptar esas innovaciones para mejorar sus propios sistemas de recomendación y análisis de datos, lo que reduciría costes, aumentaría la eficiencia y se lo llevaría todo por delante, lo curioso es que esta sospecha y acusación a los chinos, pues sería algo hipócrita ¿Por qué?, ¿Qué pasa? ¿Acaso las empresas occidentales no han utilizado datos sin restricciones para entrenar sus modelos?, ¿No han comercializado con nuestra privacidad sin decir nada?, Pues eso, que aquí nadie está exento de culpa, cuando culpemos a los chinos pensemos en que se ha hecho aquí, en la contraparte.

¿EN EUROPA ESTÁN PENSANDO CÓMO REGULAR A DEEPSEEK?

Por cierto a estas horas no hay nadie de Europa que haya dicho nada al respecto, seguramente están pensando ¿Cómo regular a DeepSeek?,  yo que sé, pero bueno recuerdas que te dije que DeepSeel R1, no es solo un modelo de Inteligencia artificial, pues así es, en realidad, se trata de un mensaje claro al mundo, la competencia en Inteligencia artificial ya no es un juego de recursos infinitos, sino de ingenio, de creatividad y de una determinación feroz por superar los límites impuestos, y mientras occidente pregunta ¿Cómo responder?, DeepSeek avanza imparable redefiniendo las reglas del juego, DeepSeekR1, ha sido comparado ya con el modelo más avanzado de Open AI conocido como 01 en términos de capacidad de razonamiento, y precisión.

¿DEEPSEEK R1 ES CAPAZ DE EMULAR EL RAZONAMIENTO HUMANO DE MANERA BASTANTE EFECTIVA?

Según un documento técnico publicado en la Revista Nature, el modelo chino alcanza, ojo con esto, una precisión del 97%  en la resolución de problemas matemáticos evaluados con el parámetro Maz 500, además supera en el 96% de los participantes humanos que participen en esas pruebas de programación que se realizan, en plataformas como Code Forces, estas métricas no solo son impresionantes, sino que también sugieren que DeepSeek R1, es capaz de emular el razonamiento humano de manera bastante efectiva, utilizando cadenas de pensamiento que imitan los procesos humanos cognitivos.

LA ACCESIBILIDAD  DE DEEPSEEK R1, ES ALGO NUEVO SEGÚN EL MIT

Otro aspecto destacable de DeepSeek R1, es su accesibilidad, y esto es nuevo porque el modelo se ha publicado bajo una licencia del Instituto Tecnológico de Massachusets el MIT como una herramienta Open weight, lo que significa que sus cadenas de pensamiento, es decir ese proceso por el cual se genera el razonamiento, son accesibles para las investigaciones para que el modelo pueda reutilizarse sin restricciones. Y aunque no se considera completamente de código abierto ya que sus datos de entrenamiento ahí no están disponibles, curiosamente eso es lo que no está disponible, esta apertura permite una mejor interpretación de los modelos que utilizan.

DEEPSEEK UTILIZA TÉCNICAS DE APRENDIZAJE DE REFUERZO ¿QUÉ QUIERE DECIR ESTO?

Y aunque no se puede considerar completamente de código abierto, ya que sus datos de entrenamiento, curiosamente de entrenamiento, no están disponibles, esta apertura permite una mejor interpretación de los procesos de razonamiento del modelo, según Marco Dos Santos, que es un científico informático de la Universidad de Cambridge DeepSeek R1, fue entrenado dice él, utilizando técnicas de aprendizaje de refuerzo. ¿Qué quiere decir esto?, quiere decir que el sistema es recompensado no solo por llegar a una respuesta correcta, sino como  lo decía  antes, por describir su proceso de pensamiento, ahí recibe el premio, y ese enfoque en realidad lo que permite es que el modelo no solo resuelva problemas, sino que también explique ¿Cómo llegó a esa solución? y eso es un campo nuevo.

ARQUITECTURA DE MEZCLA DE EXPERTOS ¿QUÈ QUIERE DECIR ESO?

Además el modelo utiliza una arquitectura de mezcla de expertos, que le permite decidir ¿Qué redes de pensamiento tiene que activar? y ¿Cuáles tiene que desestimar?, esa flexibilidad es una de las claves de su eficiencia ya que optimiza el uso de recursos computacionales, y reduce los costos operativos. Y como te decía esta eficiencia en el uso de recursos no solo reduce los costos de acceso para los usuarios, sino que también desafía una narrativa de que la superioridad en Inteligencia artificial está directamente ligada a la escala de cómputo y a los recursos financieros.

DEEPSEEK CONSTRUYE UNA ESPECIE DE CLUSTER MASIVO CON LOS CHIPS DISPONIBLES ¿QUÉ ES ESO?

Franois Cholet es investigador de Inteligencia artificial y fue el creador de la biblioteca de aprendizaje profundo, Queras, ha escrito por ahí que la eficiencia en el uso de recursos es más crucial que la mera escala de cómputo, y eso es importante, porque resulta que aunque esto es chino y por eso opera bajo restricciones gubernamentales, resulta que en la mayoría de los casos prácticos no es un problema, ya se ha probado, y lo ha probado mucha gente, ya DeepSeek ha demostrado en todo eso una eficiencia impresionante porque construye una especie de Cluster Masivo con los chips disponibles y aprovecha los datos públicos posiblemente incluyendo también información del propio Chat GPT, esto ha hecho que su modelo a veces sea muy potente, pero que también a veces se confunde con el resultado del propio Chat GPT.

¿DEEPSEEK JUNTO CON OTROS LABORATORIOS CHINO CREAN UN SALTO CUANTICO?

¿Qué estamos ante algo inédito?, parece claro, ¿Que sea un salto cuántico?, está por verse, Mark Andersen, que es fundador de una de las firmas de capital de riesgo más importantes del mundo, describe el momento que estamos viviendo hoy, como uno de los avances más sorprendentes e impresionantes que ha visto jamás. Hay otras personas como Jean Lekun, que es un científico francés reconocido mundialmente por sus contribuciones al campo del aprendizaje automático, él ha señalado que este modelo de código abierto está superando ya, cualquier orto conocido, y tendríamos que estar atentos a lo que viene, de hecho DeepSeek junto con otros laboratorios chinos como el que tiene Alibaba o el que tiene Kimi, han demostrado que la eficiencia y el código abierto son una combinación que podrían ser imbatible.

DEEPSEEK, UNA EMPRESA DEDICADA A LA INVESTIGACIÓN DE INTELIGENCIA ARTIFICIAL AVANZADA

Pero ¿Cuál es el origen de esta empresa? ¿De dónde sale?, Deep Seek no es una StartUp convencional, nació como una rama de investigación de FireFly, un proyecto de aprendizaje profundo dentro de Hike Flyer, uno de los fondos de cobertura cuantitativos más exitosos de china, y ojo con esto porque, fundado en 2015 Hike Flyer acumuló una fortuna analizando datos financieros con supercomputadoras y miles de chips Nvidia, sin embargo en 2023, Liang Wenfeng, el fundador de Hike Flyer decidió redirigir esos recursos hacia la creación de DeepSeek, una empresa dedicada a la investigación de inteligencia artificial avanzada, que es lo que tenemos hoy sobre la mesa, Liang no estaba motivado por el lucro dice, sino por la curiosidad científica.

SE BUSCABA TALENTO JOVEN Y AMBICIOSO PARA DEEPSEEK

En una entrevista en una publicación que se puede leer buscándola en Google, se llama 36kr, explico que la investigación básica en Inteligencia artificial tiene un retorno de inversión muy bajo, pero que su objetivo, el suyo, era contribuir al avance de la inteligencia artificial general, uno de los aspectos más llamativos de Deep Seek es su equipo de investigación que está compuesto por jóvenes recién graduados de las mejores universidades de China, de la Universidad de Pekín e incluso la Universidad de Xinhua, este hombre Liang buscaba talento joven y ambicioso dice, él, dispuesto a dedicarse por completo  a la investigación sin las presiones comerciales que suelen dominar en las grandes empresas tecnológicas, supongo que el gobierno de China aquí nada tiene que ver.

DEEPSEEK NO SURGIÓ EN UN VACIO

Este enfoque,  tambien refleja un sentido, según ellos, de patriotismo entre los jóvenes investigadores quienes ven su trabajo como una forma de superar las restricciones tecnológicas impuestas por Estados Unidos, ahí dicen que ellos están por China y en contra de las restricciones de los americanos el gobierno chino ha filtrado que la determinación de estos jóvenes para superar las barreras americanas refleja no solo una ambición personal, sino tambien un compromiso más amplio con el avance de China, como líder en innovación global eso AF filtrado el gobierno chino, y es que la innovación de DeepSeek no surgió en un vacío, sin en respuesta y eso si que es cierto a las restricciones de exportación impuestas por estados Unidos en Octubre de 2022, el gobierno estadounidense implemento controles que limitaban el acceso de las empresas chinas a chips avanzados como los Nvidia H100 pues resulta que esas restricciones representaron un desafío para DeepSeek y para el gobierno chino, que dependía de esos chips para entrenar sus modelos.

A MODO DE CONCLUSIONES VOY A DAR ALGUNAS CLAVES:

Primer punto: El éxito de DeepSeek plantea preguntas importantes sobre el futuro de la competencia en inteligencia artificial, por un lado demuestra que la eficiencia y la innovación pueden superar las limitaciones de recursos, lo que podría cambiar la forma en que se están desarrollando los modelos de inteligencia artificial en el futuro y por otro lado su enfoque en código abierto, genera una considerable buena voluntad dentro de la comunidad global de investigación en la inteligencia artificial y sugiere que la colaboración podría ser más beneficiosa que la competencia.

Segundo punto: es que el surgimiento de DeepSeek también podría representar un desafío para las políticas de exportación de Estados Unidos que se basan en la creación hasta ahora de cuellos de botella  en los recursos  computacionales, igual se inspiran también en otras cosas, estimaciones actuales sobre cuánto poder de computo tiene China y lo que puede lograr con él, podrían verse revolucionadas o cambiadas

Tercer punto el desarrollo de DeepSeek R1 no puede entenderse sin considerar el contexto geopolítico actual, Estados Unidos ha impuesto estrictos controles de exportación sobre chips y modelos base de inteligencia artificial, lo que ha dificultado el acceso de china a tecnologías clave, sin el éxito de DeepSeek R1, el éxito de momento, demuestra que China, no solo ha logrado superar esas barreras, ojo, sino que tambien ha desarrollado un modelo que rivaliza con los mejores sistemas americanos. El DeepSeek vs el Chat GPT AI 01, continuará.

La fe no solo hace que las cosas sean fáciles, hace que las cosas ocurran. (Lucas 1:37) No lo olvides, las palabras convencen, pero el ejemplo arrastra. Dios, siempre puede más.

Monterrey, Nuevo León, México

Marzo 17, 2025

Dr. H.C. Mtro. QFB. Fernando De la Fuente García.

ENTRE GRIEGOS Y TROYANOS.

E-Mail: ferdelafuenteg@gmail.com

Facebook: Qfb Fernando De la Fuente García

X: QFB. Fernando DelaFuente Garcia @FerranFercho

Instagram: Qfb Fernando De la Fuente García

@fernandodelafuentegarcia

Telegram: t.me/ el despertar de monterrey

Telegram: Fernando De la Fuente García

WhatsApp: 4444-16-9864

 

LA NUEVA INTELIGENCIA ARTIFICIAL CHINA DEEPSEEK

LA BRECHA
LA BRECHA - Información Puntual

POPULARES

article .entry-content p, article .entry-content ul li { text-align: justify; }

Descubre más desde LA BRECHA

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo