DeepSeek-V3: Un golpe de realidad para Wall Street (y como usarlo localmente en tu casa u oficina)

Tormenta digital sobre Wall Street con un toro fracturándose, de cuyas grietas emergen circuitos eléctricos. En el cielo, un logotipo futurista de inteligencia artificial brilla intensamente, proyectando códigos binarios sobre la ciudad. La imagen representa el impacto de la IA en las finanzas tradicionales.

Hace tan solo una semana, informabamos que una nueva IA estaba disponible, DeepSeek-V3 y nadie nos hizo mucho caso…
Pero resulta que solo siete dias mas tarde, esta IA irrumpió con fuerza en el entorno financiero, cuestionando los pilares tradicionales de Wall Street. Este sistema de inteligencia artificial, capaz de reducir los costes de operación al 10% respecto a otras tecnologías, ha trastocado planes de inversión y provocado movimientos bruscos en la bolsa. La velocidad con la que se ha adoptado esta tecnología ha dejado a muchos actores tradicionales en estado de shock, obligando a los ejecutivos de las grandes corporaciones a repensar sus estrategias a marchas forzadas.

 

¿¿¿Cual es la diferencia entre la forma de computacion de DeepSeek y los demas actores???

Conociendo a los Americanos (y haciéndome una idea también del comportamiento Chino ya que viví seis meses por allí), no creo que reduzcan la potencia energética contratada para sus búnkeres de IA, lo que harán será ampliar sus sistemas ese 90% mas que les ha quedado libre. ¿Y como? No lo tengo muy claro, pero si tienen que reformar en hardware de las instalaciones, creo que quien peor va a salir parada es Nvidia, ya que se enfocaron a producir masivamente el modelo H100 y DeepSeek se ha entrenado que con los modelos H800 que aunque similares en potencia de calculo, el H800 es una versión capada para China y esos países malos que corren por ahí. La diferencia es que la H800 esta mucho mas limitada en stocks y es mas difícil de conseguir ya que además es mas cara. Aunque la malas lenguas dicen que DeepSeek a través de algún chanchullo a nivel de estado, tenia 200.000 GPUs Nvidia H100 por ahí escondidas. Sabiendo que OpenAI tiene 1 millón de estas, y que Meta unas 400.000, no esta mal no…?
Pero bueno, se supone que el truco de DeepSeek  es que esta optimizado en la H800, y yo dudo que los actores mas grandes vayan a tirar sus H100… así que tocara labor de Ingeniería Inversa y hacer unos cuantos retoques al código fuente de DeepSeek, que recodemos los Chinos lo han lanzado con licencia MIT, que te permite entre otras cosas, que puedes reprogramar DeepSeek a tu imagen y semejanza.

¿¿¿Pero como lo hacen???
He estado leyendo mucho esta semana al respecto, pero es algo complejo, porque a todo el mundo, nunca mejor dicho, nos pillo por sorpresa. Ni siquiera la CIA estaba al 100% informada.
Se supone que los actuales Engine de IA estan optimizados para funcionar en 32 bits y de manera completa a la vez, lo que consigue ese gasto enorme de energia. Lo que se ha podido descubrir hasta ahora con DeepSeek que es esta funcionando con lo equivalente a un Spectrum de 8 bits y de manera departamental, o para ser mas precisos con millones de Spectrums, y cuando alguien hace una consulta, comprueba internamente que es lo que va a necesitar y solo «enciende» los Spectrum afectados. Es una forma muy simple de explicarlo, y seguramente hay mucho mas compendio detrás, pero básicamente ese es el sistema. Si hacéis un simple calculo, de origen una maquina funcionando a 8 bits, esta claro que gasta menos energía, con lo que de serie, ya se ha bajado el gasto cuatro veces, y luego la optimización de usar solo «los Spectrum» necesarios, consigue que al no tener que «encenderlos» todos cada vez, incluso para hacer un calculo de 2+2, si no el Spectrum que suma 2+2, se comprende el otro ahorro de energía y el aumento de velocidad.

Si tengo que reconocer que solo tengo nociones muy básicas a este respecto, pues cuando me doctore en 2003 de mi especialidad, la IA ni siquiera estaba en los planes de nadie, ni siquiera en mis lecciones se tocaba mucho. Lo que explico aquí son teorías desarrolladas a través de mis conocimientos, que aunque no son pocos, son realmente bajos para el panorama actual, con lo que aunque no vaya desviado, puedo estar errado.

Impacto real en las inversiones

Mientras los gigantes de la industria siguen valorando pérdidas (Nvidia perdió en un solo día casi un 18% de su valor en bolsa, llegando sus perdidas hasta casi los 600 mil millones de dólares, aprox una tercera parte del PIB de España), se confirma que DeepSeek-V3 ha logrado optimizar la gestión de datos y recursos de una manera inédita. El resultado es un modelo más rentable y ágil disponible open source (el codigo fuente) que demuestra que no son mentira sus virtudes, lo que ha obligado a reevaluar estrategias y presupuestos corporativos. Los fondos de inversión han reaccionado con movimientos cautelosos, algunos apostando por la nueva ola tecnológica y otros retirándose del mercado hasta tener una mejor comprensión del panorama futuro. Este fenómeno ha generado un escenario de incertidumbre sin precedentes, en el que los más ágiles podrían capitalizar grandes oportunidades, mientras que los más reticentes podrían verse desplazados en cuestión de meses.

Enfoque legal y riesgos de mercado

Como  el guardián mas dicharachero del orden computacional, no puedo ignorar las implicaciones legales que podrían surgir. Las investigaciones preliminares apuntan a la posibilidad de espionaje industrial y a prácticas de competencia desleal. Cualquier irregularidad de este tipo, comprobada ante un tribunal, podría derivar en fuertes sanciones económicas y penales para quienes se demuestre responsables. Además, las autoridades regulatorias de diferentes países ya han comenzado a examinar la legalidad de los métodos de recopilación de datos utilizados por DeepSeek-V3, lo que podría desembocar en nuevas normativas que restrinjan su uso. Mientras tanto, los bufetes de abogados especializados en derecho tecnológico y financiero están en plena ebullición, con clientes desesperados por entender cómo este cambio podría impactar sus operaciones en el futuro inmediato.

Hacia una nueva burbuja tecnológica

Algunos analistas sostienen que el crecimiento acelerado de las IAs ya presentaba signos de sobrevaloración (una burbuja, vamos), y que DeepSeek-V3 tan solo acelero destapando la realidad. Si bien no es seguro todavia que estemos ante una nueva burbuja como la inmobiliaria de 2008, la caída en las acciones de varios gigantes tecnológicos es un síntoma de volatilidad. En consecuencia, inversores y reguladores se encuentran en alerta máxima. La última vez que se vio un fenómeno similar fue durante la crisis de las puntocom (año 2000), cuando la especulación desenfrenada (vease el caso de Perra de Timofonica.es, como primer actor burbujeante) llevó al colapso de innumerables empresas. Esta vez, la diferencia radica en que la tecnología subyacente es real y funcional, lo que podría amortiguar una caída catastrófica, pero no evitar turbulencias significativas en los mercados.

Reflexión

La aparición de DeepSeek-V3 marca un antes y un después en el mercado financiero. Su eficiencia ha puesto en evidencia modelos de negocio anclados en prácticas poco sostenibles y ha generado un debate sobre la competencia leal en el sector. Como el guardian mas….  que vela por la justicia poetica, mi recomendación es mantenerse informado, evaluar con cautela cada paso y, ante cualquier sospecha de prácticas ilícitas, acudir a un asesor legal. En este nuevo escenario, donde la inteligencia artificial parece reconfigurar las reglas del juego a un ritmo sin precedentes, la vigilancia y la adaptación serán clave para sobrevivir. Las empresas deben decidir si subirse a la ola de la innovación o quedarse atrás, arriesgándose a ser devoradas por un mercado cada vez más dominado por la automatización y la optimización extrema.

 

¿Y ahora que?

Pues Deepseek, no contento con la que ha armado en solo una semana, ya ha lanzado un nuevo sistema Multimodal (que permite ademas de texto, graficos, documentos y mas).

El nuevo modelo multimodal lanzado por DeepSeek se llama Janus-Pro-7B. Este modelo, presentado el 27 de enero de 2025, es de código abierto (se puede bajar desde Hugging Face y otros) y se destaca por sus capacidades avanzadas en generación de imágenes y comprensión multimodal. Según los reportes, supera a modelos como DALL-E 3 y Stable Diffusion en benchmarks como GenEval y DPG-Bench, logrando una precisión del 80% en la generación de texto a imagen y una puntuación de 84.19 en DPG-Bench. Todavia no he tenido tiempo de probarlo, pero lo hare y sus dare un completo reporte.

Janus-Pro-7B está diseñado para ofrecer imágenes altamente realistas y detalladas, incluso con resoluciones bajas (384 x 384 píxeles). Además, utiliza una estrategia de entrenamiento optimizada y datos ampliados, lo que le permite competir con modelos más grandes y costosos. Este modelo es parte de la familia de modelos generativos Janus y está disponible en dos versiones: una con 1.000 millones de parámetros y otra con 7.000 millones de parámetros, siendo esta última la más avanzada.

DeepSeek ha ganado notoriedad por su enfoque en modelos eficientes y de bajo costo, y Janus-Pro-7B refuerza su posición como un competidor importante en el campo de la inteligencia artificial multimodal.

 

Entonces… La cosa queda asi:

DeepSeek V3, lo equivalente a ChatGPT 4o, pero mas rapido y gratuito
DeepSeek R1, lo equivalente a ChatGPT o1, pero mas rapido y gratuito
DeepSeek Janus, que no tiene equivalencia conocida en ChatGPT, pero que es un compendio del 4o, Sora, Whisper y no se cuantas cosas mas. Todavia ni lo he visto, que salio hace solo dos dias.

Venga y para que veais que no soy malo, aqui sus pongo desde donde los podeis descargar, aunque ya sus advierto, que hay que tener unos conocimientos altos de como funcionan los repositorios y como se instalan las modelos de IA Localmente. Vamos que si te da igual que se espien los Chinos tambien (antes lo hacian los «mericanis»), usa la version web con 8.000 bloqueadores de cosas (Ublock Origin, Privacy Badget, ADguard -de pago pero muy barato y recomendadisimo, cookie container, DuckDuckGo Privacy Essential, UBlacklist, ClearURLs, etc…)-,  y sin dejar datos personales y listos.

El modelo Janus-Pro-7B de DeepSeek está disponible para descarga en las siguientes plataformas:

Hugging Face:  Puedes descargar el modelo desde su página oficial en Hugging Face: https://huggingface.co/deepseek-ai/Janus-Pro-7B

GitHub:

El repositorio oficial de DeepSeek para la serie Janus, incluyendo Janus-Pro-7B, está disponible en GitHub:

https://github.com/deepseek-ai/Janus

Ambos enlaces ofrecen acceso al modelo Janus y a la documentación necesaria para su implementación. Asegúrate de cumplir con los requisitos técnicos y de seguir las instrucciones de instalación proporcionadas en las plataformas. Aunque la forma mas facil de usarlo en con Ollama y alguno de los engines que ejecutan estos modelos en local como StudioLLM, Jan y otros. Aunque también hay una extensión para Chrome que te permite ejecutar estos modelos, pero además que no es tan potente, si lo que estas buscando es privacidad, la peor idea que puedes tener es usar Google Chrome.

 

Y como se hace esto?

Como hay varias versiones desde la mas pequeña que es la de 7 Billones de parametros para R1, hasta las de 685 billones de parametros de V3, tendras que estar seguro de tener el hardware necesario para que se pueda ejecutar bien. La de 7B minimo necesitas una GPU Nvidiosa de la familia 30xx de 8GB, y la de 685B, necesitaras 9 maquinas enlazadas de alta potencia, como las M4 y M4 Pro si eres millonario, o bien montarte tu las maquinas a mitad de precio… solo asegurate que tienes puerto Thunderbolt, minimo V4, aunque la V5 es mucho mejor, pero sube bastante de precio.

Si vas ajustado, con una GPU Nvidiosa 4060Ti de 16GB, sales del paso, y puedes encontrar buenas maquinas con estas GPU desde 800€.

Si tu idea es ejecutar en local la version mas bestia de V3, como dije con Mac Mini M4 Pro, necesitaras 9 unidades, lo que serian unos 13.000€.

 

Y aqui le dejo la carta donde pueda elegir el caballero o caballera.

  1. DeepSeek R1 (Modelos de 1.5B a 70B parámetros). Este es el modelo de razonamiento bestial, que se equipara a O1 de OpenAI.

Descarga e instalación local:

Utiliza Ollama para instalar y ejecutar los modelos localmente. Si esto te suena a Chino, valga la redundancia, es tan facil como abrir vuestra teminal de comandos (ejecutando CMD en Windows) y luego tecleando ollama run deepseek-r1:7b . Intuyo que antes ya has instalado Ollama desde Ollama.com, no?

  1. DeepSeek V3 (Base y Chat Model)

Hugging Face:

DeepSeek-V3 Base Model https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

DeepSeek-V3 Chat Model https://huggingface.co/deepseek-ai/DeepSeek-V3

GitHub:

Repositorio oficial: DeepSeek-V3 en GitHub: https://github.com/deepseek-ai/DeepSeek-V3

  1. DeepSeek App (Versión móvil y web)

App Store (iOS):

Descargar DeepSeek en App Store https://apps.apple.com/us/app/deepseek-ai-assistant/id6737597349

Google Play (Android):

Descargar DeepSeek en Google Play https://play.google.com/store/apps/details?id=com.deepseek.chat

Web App:

Accede TOTALMENTE GRATIS PERO CON ESPIAS CHINOS DETRAS a la versión web en: DeepSeek Web App https://chat.deepseek.com/sign_in

Descarga directa de la app:

Descargar DeepSeek App https://download.deepseek.com/app/

  1. Documentación y API

DeepSeek API Docs https://api-docs.deepseek.com/news/news250115

 

Si necesitas ayuda adicional para la instalación o configuración, no dudes en preguntar en los foros.

 

Y desde el punto de vista de los encorbatados, que?

Poco se puede saber de como estan pensando los encorbatados en este momento ya que la sangre no les llega a cerebelo de lo apretada que tienen la corbata, pero en el diario 20 Minutos han sacado un articulo buenisimo que explica muy bien como esta todo esto, y es de obligada lectura si habeis llegado hasta aqui en este articulo.

El articulo se llama «Deepseek, OpenAI, MetaAI, Nvidia y hasta la española ALIA: quién es quién en el seísmo de Inteligencia Artificial que reinventa el mundo» y lo podeis encontrar en https://www.20minutos.es/noticia/5676837/0/radiografia-del-sector-de-la-ia-el-terremoto-deepseek-obliga-a-reconsiderar-el-mapa-de-la-tecnologia-que-cambiara-el-mundo/

Es largo y vale la pena, pero aqui sus pongo el resumen que me ha hecho el propio DeepSeek al respecto

El artículo de 20minutos titulado «Radiografía del sector de la IA: el terremoto DeepSeek obliga a reconsiderar el mapa de la tecnología que cambiará el mundo» analiza el impacto técnico y estratégico de DeepSeek, una startup china de inteligencia artificial, en el panorama global de la IA. A continuación, se presenta un resumen técnico de los puntos clave:

1. Innovación técnica de DeepSeek

Código abierto y eficiencia: DeepSeek ha revolucionado el sector al desarrollar modelos de IA altamente eficientes y de bajo costo, utilizando técnicas avanzadas de optimización de recursos. Esto contrasta con los modelos de empresas como OpenAI, que dependen de infraestructuras costosas y grandes cantidades de hardware.

Costos reducidos: DeepSeek ofrece servicios de API a precios significativamente más bajos que sus competidores. Por ejemplo:

Costo por millón de tokens de entrada: 0,14 USD (DeepSeek) frente a 15 USD (OpenAI).

Costo por millón de tokens de salida: 2,2 USD (DeepSeek) frente a 60 USD (OpenAI).

Impacto en hardware: A pesar de las restricciones de exportación de chips avanzados como los NVIDIA H100, DeepSeek ha logrado entrenar modelos competitivos utilizando hardware menos avanzado y técnicas de optimización de software.

2. Impacto en el mercado y la industria

Caída de Nvidia: La irrupción de DeepSeek provocó una caída histórica en el valor de Nvidia (-16,9%), debido a la percepción de que los modelos de IA ya no requieren hardware extremadamente costoso para ser competitivos.

Competencia con OpenAI: DeepSeek ha desafiado directamente a OpenAI con su modelo R1, que iguala en capacidad de razonamiento al modelo o1 de OpenAI, pero a una fracción del costo.

Adopción masiva: En pocos días, DeepSeek se convirtió en la aplicación más descargada en las tiendas de aplicaciones de China y Estados Unidos, superando a ChatGPT.

3. Estrategia tecnológica y geopolítica

Enfoque en estándares globales: China, a través de empresas como DeepSeek, busca establecer estándares internacionales en IA, ganando influencia en mercados emergentes y desafiando la hegemonía tecnológica de Estados Unidos.

Restricciones y censura: Los modelos de DeepSeek están diseñados para cumplir con las regulaciones chinas, evitando temas sensibles como la masacre de Tiananmen o la independencia de Taiwán. Esto refleja la alineación de la tecnología con los valores políticos del gobierno chino.

Poco sabemos de quienes estan detras… sabemos que su CEO se llama Jun Zhang y es menos sociable que yo, que eso ya es decir. No hay casi informacion de el por la red, al menos por el momento, se supone que con el cabreo que esta generando, ahora le tienen que estar buscando hasta el nombre de su bisabuela, pero que dicen que es muy dificil reconorcelo porque todos los chinos son iguales.

DeepSeek es una empresa china de inteligencia artificial que construye modelos de lenguaje y productos de IA. La empresa está respaldada por inversores como Gaorong Capital, HongShan (anteriormente Sequoia China) y otras firmas de capital de riesgo como Softbank… pero hay alguna empresa que no este este hombre por detras?. Recordemos que el CEO de SoftBank Group es Masayoshi Son. Es una figura prominente en el mundo de la tecnología y las inversiones, conocido por su visión audaz y su papel en el crecimiento de empresas como Alibaba y otras startups tecnológicas a través del SoftBank Vision Fund y por ahi se intuye el link entre Alibaba y Deepseek.

Sin embargo, no hay mucha información pública detallada sobre Jun Zhang o la estructura exacta de la empresa. Si deseas más detalles, te recomendaría consultar fuentes oficiales o noticias recientes sobre DeepSeek, pero como digo, todavia no hay mucha, porque aunque es una empresa fundada en 2020, no es hasta hace un par de semanas que empezo a darse a conocer, precisamente por quedarse con casi un 25% de uno de los datacenters de Alibaba Group, que por si alguien no lo sabe es Aliexpress, Miravia y unos cuantos mas….

4. Repercusiones globales

Democratización de la IA: El enfoque de DeepSeek en el código abierto y los bajos costos podría acelerar la adopción de la IA en sectores y regiones que antes no podían permitirse estas tecnologías.

Respuesta de Occidente: Empresas como OpenAI, Meta y Google están ajustando sus estrategias para competir con el modelo de bajo costo y alta eficiencia de DeepSeek. Por ejemplo, Meta planea lanzar Llama 4, mientras que OpenAI ha reducido los costos de acceso a sus modelos avanzados.

Conclusión técnica

DeepSeek ha demostrado que es posible desarrollar modelos de IA de alto rendimiento sin depender de hardware extremadamente avanzado, gracias a innovaciones en software y optimización. Esto no solo redefine las reglas del juego en términos de costos y accesibilidad, sino que también plantea desafíos estratégicos para las empresas occidentales y sus modelos de negocio basados en infraestructuras costosas. La irrupción de DeepSeek marca un punto de inflexión en la carrera global por el dominio de la inteligencia artificial.

 

Pues creo que esto es todo…. tela…

@Angeloso69, ayudado de muchas IAs, locales y en la nube, y creo que aun asi me quedo corto. He tardado en hacer este articulo unas 3 horas, si lo hubiera tenido que hacer a mano, sin la ayuda con las IA como los hacia antes, hubiera tardado perfectamente 8 horas, o mas.

Deja un comentario