Escucha todo el país

Entre Mates y Otras Yerbas

Lun. a Vie. | 00 hs

Miguel Cabrera

Hermandad de la Fe

Lun. a Vie. | 3 hs

Punto de Equilibrio

Lun. a Vie. | 5 hs

Juan Dellapiazza y Ruben Silvera

Informativo Carve

Lun. a Vie. | 6 hs

Nicolás Lussich, Miguel Nogueira y Patricia Martín

Así nos va

Lun. a Vie. | 9 hs

Patricia Madrid

Valor Agregado

Lun. a Vie. | 11 hs

Martín Olaverry

Informativo Carve

Lun. a Vie. | 13 hs

Alejandro Acle y Juan Andrés Elhordoy

Todo un País

Lun. a Vie. | 15 hs

José Temperán

Informativo Carve

Lun. a Vie. | 17 hs

Alejandro Acle y Juan Andrés Elhordoy

Punto de Equilibrio

Lun. a Vie. | 18 hs

Juan Dellapiazza y Ruben Silvera

Subrayado

Lun. a Vie. | 19 hs

Simultáneo con Canal 10

Con Buen Gusto

Lun. a Vie. | 21 hs

Roberto Spoturno

Entre Mates y Guitarras

Lun. a Vie. | 21:30 hs

Eduardo Monteverde

Nuestro Canto

Lun. a Vie. | 22:30 hs

Gustavo Arias

Inteligencia Artificial: China patea el tablero | La columna de Mauro Ríos

Inteligencia Artificial: China patea el tablero | La columna de Mauro Ríos

Hace apenas una semana escribía y hablaba de los costos de la IA, el consumo de energía monumental que se requiere, por ejemplo, que en 2007 se estaba estimando que el consumo de energía en una hora de todos los centros de datos de IA alrededor del mundo consumirían lo mismo que el alimentar a casi 50.000 hogares o que hoy 1 sola tarea de proceso de ChatGPT o1 consume lo mismo que 5 autos con sus tanques llenos hasta agotarlos, y sabemos los billones de tareas por segundo que puede realizar esta y otras IA.

Y hace aproximadamente un mes, estaba hablando de que los modelos de IA estaban mejorando solamente en base a lo conocido, es decir, los grandes laboratorios de IA evolucionaban los modelos de lenguaje, optimización de tratamiento de fuentes de datos e información y mejoras a los algoritmos, con ello se habían alcanzado cifras increíbles en diferentes IA de actores como Google o Meta, no obstante predecía que la IA no continuaría avanzando sin que apareciera algo nuevo, una nueva disrupción, un nuevo descubrimiento, realmente un nuevo modelo, etc.

Aquel “invierno de la IA” que muchos predecíamos en el contexto antes descrito y que comenzará este 2025, es decir manteniendo un crecimiento y uso, pero sin novedades mayores, ahora parece que podría sólo afectar a ciertas latitudes y lamentablemente occidente parece ser la elegida, esto siempre y cuando no sigan surgiendo novedades. La industria de la IA es un gran tablero de ajedrez y poco o nada podemos predecir ciertamente.

A todo esto, China pateó el tablero, mas bien diría que sopló sobre un castillo de naipes que se derrumbó por completo. Especulaciones y conspiraciones ahora están a la orden, pero sólo podemos suponer y en esto de la IA, el suponer nunca es buena consejera.

Vamos a lo que poco o mucho sabemos a ciencia cierta y me permitiré algunas conclusiones que perfectamente podrán pasar de acertadas o ridículas en cuestión de horas. Es más, con temor escribo estas líneas a sabiendas que la dinámica de las noticias podría convertir en “viejas” mis palabras en minutos.

La startup DeepSeek, nacida como laboratorio de IA de la empresa china High-Flyer, lanzó su modelo homónimo versión R1-32B, el R1-70B y el V3 (con 671 billones de parámetros). Su fundador, Liang Wenfeng, está más interesado en la investigación que en el lucro, según ha explicado, y para ello comenzó por contratar un equipo joven de expertos recién salidos de las universidades chinas.

Con las restricciones de importación de tecnología de los EEUU, DeepSeek enfrentó el desafío de ser autosuficiente y apoyada con desarrollos locales, aunque esto no es del todo cierto, ya avanzaremos en este punto.

Este lanzamiento ha cambiado la historia de la IA, su desarrollo y evolución, tanto le ha dolido a occidente que ya ha sido objeto de feroces ciberataques y DeepSeek advierte que puede haber demoras en los servicios. Incluso en las redes sociales pueden verse publicaciones de expertos técnicos que advierten que DeepSeek recopila la dirección IP de los usuarios, patrones de pulsaciones de teclas, información del dispositivo, etc., y los almacena en servidores de China, donde todos esos datos son vulnerables a requisición arbitraria por parte del Estado. Esto se fundamenta en capturas de pantalla de la propia política de privacidad de DeepSeek, sin embargo, la empresa ha negado todas estas acusaciones sobre violentar la privacidad de los usuarios.

Wall Street se vio sacudida por la aparición de DeepSeek, el mayor perderos es Nvidia, que perdió en UN día más de US$ 600.000 millones, para hacernos una clara idea del impacto, es como si Bank of America y Coca-Cola Company desaparecieran. Esta es la mayor caída de valoración de la historia de la bolsa de New York, según hacen saber los especialistas.

Nota: Tomemos dimensión del golpe, valor de mercado de Mastercard: US$ 502.000 mill, ExxonMobil: US$ 484.000 mill, Bank of America: US$ 355.000 mill, Coca-Cola: US$ 275.000 mill.

Nvidia había pasado de tener ingresos anuales en 2014 por unos US$ 5.000 mill. a ganar casi US$ 61.000 mill. en 2024. Y los beneficios anuales pasaron en 2014 de US$ 1.000 mill. a US$ 30.000 mill. en 2024.

Se sabe que Nvidia tiene una ganancia cercana el 90% sobre la fabricación de sus chips. Las GPU H100 de Nvidia, son chips de aproximadamente US$ 30.000 que alimentan los productos de IA generativa. Sus mayores compradores son Microsoft y Meta, ambas gastan unos US$ 4.000 mill. cada año. Seguramente hoy se estarán arrepintiendo de estas compras, o no.

La capitalización de mercado de los agentes de IA se ha desplomado más de US$ 2.500 mill, pasando de US$ 12.900 mill. a poco más de US$ 10.200 mill, según datos de Cookie.fun.

Algunas personas piensan que DeepSeek no es tan significativo como se dice y que en Wall Street nada ocurre al azar. Según los hechos, parece que la importancia de la situación es tal como se describe. Sin embargo, algunos analistas consideran posible que Nvidia esté a punto de lanzar un producto innovador que podría recuperar su capitalización, interpretando esta caída como una oportunidad para eliminar a los inversores menos sólidos del mercado.

Considerando que es la mayor caída de bolsa de la historia, que Nvidia ya presentó sus novedades en diferentes ferias TIC recientemente, estas suposiciones carecen de lógica. Pero el debate en esta perspectiva también está abierto.

En otra cara de la moneda, el gobierno Chino recientemente anunció una inversión de más de US$ 140 billones en investigación y desarrollo de la IA, esta noticia de por sí podría suponer que ni el gobierno chino estaba al tanto de toda la disrupción de DeepSeek respecto a la eficiencia de recursos y economías alcanzadas.

En redes sociales también se citan como sospechosas ventas y compras de acciones de Nvidia por parte de algunas personalidades o políticos, por ejemplo, Nancy Pelosi vendió acciones de Nvidia por valor de US$ 1.300 millones hace apenas unas semanas.

 

Que es lo diferente que ofrece esta IA:

Juventud: Se desarrolló en poco tiempo, relativo a lo que han demorado otros competidores occidentales. Además de haber sido desarrollado por jóvenes recién salidos de las universidades y no por eminencias de la IA que hace décadas vienen trabajando en esta tecnología.

Abierto: Es de código abierto, es decir que la comunidad mundial puede tomar el desarrollo de esta IA y cambiarlo, mejorarlo, etc. Claro que hablamos del modelo, no de los datos de entrenamiento. Esto representa un problema enorme para la sostenibilidad de sus competidores ya que le pega en el corazón del modelo de negocios, y hablamos de un modelo que negocio que hasta ahora no ha dado ganancias. Y las inversiones previstas para este 2025 habla de cifras ridículamente enormes por parte de Meta, Microsoft, Google, etc. El modelo se publico bajo licencia Open del Massachusetts Institute of Technology, el famosos MIT.

Costo y Ganancias: Los costos de suscripción son una fracción de sus competidores, por ejemplo, un trabajo de investigación que con ChatGPT podría suponer unos US$ 400 de gastos, con DeepSeek significaría apenas US$ 10. DeepSeek cobra solo US$ 0,014 centavos por millón de tokens de entrada, lo que socava significativamente el modelo de negocios de OpenAI ya que GPT-4 cuesta US$ 15 por millón de tokens de entrada. Entrenar a DeepSeek costó US$ 6 Millones, una cifra irrisoria frente a, por ejemplo, los US$ 60 Millones que invirtió Meta en Llama. Pero si esto es increíble, más lo es que se construyó en 60 días y su mantenimiento es 98% más bajo que sus competidores.

Superación: DeepSeek ha podido superar a todos los modelos de IA en la mayoría de las pruebas de cálculos y problemas. (puede verse un cuadro comparativo en la web de la empresa).

Eficiencia: Este modelo supone un nuevo paradigma en el uso de recursos ya que utiliza una pequeña parte de sus competidores y aun así es eficiente. DeepSeek necesitó sólo la décima parte de recursos para entrenamiento de lo que utilizó Llama 3.1 de Meta. (Según pruebas del Instituto Epoch AI de California). Según la publicación Nature, el modelo de DeepSeek alcanza una precisión del 97% en la resolución de problemas matemáticos evaluados con el parámetro +500. Pero la empresa fue más allá incorporando al modelo lo que denominaron “arquitectura de mezcla de expertos”, esto le permite a DeepSeek determinar por si sola qué redes de procesamiento se debe activar para cada tarea especifica. Esto significa sencillamente máxima eficiencia, baja de consumo de recursos y por supuesto mayor velocidad de resolución. Desde una mirada experta esta innovación agregó “estrategia” en el funcionamiento de la IA, estrategia que ella misma puede elegir y trazar, esto es sin dudas un antes y un después en la industria.

Nuevo diseño: DeepSeek procesa las solicitudes a través de lo que la empresa ha denominado “cadenas de pensamientos”, un modelo neuronal, que, según dicen los expertos, imita mucho mejor que otros modelos, la manera como el cerebro humano piensa o razona (aunque DeepSeek sigue sin pensar, solo imita).

Entrenamiento y acción: Esta IA ha sido entrenada, por supuesto con billones de datos, pero utilizando un modelo denominado de reforzamiento, esto es que se le da recompensas (premios) a la IA cuando se obtienen buenos resultados, pero aquí viene otra novedad, también se lo recompensa cuando explica cómo ha llegado a una conclusión o respuesta. Esto es absolutamente novedoso, ya que al interactuar con DeepSeek puedes ver el “razonamiento” o las cadenas de pensamiento utilizadas para llegar a la respuesta.

Instalación local: Es posible instalarlo en nuestras computadoras, visitando el sitio web Ollama.com podemos descargar los modelos DeepSeek de 1.5 billones de parámetros hasta el mas potente de 671 billones de parámetros y pesará unos 404 Gb. Por supuesto, todos los modelos son Open del MIT. Los modelos se utilizarán desde la consola, para usarlos desde una interfase web deberemos descargar la extensión “Page Assist – A Web UI for Local AI Models” (https://t.ly/Wb1CM) desde la Chrome Web Store para el navegador Chrome o Edge. (hay otras opciones, basta investigar en Internet).

 

DeepSeek redefine el paradigma que asocia la evolución de la IA con una inversión masiva y un aumento significativo en el consumo energético. Este avance abre un nuevo campo de investigación, ya que la eficiencia de DeepSeek ha generado un impacto considerable en las estrategias de grandes empresas de IA y del sector energético. Estas industrias habían comenzado a invertir en preparativos para una competencia por captar más clientes de IA y aumentar exponencialmente la producción de energía para sostener los grandes centros de datos de inteligencia artificial.

La industria energética mundial está en shock, tanto como la propia de IA y el efecto en la economía no se hará esperar.

El nuevo modelo de IA, tanto en su desarrollo, entrenamiento e inversión necesaria, redefine el juego, permitiendo que ya no sólo el acceso al uso, sino la posibilidad cierta de que mas usuarios, la academia, empresas y gobiernos posean su propia IA. La carrera en la industria de la IA cambia radicalmente, competidores como OpenAI, Microsoft, Meta, encontrarán ahora mas resistencia para adoptar sus productos y surgirán nuevos jugadores, por lo que el liderazgo está en jaque, ya no estará tan claro que habrá un líder en la industria, sino un conjunto muy próximo uno de otros de jugadores de diferentes sectores, y ya no solo del poderoso sector TIC privado, esto abre posibilidades para universidades, laboratorios, centros pequeños de investigación y por último, abre un mundo nuevo de aplicación de la IA en mas y mejores productos y servicios accesibles al público en general.

No obstante, lo bueno de las noticias y augurios, algunos analistas no están tan preocupados por la supremacía occidental, advierten que DeepSeek R1 esta basado en los modelos Llama y Qwen, por lo que sin las inversiones y desarrollos de Meta y otros jugadores occidentales en IA, DeepSeek no podrá seguir avanzando ni mejorando su modelo. Además de que, al ser un modelo abierto, Meta, Microsoft, Google, y otros, pueden aprovechar las innovaciones de DeepSeek para sus propios modelos. Estas afirmaciones tienen su cuota de verdad, pero por el momento, DeepSeek ha roto el molde del negocio y la industria de la IA y resta por saber cuanto tiempo le tomará recuperarse.

A pesar de los debates y las observaciones, incluso de miradas pesimistas sobre la maravilla de DeepSeek, podemos decir que, si OpenAI rompió el molde haciendo posible que el mundo entero utilizara IA, DeepSeek es la cereza del pastel.

Discusiones como la privacidad, seguridad y las cuestiones geopolíticas y armamentistas estarán sobre la mesa por mucho tiempo, pero el mercado y el usuario tienen la última palabra, difícil prever que nos deparan los próximos años, disculpen, las próximas horas.

Mauro D. Ríos