El umbral que cruzamos sin darnos cuenta
Hace dos años, hacer cualquier cosa medianamente compleja con un modelo de lenguaje requería paciencia, criterio técnico y una tolerancia alta a la frustración. Había que armar prompts largos, manejar limitaciones de contexto, encadenar llamadas a mano, lidiar con alucinaciones que arruinaban el output justo cuando creías que ibas a llegar.
Hoy le doy a un agente un objetivo, le abro acceso a mis archivos, y me devuelve algo razonable. La distancia entre esos dos puntos no es magia ni hype — son varios cambios técnicos concretos que ocurrieron en paralelo y se potenciaron entre sí.
Estos son los que más impacto tuvieron, en mi experiencia.
1. La ventana de contexto se hizo enorme.
A principios de 2024, los modelos top trabajaban con 8.000 a 32.000 tokens de contexto. Suena a mucho, pero un PDF largo o un repo de código mediano lo desbordaban. Había que partir documentos, resumirlos, perder detalle.
Hoy los frontier models manejan 200.000, 1.000.000 o más tokens. Un libro entero entra. Un repositorio chico entra. Una semana de mails entra. Eso elimina toda una clase de problemas — particionar, resumir, rearmar — que antes consumía la mitad del tiempo de cualquier proyecto serio.
2. Los modelos pasaron de responder a actuar.
El cambio más grande no es que respondan mejor. Es que dejan de ser puramente conversacionales y empiezan a ejecutar. Claude Code abre archivos, edita código, corre comandos. Cowork agenda eventos, manda mails, organiza carpetas.
Antes, la IA me daba un texto y yo lo aplicaba. Ahora la IA aplica y yo superviso. La cuenta de tiempo cambia por completo.
3. Los costos cayeron mientras la calidad subió.
A inicios de 2024, una llamada a un modelo top costaba aproximadamente diez veces lo que cuesta hoy un modelo equivalente. Y los modelos chicos de hoy son mejores que los modelos grandes de hace dieciocho meses.
Eso habilita usos que antes no cerraban económicamente: agentes que corren todo el día, procesos que iteran cien veces antes de entregar, pipelines que pasan cada documento por varios pasos. Cuando el costo por llamada baja un orden de magnitud, hay arquitecturas enteras que dejan de ser teóricas.
4. Los protocolos abiertos conectaron todo.
MCP (Model Context Protocol) y los estándares similares hicieron que cualquier modelo pueda hablar con cualquier herramienta sin código a medida. Antes, conectar Claude a Gmail era un proyecto. Hoy es un comando.
Ese estándar liberó un ecosistema. Cada semana aparecen MCPs nuevos para sistemas que ya usábamos. La parte aburrida — la integración — dejó de ser cuello de botella.
5. Las skills y plugins maduraron.
Hace seis meses, “instalar una skill” era una idea técnica. Hoy hay marketplaces, repos oficiales, comunidades activas. Las skills más usadas tienen mantenimiento y mejoran solas en cada release.
Ya no tengo que enseñarle al modelo cómo manejar un PDF. Le instalo la skill pdf y listo. La capacidad técnica viene empacada.
6. Los modelos chicos son confiables para tareas chicas.
Haiku, modelos de la misma escala de otros labs, funcionan para tareas simples sin gastar el presupuesto de los modelos grandes. Eso me deja usar el modelo correcto para cada tarea — el grande para lo difícil, el chico para lo masivo. La cuenta total baja sin perder calidad donde importa.
7. La interfaz dejó de ser solo el chat.
Editor (Cursor, Claude Code en VS Code), terminal (CLI), browser, mobile, voz. El mismo modelo, accesible desde donde estoy. Antes había que ir al chat. Hoy el modelo viene al lugar donde trabajo.
El efecto compuesto.
Cada uno de estos cambios, por separado, es una mejora. Juntos, son otra cosa.
Lo que hace dos años requería un proyecto de varias semanas — armar un agente que leyera mis documentos, los procesara, ejecutara acciones, me reportara — hoy lo armo en una tarde. Y funciona. No perfecto, pero funciona.
Esa es la diferencia que sentí en mi propia práctica: dejé de pelear con la herramienta y empecé a usarla para resolver problemas reales.
Lo que me llevo.
Cuando alguien me pregunta por qué ahora y no hace dos años, la respuesta corta es: porque la suma de cambios técnicos pasó un umbral. Cada pieza por separado no movía la aguja. La combinación sí.
Y la cadencia no para. Cuando termine de escribir esto, ya hay algo nuevo que va a cambiar la cuenta otra vez. La regla que me sigo dando es: probar las cosas con un caso real, no con un benchmark. Lo que cambia mi trabajo lo veo en mi trabajo, no en los gráficos.
Comentarios