O model flash é online ou roda direto na máquina?
Uso muito o claude pra programar com lua pra um programa muito específico, ele é muito conciso, mas o maior problema é que realmente gasta muito rápido os tokens para atividades mais pesadas...
Mas, nesse sentido, o "token infinito" é pela forma como você faz o envio dos docs e ela consegue filtrar bem o que processar, né? Não é literalmente fazer varias requisições e mesmo assim nunca acaber com os tokens.