Volver ao blog

Como iterar nos prompts de IA: un sistema sinxelo de probas

Deixa de adiviñar por que fallan os teus prompts. Un ciclo de 4 pasos para probar e mellorar prompts que de verdade dá mellores resultados.

Como iterar nos prompts de IA: un sistema sinxelo de probas
Escribiches un prompt. A saída foi incorrecta. Así que o reescribiches. Seguía mal, pero mal doutro xeito. Modificaches algunhas palabras, xeraches de novo, conseguiches algo máis preto — e logo perdiches a pista do que cambiaras. Trinta minutos despois, volves estar onde empezaches, sen saber que versión era realmente a mellor.
Este enfoque de "xerar de novo e cruzar os dedos" é como a maioría da xente usa a IA. E é por iso que a maioría segue frustrada. Segundo unha investigación de Workday, arredor do 37% do tempo que os empregados aforran usando IA pérdese en repeticións — corrixindo erros, verificando saídas e reescribindo contido que non deu no albo.
A diferenza entre os retoques aleatorios e a iteración sistemática non está no esforzo — está no método. Cando probas, avalías e documentas os teus cambios, deixas de repetir os mesmos erros. Aprendes o que de verdade funciona para o teu caso de uso. E constrúes prompts que producen bos resultados de xeito fiable, en vez de tropezar con eles de cando en vez.

Por que os retoques aleatorios non funcionan

Hai unha razón pola que iterar prompts se sente como xogar á lotaría. Cando cambias tres cousas á vez e a saída mellora, non sabes cal foi o cambio que axudou. Cando reescribes de memoria en vez de comparar versións, non podes detectar patróns. Cando borras os intentos antigos, perdes os datos que che dirían o que funciona.
Unha investigación de MIT Sloan descubriu que só a metade das melloras de rendemento dos modelos de IA avanzados veñen do propio modelo. A outra metade vén de como os usuarios adaptan os seus prompts. Noutras palabras, a túa habilidade ao escribir prompts importa tanto coma as capacidades da IA.
Pero a habilidade non é maxia. É recoñecemento de patróns construído a base de práctica estruturada. Tes que ver que cambios producen que resultados — o que significa que necesitas un sistema.

O ciclo de iteración en 4 pasos

Unha iteración eficaz dos prompts segue un bucle sinxelo:
  1. Probar — Executa o teu prompt e captura a saída completa
  2. Avaliar — Compara o resultado co teu obxectivo concreto
  3. Refinar — Fai un cambio puntual baseado no que está mal
  4. Documentar — Anota o que cambiaches e o que pasou
Non é complicado. Pero facer os catro pasos — sobre todo o último — é o que separa á xente que mellora de xeito constante da que segue loitando cos mesmos problemas.
Diagrama circular que mostra os catro pasos da iteración de prompts: Probar, Avaliar, Refinar, Documentar
Diagrama circular que mostra os catro pasos da iteración de prompts: Probar, Avaliar, Refinar, Documentar

Paso 1: Executa o teu prompt e captúrao todo

Comeza co prompt que teñas. Non lle deas demasiadas voltas á primeira versión — vala mellorar de todos os xeitos. O obxectivo é ter unha base de partida coa que poidas comparar.
Cando executes o prompt, garda tanto o prompt como a resposta completa. Non só as partes boas. Non un resumo. Todo enteiro. Necesitas a imaxe completa para diagnosticar problemas.
Se estás probando en ChatGPT ou Claude, copia toda a conversa nunha nota ou nun documento antes de facer cambios. En canto xeres de novo ou edites, o orixinal desaparece.

Paso 2: Avalía contra o teu obxectivo real

Aquí é onde a maioría da xente se equivoca. Miran a saída e pensan "isto non está moi ben" — e póñense a reescribir de inmediato. Esa insatisfacción vaga non che di que arranxar.
No seu lugar, usa o que eu chamo a Proba do Bolígrafo Vermello. Repasa a saída e marca os problemas concretos:
  • O ton non vai? Onde exactamente?
  • Falta información? Que en concreto?
  • É demasiado longa? Que partes son recheo?
  • Entendeu mal a tarefa? Como?
  • O formato é incorrecto? Cal debería ser?
Apunta a túa avaliación. "Demasiado formal no parágrafo 2, falta a restrición de orzamento, incluíu información irrelevante sobre a historia da empresa." Agora xa sabes exactamente que arranxar.

Paso 3: Fai un cambio de cada vez

Esta é a disciplina máis difícil de manter, e a máis importante. Cando cambias varias cousas á vez, non podes saber cal foi o cambio que funcionou. As investigacións sobre probas A/B mostran de xeito constante que illar unha única variable é fundamental — probar varios cambios á vez fai imposible atribuír os resultados.
Escolle o problema máis importante da túa avaliación e céntrate só nel. Os arranxos máis habituais son:
  • Engadir contexto: Dálle á IA os antecedentes que necesita para entender a túa situación
  • Engadir restricións: Especifica lonxitude, formato, ton ou o que hai que excluír
  • Engadir exemplos: Mostra como é unha boa saída (isto chámase few-shot prompting)
  • Aclarar a tarefa: Reescribe as instrucións vagas para que sexan concretas
  • Asignar un rol: Dille á IA quen ten que ser (ver role prompting)
Fai o teu cambio único, executa o prompt outra vez e compara. Axudou? Creou un problema novo? Saberalo porque só cambiaches unha cousa.

Paso 4: Documenta o que cambiaches

Este paso parece opcional. Non o é. Sen documentación, vas repetir experimentos fallidos, esquecer técnicas que funcionaron e perder os teus mellores prompts no historial de chat.
A documentación non ten que ser elaborada. Un rexistro sinxelo abonda:
  • Versión: v1, v2, v3...
  • Que cambiou: "Engadín restrición de 200 palabras"
  • Resultado: "Saída xa coa lonxitude correcta pero perdeu o ton conversacional"
  • Conservar ou descartar: Conservar a restrición, arranxar o ton no seguinte
Co tempo, este rexistro convértese nun manual persoal. Notarás patróns — quizais engadir exemplos sempre axuda nas túas tarefas de redacción, ou quizais especificar o formato pronto produce mellor estrutura. Estas leccións suman.
Se estás iterando prompts que vas reutilizar, unha ferramenta como PromptNest permíteche anexar notas directamente a cada prompt. Podes rexistrar o que probaches, o que funcionou e por que — sen ter que manter un documento aparte.

Exemplo real: iterar un prompt de resumo de reunións

Imos percorrer un ciclo de iteración real. Imaxina que precisas resumir as notas dunha reunión en accións para o teu equipo.
Versión 1:

Resume estas notas de reunión.

{{meeting_notes}}
Resultado: Un resumo xenérico que enterra as accións en parágrafos de contexto. Demasiado longo, e tes que rebuscar para atopar o que de verdade hai que facer.
Avaliación: Falta saída estruturada. Non hai accións claras. Inclúe un repaso innecesario.
Cambio: Engadir restricións de formato.
Versión 2:

Extrae as accións destas notas de reunión. Dálles formato de lista con viñetas, co nome do responsable entre corchetes despois de cada elemento.

{{meeting_notes}}
Resultado: Lista limpa con viñetas das accións cos seus responsables. Pero algúns elementos son vagos ("facer seguimento do que comentamos") e faltan as datas límite.
Avaliación: Bo formato, pero os elementos non son específicos e fáltalles temporalización.
Cambio: Engadir requisitos de especificidade e datas límite.
Comparación antes e despois mostrando un prompt vago transformado nun prompt específico e estruturado
Comparación antes e despois mostrando un prompt vago transformado nun prompt específico e estruturado
Versión 3:

Extrae as accións destas notas de reunión.

Para cada acción, inclúe:
- Que hai que facer en concreto (sen referencias vagas)
- Quen é o responsable [entre corchetes]
- Data límite se se menciona, ou "Sen data límite especificada"

Se unha acción non está clara nas notas, márcaa con "[NECESITA ACLARACIÓN]" para que poida facer seguimento.

{{meeting_notes}}
Resultado: Accións concretas, responsables claros, datas límite cando están dispoñibles e marcas en todo o que sexa ambiguo. Isto si que é utilizable.
Tres iteracións. Cada unha abordou un problema concreto identificado na avaliación. O prompt final é moitísimo mellor que o primeiro — e sabes exactamente por que.

Cando deixar de iterar

A iteración ten retornos decrecentes. Nalgún momento, estás puíndo algo que xa é suficientemente bo. Estes son sinais de que deberías parar:
A saída cumpre os teus requisitos. Non perfecta — requisitos. Se fai o que necesitas, lánzao.
Os cambios están empeorando as cousas. Ás veces chegas a un máximo local. Se os teus tres últimos cambios degradaron a calidade, volve á túa mellor versión e dálle por terminado.
Estás optimizando para casos límite. Se o prompt funciona o 90% das veces e estás dedicando horas ao 10% restante, valora se ese tempo paga a pena.
O problema é a tarefa, non o prompt. Algunhas tarefas son xenuinamente difíciles para a IA actual. Se xa probaches todos os enfoques razoables, o problema pode ser pedirlle á IA que faga algo que aínda non pode facer de xeito fiable.

Constrúe o teu sistema, non só os teus prompts

O verdadeiro valor da iteración sistemática non é ningún prompt mellorado en concreto. É a habilidade que desenvolves e a biblioteca que constrúes.
Cada prompt sobre o que iteras ensínache algo sobre como responde a IA ás instrucións. Co tempo, empezarás a sacar mellores primeiros borradores porque interiorizaches o que funciona. Recoñecerás de inmediato os patróns de fallo habituais. Terás unha colección de prompts probados que poderás adaptar para tarefas novas.
Esa colección importa. Os mellores enxeñeiros de prompts non parten de cero cada vez — manteñen bibliotecas de prompts probados que poden modificar e reutilizar. Segundo unha enquisa de Rev.com, os usuarios que consideran útiles as suxestións de prompts teñen un 280% máis de probabilidades de obter respostas satisfactorias en menos de dous minutos en comparación cos que non.
Se estás xuntando prompts que paga a pena conservar, PromptNest dálles unha casa como deus manda — organizados por proxecto, buscables e accesibles cunha combinación de teclas desde calquera aplicación. Podes gardar os teus prompts iterados con variables como {{meeting_notes}} xa incorporadas, encher os ocos cando os necesites e saltar o proceso de iteración por completo porque o traballo xa o fixeches.
Empeza co ciclo de 4 pasos no teu próximo prompt. Probar, avaliar, refinar, documentar. Leva un pouco máis de tempo ao principio. Pero cada hora que invistas en iteración é unha hora que aforrarás — moitas veces — cando os teus prompts funcionen de verdade.