Torna al blog

Com iterar els prompts d'IA: un sistema senzill per provar-los

Deixa de jugar a endevinar per què fallen els teus prompts. Un cicle de 4 passos per provar i millorar prompts que sí que dona millors resultats.

Com iterar els prompts d'IA: un sistema senzill per provar-los
Has escrit un prompt. La sortida ha estat incorrecta. L'has reescrit. Encara malament, però d'una altra manera. Has retocat un parell de paraules, has tornat a generar, has aconseguit alguna cosa més propera... i has perdut el fil del que havies canviat. Trenta minuts després, tornes a la casella de sortida sense saber quina versió era millor.
Aquest enfocament de "regenerar i creuar els dits" és com la majoria de la gent fa servir la IA. I per això la majoria de la gent acaba frustrada. Segons un estudi de Workday, aproximadament el 37% del temps que els empleats estalvien amb la IA es perd refent feina: corregint errors, verificant sortides i reescrivint contingut que no fa el pes.
La diferència entre retocar a l'atzar i iterar de manera sistemàtica no és l'esforç: és el mètode. Quan proves, avalues i documentes els canvis, deixes de repetir els mateixos errors. Aprens què funciona realment per al teu cas concret. I crees prompts que donen bons resultats de manera fiable, en lloc de topar-hi de tant en tant per casualitat.

Per què retocar a l'atzar no funciona

Hi ha un motiu pel qual iterar prompts s'assembla tant a apostar. Quan canvies tres coses a la vegada i la sortida millora, no saps quin canvi ha estat útil. Quan reescrius de memòria en lloc de comparar versions, no pots detectar patrons. Quan esborres els intents anteriors, perds les dades que t'haurien dit què funciona.
Una recerca de l'MIT Sloan ha trobat que només la meitat dels guanys de rendiment dels models d'IA avançats venen del model en si. L'altra meitat ve de com els usuaris adapten els seus prompts. Dit d'una altra manera, la teva habilitat amb els prompts importa tant com les capacitats de la IA.
Però l'habilitat no és màgia. És reconeixement de patrons construït a base de pràctica estructurada. Necessites veure quins canvis produeixen quins resultats, i això vol dir que necessites un sistema.

El cicle d'iteració de 4 passos

Una iteració de prompts efectiva segueix un bucle senzill:
  1. Prova — Executa el prompt i guarda la sortida sencera
  2. Avalua — Compara el resultat amb el teu objectiu concret
  3. Refina — Fes un únic canvi orientat segons el que falli
  4. Documenta — Anota què has canviat i què ha passat
No és complicat. Però fer els quatre passos —sobretot l'últim— és el que separa la gent que millora de manera constant de la que continua estavellant-se contra els mateixos problemes.
Diagrama circular que mostra els quatre passos de la iteració de prompts: Prova, Avalua, Refina, Documenta
Diagrama circular que mostra els quatre passos de la iteració de prompts: Prova, Avalua, Refina, Documenta

Pas 1: executa el prompt i captura-ho tot

Comença amb el prompt que tinguis. No t'hi capfiquis amb la primera versió: ja la milloraràs. L'objectiu és tenir una base de referència contra la qual mesurar.
Quan executis el prompt, desa tant el prompt com la resposta sencera. No només els fragments bons. No un resum. Tot. Necessites el quadre complet per diagnosticar problemes.
Si estàs provant a ChatGPT o Claude, copia tot l'intercanvi en una nota o un document abans de fer cap canvi. En el moment que tornes a generar o edites, l'original ja no hi és.

Pas 2: avalua contra l'objectiu real

Aquí és on s'encalla la majoria. Miren la sortida i pensen "això no acaba de quadrar", i comencen a reescriure de seguida. Aquesta insatisfacció difusa no et diu què s'ha d'arreglar.
En lloc d'això, aplica el que jo en dic la prova del bolígraf vermell. Repassa la sortida i marca els problemes concrets:
  • El to no encaixa? On exactament?
  • Falta informació? Quina concretament?
  • És massa llarg? Quines parts són farciment?
  • Ha entès malament la tasca? Com?
  • El format està malament? Quin hauria de ser?
Anota la teva avaluació. "Massa formal al paràgraf 2, falta la restricció de pressupost, ha inclòs informació irrellevant sobre la història de l'empresa." Ara saps exactament què cal arreglar.

Pas 3: fes un sol canvi a la vegada

Aquesta és la disciplina més difícil de mantenir, i la més important. Quan canvies diverses coses alhora, no pots aprendre quin canvi ha funcionat. La recerca sobre proves A/B mostra una vegada i una altra que aïllar una sola variable és clau: provar diversos canvis a la vegada fa impossible atribuir els resultats.
Tria el problema més important de la teva avaluació i ataca només aquest. Solucions habituals:
  • Afegeix context: dona els antecedents que la IA necessita per entendre la teva situació
  • Afegeix restriccions: especifica longitud, format, to o què s'ha d'excloure
  • Afegeix exemples: ensenya com és una bona sortida (això es coneix com a few-shot prompting)
  • Aclareix la tasca: reescriu instruccions vagues perquè siguin concretes
  • Assigna un rol: digues a la IA qui se suposa que és (mira el role prompting)
Fes el teu únic canvi, torna a executar el prompt i compara. Ha ajudat? Ha generat un problema nou? Ho sabràs perquè només has canviat una cosa.

Pas 4: documenta què has canviat

Aquest pas sembla opcional. No ho és. Sense documentació, repetiràs experiments fallits, oblidaràs tècniques que funcionaven i perdràs els teus millors prompts dins l'historial del xat.
La documentació no cal que sigui complicada. Un registre senzill ja serveix:
  • Versió: v1, v2, v3...
  • Què has canviat: "He afegit una restricció de 200 paraules"
  • Resultat: "Ara la sortida té la longitud correcta però ha perdut el to conversacional"
  • Conservar o descartar: conservar la restricció, arreglar el to al següent intent
Amb el temps, aquest registre es converteix en un manual personal. Notaràs patrons: potser afegir exemples sempre t'ajuda amb les tasques d'escriptura, o potser especificar el format des del principi dona millor estructura. Aquestes idees es van acumulant.
Si estàs iterant prompts que faràs servir sovint, una eina com PromptNest et permet adjuntar notes directament a cada prompt. Pots seguir què has provat, què ha funcionat i per què, sense haver de mantenir un document a part.

Exemple real: iterar un prompt per resumir reunions

Anem a recórrer un cicle d'iteració real. Imagina que has de resumir les notes d'una reunió en accions concretes per al teu equip.
Versió 1:

Resumeix aquestes notes de reunió.

{{meeting_notes}}
Resultat: un resum genèric que enterra les accions enmig de paràgrafs de context. Massa llarg, i has d'anar a caçar què cal fer en realitat.
Avaluació: falta una sortida estructurada. No hi ha accions clares. Inclou un repàs innecessari.
Canvi: afegir restriccions de format.
Versió 2:

Extreu les accions a fer d'aquestes notes de reunió. Dona-les com una llista amb pics, amb el nom del responsable entre claudàtors després de cada element.

{{meeting_notes}}
Resultat: una llista neta amb pics d'accions i responsables. Però algunes accions són vagues ("fer seguiment d'allò que vam comentar") i falten dates límit.
Avaluació: bon format, però els elements no són prou específics i no hi ha dates.
Canvi: afegir requisits d'especificitat i de dates límit.
Comparació abans i després que mostra com un prompt vague es transforma en un prompt concret i estructurat
Comparació abans i després que mostra com un prompt vague es transforma en un prompt concret i estructurat
Versió 3:

Extreu les accions a fer d'aquestes notes de reunió.

Per a cada acció, inclou:
- Què cal fer concretament (sense referències vagues)
- Qui n'és responsable [entre claudàtors]
- Data límit si es menciona, o "Sense data límit"

Si alguna acció no queda clara a les notes, marca-la amb "[CAL ACLARIR]" perquè en pugui fer seguiment.

{{meeting_notes}}
Resultat: accions concretes, responsables clars, dates quan n'hi ha, i avisos sobre tot el que sigui ambigu. Això sí que serveix.
Tres iteracions. Cadascuna ha resolt un problema concret identificat a l'avaluació. El prompt final és dràsticament millor que el primer, i saps exactament per què.

Quan parar d'iterar

La iteració té rendiments decreixents. En algun moment, només estàs polint una cosa que ja és prou bona. Aquí tens senyals que indiquen que has de plegar:
La sortida compleix els requisits. Que no sigui perfecta: que compleixi els requisits. Si fa el que necessites, llença-ho.
Els canvis empitjoren les coses. De vegades arribes a un màxim local. Si els tres últims canvis han degradat la qualitat, torna a la millor versió i dona-ho per acabat.
Estàs optimitzant per a casos extrems. Si el prompt funciona el 90% del temps i estàs invertint hores en el 10% restant, val la pena replantejar-se si aquest temps surt a compte.
El problema és la tasca, no el prompt. Hi ha tasques genuïnament difícils per a la IA actual. Si has provat tots els enfocaments raonables, potser el problema és que estàs demanant a la IA una cosa que encara no sap fer de manera fiable.

Construeix el teu sistema, no només els teus prompts

El valor real d'iterar de manera sistemàtica no és cap prompt millorat en concret. És l'habilitat que desenvolupes i la biblioteca que vas construint.
Cada prompt que itera t'ensenya alguna cosa sobre com respon la IA a les instruccions. Amb el temps, començaràs a fer millors primeres versions perquè has interioritzat què funciona. Reconeixeràs els patrons d'error habituals a primera vista. Tindràs una col·lecció de prompts provats que pots adaptar a tasques noves.
Aquesta col·lecció és valuosa. Els millors enginyers de prompts no comencen de zero cada vegada: mantenen biblioteques de prompts provats que poden modificar i reutilitzar. Segons una enquesta de Rev.com, els usuaris que troben útils els suggeriments de prompts tenen un 280% més de probabilitats d'obtenir respostes satisfactòries en menys de dos minuts en comparació amb els que no.
Si estàs acumulant prompts que val la pena conservar, PromptNest els dona una llar com cal: organitzats per projecte, cercables i accessibles amb una drecera de teclat des de qualsevol aplicació. Pots desar els prompts iterats amb variables com ara {{meeting_notes}} ja integrades, omplir els buits quan ho necessitis i saltar-te el procés d'iteració perquè ja vas fer la feina al seu moment.
Comença amb el cicle de 4 passos al pròxim prompt. Prova, avalua, refina, documenta. T'hi caldrà una mica més de temps al principi. Però cada hora que inverteixes a iterar és una hora que t'estalviaràs —moltes vegades multiplicada— quan els teus prompts realment funcionin.