Few-shot vs. zero-shot prompting: mikor melyiket válaszd
Gyakorlati útmutató a megfelelő prompt-megközelítés kiválasztásához – másolható példákkal és egyszerű döntési kerettel.
Bemásolsz egy promptot a ChatGPT-be. Az eredmény… elmegy. De láttad már, hogy mások jóval jobb válaszokat kapnak, ha „példákat” is hozzátesznek a prompthoz. Neked is ezt kellene tenned? Hány példa kell? Egyáltalán számít ez a te konkrét feladatodnál?
Ezek a kérdések folyamatosan felmerülnek, és a szakzsargon sem segít. „Zero-shot”, „few-shot”, „one-shot” – mintha fotós kifejezések lennének, nem pedig gyakorlati útmutatás. Ez a cikk lerántja a leplet a szakszavakról, és világos keretet ad ahhoz, hogyan dönts. Plusz teljes promptokat kapsz, amelyeket bemásolhatsz és kipróbálhatsz.
Mit jelent valójában a zero-shot prompting
A zero-shot prompting azt jelenti, hogy úgy adsz feladatot az MI-nek, hogy közben nem mutatsz neki példát arra, mit szeretnél. Leírod, mire van szükséged, és a modellre bízod, hogy a tanulása alapján kitalálja, hogyan oldja meg.
Íme egy zero-shot prompt egy meeting-összefoglalóhoz:
Foglald össze az alábbi meetingjegyzeteket 3-5 felsorolásban, kiemelve a legfontosabb döntéseket.
Meetingjegyzetek:
{{meeting_notes}}
Ennyi. Semmi „jó” összefoglaló példa, sem mintabemenet vagy mintakimenet. Megbízol abban, hogy a modell tudja, hogyan néz ki egy összefoglaló, és mit jelent a „legfontosabb döntés”. Sok feladatnál ez meglepően jól működik.
Mit jelent valójában a few-shot prompting
A few-shot prompting azt jelenti, hogy 2-5 példát teszel a promptba, amelyek megmutatják azt a mintát, amit követni szeretnél. Lényegében ezt mondod: „így kezeld ezt a feladatot”, mielőtt megadnád magát a feladatot.
Ugyanaz a meetingösszefoglaló, de példákkal:
Foglald össze a meetingjegyzeteket 3-5 felsorolásban, a legfontosabb döntésekre koncentrálva.
1. példa:
Bemenet: „A csapat a Q3-as célokról beszélt. Sarah 15%-os értékesítési célemelést javasolt. Mark nem értett egyet, szerinte 10% reálisabb a jelenlegi pipeline alapján. A csapat szavazott, és 12%-ban állapodott meg. Azt is eldöntötték, hogy a weboldal újratervezését Q4-re halasztják.”
Kimenet:
- 12%-os értékesítési célemelés Q3-ra (kompromisszum a 15% és 10% között)
- Weboldal újratervezése Q4-re halasztva
2. példa:
Bemenet: „Költségvetési áttekintő. A jelenlegi költés 8%-kal túllépi a tervet. A CFO 50%-kal csökkentené az utazási keretet, és 60 napra befagyasztaná az új belépéseket. A CEO mindkét intézkedést azonnali hatállyal jóváhagyta.”
Kimenet:
- Utazási keret 50%-kal csökkentve (azonnali hatállyal)
- 60 napos felvételi stop jóváhagyva
- Reakció a 8%-os költségvetési túllépésre
Most foglald össze ezt:
{{meeting_notes}}
Vedd észre a különbséget. A példák pontosan megmutatják a modellnek, milyen formátumot szeretnél (felsorolásokat zárójeles kontextussal), milyen részletességű legyen, és hogyan kezelje a több döntést. A modell kontextusból megtanulja a preferenciáidat – finomhangolás nélkül.
A legfontosabb különbségek egy pillantással
Így viszonyul a két megközelítés a leglényegesebb szempontok mentén:
Sebesség: A zero-shot gyorsabb. Kevesebb token feldolgozása rövidebb válaszidőt ad.
Költség: A zero-shot olcsóbb. Tokenenként fizetsz, és a példák gyorsan összeadódnak.
Beállítási idő: A zero-shot szinte semmit nem kér. A few-shothoz jó példákat kell találni vagy írni.
Pontosság egyszerű feladatoknál: Nagyjából ugyanolyan. A modern modellek mindkét úton jól kezelik a hétköznapi kéréseket.
Pontosság összetett vagy egyedi feladatoknál: Általában a few-shot nyer. Ha specifikus formátum vagy szakterületi terminológia kell, a példák mérhetően sokat segítenek.
Az átváltás egyértelmű: a zero-shot egyszerűbb és olcsóbb, a few-shot viszont nagyobb kontrollt ad a kimenet fölött. A kérdés az, mikor éri meg ez a többletkontroll.
Mikor működik a legjobban a zero-shot
A zero-shot prompting akkor ragyog, ha a feladatot a modell már „érti” a tanulása alapján. Ide tartoznak:
Általános tudásra épülő kérdések: Magyarázatok, definíciók, ténykérdések. A modell tudja, hogyan néz ki egy jó magyarázat.
Kreatív ötletelés: Ötletek generálása, első vázlatok, lehetőségek listázása. Itt épp a változatosságot akarod, nem egy fix mintához ragaszkodást.
Standard összefoglalás: Cikkek, e-mailek, dokumentumok tömörítése, ha nincs szükség speciális formátumra.
Fordítás: Szöveg átültetése olyan nyelvek között, amelyeken a modellt tanították.
Egyszerű kategorizálás: Tételek besorolása szokványos kategóriákba (pozitív/negatív, sürgős/nem sürgős), ha a kategóriák önmagukért beszélnek.
Hasznos hüvelykujjszabály: ha hétköznapi szavakkal le tudod írni, mit szeretnél, és egy ember példák nélkül is megértené, a zero-shot valószínűleg működni fog.
Folyamatábra a döntési menetről: indulj zero-shottal, értékeld az eredményt, és csak akkor adj példákat, ha szükséges
Mikor éri meg a few-shot a többlettoken
A few-shot prompting akkor hozza a hasznát, ha a kimenetnek olyan mintát kell követnie, amit a modell pusztán utasításokból nem tud kikövetkeztetni:
Egyedi formátum: Ha specifikus szerkezetű kimenetet kérsz – JSON adott mezőkkel, táblázat pontos oszlopokkal, felsorolás meghatározott stílusban. A példák jobban megmutatják a formátumot, mint amit a leírás el tud magyarázni.
A te kategóriáid: Ha ügyféle-maileket sorolsz „számlázási kérdés”, „új funkció igénylése”, „hibajelentés” és „általános érdeklődés” kategóriákba, a példák segítenek a modellnek, hogy pontosan értse a definícióidat.
Márkahang és stílus: Szeretnéd, hogy az MI úgy írjon, mint a céged meglévő tartalmai? Mutass neki 2-3 példát abból a hangból. Az olyan utasítás, hogy „írj profi, de barátságos stílusban”, ködös; a példák konkrétak.
Szakterületi terminológia: Ha az iparágadban olyan zsargon vagy rövidítés él, ami máshol mást jelent, a példák megtanítják a modellnek a kontextusodat.
Határesetek és árnyalatok: Iróniaérzékelés, finom megkülönböztetések, amelyek a zero-shotnál elcsúsznak. Kutatások szerint a few-shot prompting jelentősen javítja az olyan hangulati határesetek kezelését, mint a tagadás vagy a szarkazmus.
Egy tanulmány kimutatta, hogy Twitter-hangulatelemzésnél már 20-50 példával a few-shot prompting megközelítette a 10 000+ példán finomhangolt modellek teljesítményét. Ez a jól megválasztott bemutatópéldák ereje.
Ha azon kapod magad, hogy különböző feladatokhoz egész könyvtárnyi few-shot promptot építesz, egy olyan eszköz, mint a PromptNest, segít elmenteni őket beépített változókkal – például a {{meeting_notes}} helyét –, hogy másoláskor csak a hiányzó részt kelljen kitölteni, és a kész prompt mehet is a vágólapra.
Az „indulj nullával, kapcsolj fel ha kell” munkafolyamat
A gyakorlatias megközelítés, ami időt és tokent is spórol:
1. lépés: kezdj zero-shottal. Írj egy világos promptot arról, mit szeretnél. Légy konkrét a feladattal kapcsolatban, de még ne tegyél bele példákat.
2. lépés: értékeld a kimenetet. Megkapod, amire szükséged van? Ha igen, kész vagy. Ha nem, azonosítsd, mi a baj – a formátum? A hangnem? A hiányzó részletek? Az egész feladatot félreértette?
3. lépés: tegyél hozzá célzott példákat. Készíts 2-3 példát, amely pontosan azt a problémát kezeli, amit a modell elrontott. Ha a formátum stimmelt, mutasd a helyes formátumot. Ha a hangnem nem volt jó, mutasd a kívánt hangnemet.
Azért működik ez a folyamat, mert nem találgatod, kell-e példa – konkrét hiányokra reagálsz. Néha elég a zero-shot promptba beleírni a „gondolkodjunk lépésről lépésre” mondatot, és a logikai tévedések eltűnnek példák nélkül is. Kutatások megerősítik, hogy a zero-shot chain-of-thought gondolkodási feladatokban gyakran felülmúlja a few-shotot.
Hány példa kell valójában?
A kutatások többsége szerint az ideális tartomány 2-5 példa a legtöbb feladatra. Az adatok ezt mutatják:
- Az első 2-3 példa adja a legnagyobb pontosságnövekedést
- A hozam 4-5 példa után meredeken csökken
- Több példa akár ronthatja is a teljesítményt, mert egymásnak ellentmondó mintákat hoz be
- A példák minősége fontosabb, mint a mennyiségük – három kiváló példa veri tíz közepest
Egy fontos felfedezés a sorrendre vonatkozik: vizsgálatok szerint a példák sorrendje is befolyásolja az eredményt, és néha az optimális elrendezés választja el a jó és a gyenge teljesítményt. Ha a few-shot prompted nem hoz eredményt, először próbáld átrendezni a példákat, mielőtt újabbakat adnál hozzá.
Illusztráció arról, ahogyan példakártyák kerülnek a prompthoz, az első néhány után csökkenő hozammal
A legtöbb esetben kezdj 2 példával. Ha a pontosság még nem ott van, ahol szeretnéd, tegyél hozzá egy harmadikat, amely más változatot fed le. Négynél többre ritkán lesz szükséged.
Chain-of-thought: a középút a gondolkodási feladatokra
Van egy harmadik megoldás, amely különösen jól működik matematikai, logikai és többlépéses problémáknál: a chain-of-thought prompting. Bemenet–kimenet példák helyett azt kéred a modelltől, hogy „gondolkodjon lépésről lépésre”.
Egy zero-shot chain-of-thought prompt így néz ki:
Egy boltban 45 alma van. Reggel eladnak 12-t, és kapnak egy újabb 30 darabos szállítmányt. Délután még eladnak 18-at. Hány alma marad zárásra?
Gondolkodjunk végig lépésről lépésre.
Ez az egyszerű mondat – „Gondolkodjunk végig lépésről lépésre” – arra készteti a modellt, hogy mutassa meg a gondolatmenetét, ne csak a választ. Bonyolult gondolkodási feladatoknál ez gyakran jobb, mint a zero-shot vagy a few-shot.
Egy friss kutatás az arXiv-en azt találta, hogy az erős modelleknél, mint a GPT-4 és a Claude, a zero-shot chain-of-thought gyakran felülmúlja a few-shot promptingot a gondolkodási feladatokon. A példák ilyenkor inkább szűkítik a modell gondolkodását, mintsem segítenék.
Akkor használj chain-of-thoughtot, ha:
A feladat több logikai lépést igényel
Szeretnéd, hogy a modell elmagyarázza a gondolatmenetét (jól jön a hibák kiszűréséhez)
Matematikai, programozási logikai vagy elemzési problémáról van szó
Nem csak a választ akarod ellenőrizni, hanem a megközelítést is
Teljes promptpéldák, amelyeket lemásolhatsz
Nézzük a három megközelítést egymás mellett valódi feladatokon. Minden prompt GPT-4 és Claude alatt tesztelve, használatra kész.
1. feladat: e-mail-hangnem osztályozása
Zero-shot változat:
Osztályozd a következő ügyféle-mail hangnemét: frusztrált, elégedett, semleges vagy sürgős.
E-mail:
{{email_text}}
Hangnem:
Few-shot változat (jobb a határesetekre):
Osztályozd az ügyféle-mail hangnemét: frusztrált, elégedett, semleges vagy sürgős.
E-mail: „Már 3 hete várok a rendelésemre. Ez nevetséges. AZONNAL kérem a pénzem vissza.”
Hangnem: frusztrált
E-mail: „Csak szerettem volna megköszönni – a termék előbb megérkezett, és remekül működik!”
Hangnem: elégedett
E-mail: „Üdv, meg tudná erősíteni, hogy a rendelésem elment? Rendelésszám: #12345.”
Hangnem: semleges
E-mail: „Leállt a rendszerünk, és MA kell a cserealkatrész, különben elveszítjük a szerződést.”
Hangnem: sürgős
E-mail: {{email_text}}
Hangnem:
A few-shot változat segít a modellnek megérteni a saját definícióidat. A „sürgős” és a „frusztrált” közti határ tud bizonytalan lenni – a példák megrajzolják ezt a határt.
2. feladat: termékleírás újraírása
Zero-shot változat:
Írd át ezt a termékleírást úgy, hogy figyelemfelkeltőbb és előnyközpontú legyen. Tartsd 100 szó alatt.
Eredeti: {{product_description}}
Új változat:
Few-shot változat (jobb a következetes márkahanghoz):
Írd át a termékleírásokat figyelemfelkeltővé és előnyközpontúvá. Kövesd ezt a stílust:
Eredeti: „Rozsdamentes acél kulacs. 700 ml-es űrtartalom. 24 órán át hidegen tartja az italt.”
Új változat: „Maradj hidratált egész nap a letisztult, 700 ml-es acél kulacsunkkal. A reggeli kávéd forrón érkezik az irodába. A délutáni vized jéghideg marad az edzőteremben. Egy kulacs, végtelen lehetőségek.”
Eredeti: „Vezeték nélküli fülhallgató. 8 órás akkumulátor. Zajszűréssel.”
Új változat: „Nyolc óra a kedvenc podcastjaiddal, megszakítás nélkül. A vezeték nélküli fülhallgatónk kiszűri a zajt, hogy arra koncentrálhass, ami fontos – legyen az mély munka, edzéslista vagy az a hangoskönyv, amit végre be akarsz fejezni.”
Eredeti: {{product_description}}
Új változat:
A few-shot változat egy konkrét szövegírói stílust tanít be – előnyvezérelt, beszélgetős, konkrét helyzetekkel. A zero-shot kapsz egy átírást, de nem feltétlenül a te hangodon.
3. feladat: hibajegy strukturálása
Zero-shot változat:
Alakítsd át ezt a hibajegyet strukturált formátumba az alábbi részekkel: Összegzés, Reprodukálás lépései, Várt viselkedés, Tényleges viselkedés.
Hibajegy: {{bug_report}}
Few-shot változat (jobb a következetes formázáshoz):
Alakítsd át a hibajegyeket strukturált formátumba.
Bemenet: „Az alkalmazás összeomlik, amikor PDF-et akarok feltölteni. A dashboardon voltam, rákattintottam a feltöltésre, kiválasztottam egy 5 MB-os PDF-et, és egyszerűen bezárult. Meg kellene jelennie a fájlnak a feltöltések között, de helyette az egész app meghal.”
Kimenet:
**Összegzés:** Az alkalmazás összeomlik PDF-feltöltéskor
**Reprodukálás lépései:**
1. Lépj a dashboardra
2. Kattints a feltöltés gombra
3. Válassz egy PDF-fájlt (5 MB-os fájllal tesztelve)
**Várt viselkedés:** A fájl megjelenik a feltöltések között
**Tényleges viselkedés:** Az alkalmazás váratlanul összeomlik vagy bezárul
---
Bemenet: {{bug_report}}
Kimenet:
A technikai dokumentációnál a következetesség számít. A few-shot változat biztosítja, hogy minden hibajegy ugyanazt a szerkezetet és részletességet kövesse.
Gyors döntési keret
Amikor egy új feladattal nézel szembe, fuss végig ezeken a kérdéseken:
1. Egyszerű, jól körülhatárolt a feladat? → Kezdj zero-shottal
2. Speciális formátum kell, amit a modell nem feltétlenül talál ki? → Few-shot
3. Többlépéses gondolkodás kell hozzá? → Először zero-shot chain-of-thought
4. Következetes márkahang vagy szakterületi terminológia kell? → Few-shot, példákkal abban a hangban
5. A zero-shot megadja a 80%-át annak, amire szükséged van? → Maradj nála. A tökéletességért nem éri meg háromszoros tokenköltséget fizetni.
Nem az a cél, hogy a legmenőbb technikát használd – hanem hogy hatékonyan kapj jó eredményt. A zero-shot az alap. Csak akkor bonyolítsd, ha a egyszerűbb megoldás kevés.
Hogyan vidd át a gyakorlatba
A legjobb módszer, hogy ez beépüljön: kísérletezz. Vegyél egy feladatot, amit rendszeresen csinálsz – jelentések összefoglalása, e-mailek megfogalmazása, visszajelzések kategorizálása –, és próbáld ki mindkét megközelítést. Figyeld meg, hol kevés a zero-shot. Figyeld meg, hol hoz valódi különbséget a few-shot.
Ha találsz olyan promptot, ami működik, mentsd el oda, ahol később is meg fogod találni. Ha gyűjteményt építesz példákkal és változókkal teli promptokból, a PromptNest egy natív Mac-alkalmazás ($19.99 egyszeri ár a Mac App Store-ban, nincs előfizetés, nincs fiók, helyben fut), amely rendszerezi és kereshetővé teszi őket, és billentyűparanccsal bármelyik appból elérhetővé teszi. Soha többé nem kell szétszórt jegyzetekben vadászni arra a tökéletes few-shot promptra, amit három héttel ezelőtt írtál.
Indulj egyszerűen. Bonyolíts, ha kell. Mentsd el, ami működik. Ennyi a stratégia.