Tagasi blogisse

Few-shot vs. zero-shot promptimine: millal kumbagi kasutada

Praktiline juhend õige promptimisviisi valimiseks koos kopeeritavate näidetega ja lihtsa otsustusraamistikuga.

Few-shot vs. zero-shot promptimine: millal kumbagi kasutada
Kleebid prompti ChatGPT-sse. Tulemus on... korras. Kuid oled näinud, kuidas inimesed saavad oluliselt paremaid tulemusi, lisades oma promptidesse "näiteid". Kas peaksid sedasama tegema? Kui palju näiteid? Kas see üldse omab tähtsust just sinu ülesande puhul?
Need küsimused tulevad pidevalt ette ja terminoloogia ei aita kaasa. "Zero-shot", "few-shot", "one-shot" — need kõlavad pigem fototehnika kui praktilise juhendina. See artikkel lõikab läbi žargooni ja annab selge raamistiku, kuidas valida õige lähenemine, ning lisaks terviklikud promptid, mida saad ise kopeerida ja katsetada.

Mida zero-shot promptimine tegelikult tähendab

Zero-shot promptimine tähendab, et annad tehisintellektile ülesande, näitamata talle ühtegi näidet sellest, mida soovid. Kirjeldad, mida vajad, ja mudel mõtleb treeningandmete põhjal välja, kuidas seda teha.
Siin on zero-shot prompt koosoleku kokkuvõtte tegemiseks:

Summarize the following meeting notes into 3-5 bullet points covering the key decisions made.

Meeting notes:
{{meeting_notes}}
Ongi kõik. Mingeid näiteid "hea" kokkuvõtte kohta, ühtegi sisendi-väljundi paari. Usaldad mudelit, et see saab aru, milline näeb välja kokkuvõte ja mida tähendavad "võtmeotsused". Paljude ülesannete puhul töötab see üllatavalt hästi.

Mida few-shot promptimine tegelikult tähendab

Few-shot promptimine tähendab, et lisad oma prompti 2–5 näidet, mis demonstreerivad mustrit, mida soovid mudelilt. Sisuliselt ütled "siin on, kuidas ma soovin, et sa selle ülesandega tegeleksid", enne kui annad päris ülesande.
Siin on sama koosoleku kokkuvõtte ülesanne, kuid juba näidetega:

Summarize meeting notes into 3-5 bullet points covering key decisions.

Example 1:
Input: "Team discussed Q3 targets. Sarah proposed increasing the sales goal by 15%. Mark disagreed, suggested 10% was more realistic given current pipeline. Team voted and agreed on 12%. Also decided to postpone the website redesign until Q4."
Output:
- Agreed on 12% sales goal increase for Q3 (compromise between 15% and 10% proposals)
- Postponed website redesign to Q4

Example 2:
Input: "Budget review meeting. Current spending is 8% over forecast. CFO recommended cutting travel budget by 50% and freezing new hires for 60 days. CEO approved both measures effective immediately."
Output:
- Cut travel budget by 50% (effective immediately)
- 60-day hiring freeze approved
- Response to 8% budget overrun

Now summarize this:
{{meeting_notes}}
Pane tähele erinevust. Näited näitavad mudelile täpselt, millist vormingut soovid (täpploendid koos sulgudes oleva kontekstiga), millisel detailitasemel ja kuidas käsitleda mitut otsust korraga. Mudel õpib sinu eelistused kontekstis selgeks — täppishäälestust pole vaja.

Peamised erinevused ülevaatena

Siin on, kuidas need kaks lähenemist võrdlevad nendes aspektides, mis kõige rohkem loevad:
  • Kiirus: Zero-shot on kiirem. Vähem tokeneid töödelda tähendab kiiremaid vastuseid.
  • Hind: Zero-shot on odavam. Maksad tokenite kaupa ja näited summeeruvad.
  • Seadistamise vaev: Zero-shot ei nõua peaaegu midagi. Few-shot eeldab heade näidete leidmist või loomist.
  • Täpsus lihtsate ülesannete puhul: Umbes sama. Tänapäevased mudelid saavad otsekoheste päringutega kummalgi viisil hästi hakkama.
  • Täpsus keeruliste või kohandatud ülesannete puhul: Few-shot võidab tavaliselt. Kui vajad kindlat vormindust või valdkonna terminoloogiat, teevad näited mõõdetava vahe.
Kompromiss on selge: zero-shot on lihtsam ja odavam, kuid few-shot annab rohkem kontrolli väljundi üle. Küsimus on selles, millal see lisakontroll vaeva väärt on.

Millal zero-shot kõige paremini töötab

Zero-shot promptimine särab siis, kui ülesanne on midagi, mida mudel oma treeningu põhjal juba "mõistab". See hõlmab:
Üldteadmiste küsimused: Selgituste, definitsioonide või faktilise teabe küsimine. Mudel teab, milline näeb välja hea selgitus.

Loominguline ajurünnak: Ideede genereerimine, esimeste mustandite kirjutamine või võimaluste väljapakkumine. Siin tahadki mitmekesisust, mitte ühe kindla mustri järgimist.

Tavaline kokkuvõtte tegemine: Artiklite, e-kirjade või dokumentide kondenseerimine, kui sa konkreetset vormingut ei vaja.

Tõlkimine: Teksti teisendamine keelte vahel, millel mudelit treeniti.

Lihtne klassifitseerimine: Asjade sortimine üldistesse kategooriatesse (positiivne/negatiivne, kiireloomuline/mittekiire), kui kategooriad on iseenesestmõistetavad.
Hea rusikareegel: kui suudad lihtsas keeles kirjeldada, mida soovid, ja inimene saaks sellest näideteta aru, töötab tõenäoliselt ka zero-shot.
Vooskeem otsustusprotsessist: alusta zero-shotiga, hinda tulemusi, lisa näited ainult vajaduse korral
Vooskeem otsustusprotsessist: alusta zero-shotiga, hinda tulemusi, lisa näited ainult vajaduse korral

Millal few-shot väärib lisatokeneid

Few-shot promptimine teenib oma koha välja siis, kui väljund peab järgima mustreid, mida mudel ei suuda ainult juhiste põhjal välja mõelda:
Kohandatud vorming: Kui vajad väljundeid kindlas struktuuris — JSON konkreetsete väljadega, tabelid täpsete veergudega, täpploendid kindlas stiilis. Näited näitavad vormingut paremini, kui kirjeldused seda selgitavad.

Sinu enda klassifitseerimiskategooriad: Kui sorteerid kliendikirju kategooriatesse nagu "arve-küsimus", "funktsiooni-soov", "vea-teade" ja "üldine-pärim", aitab näidete näitamine mudelil sinu definitsioone mõista.

Brändihääle või tooni järgi vastamine: Tahad, et tehisintellekt kirjutaks su firma olemasoleva sisuga sarnaselt? Näita 2–3 näidet sellest häälest. Juhised nagu "kirjuta professionaalse, kuid sõbraliku tooniga" on ähmased; näited on konkreetsed.

Valdkonnaspetsiifiline terminoloogia: Kui su tööstus kasutab žargooni või lühendeid, millel on mujal teine tähendus, õpetavad näited mudelile sinu konteksti.

Erijuhud ja nüansid: Sarkasmi tuvastamine, irooniad või peenelt vihjed, mis zero-shot lähenemistele tihti komistuskiviks saavad. Uuringud näitavad, et few-shot promptimine parandab oluliselt sentimendi erijuhtude nagu eitus ja sarkasm käsitlemist.
Üks uuring leidis, et Twitteri sentimendi klassifitseerimisel jõudis few-shot promptimine vaid 20–50 näitega lähedale 10 000+ näitega täppishäälestatud mudelite tulemuslikkusele. Selline on hästi valitud demonstratsioonide jõud.
Kui leiad end ehitamas erinevate ülesannete jaoks few-shot promptide raamatukogu, aitab selline tööriist nagu PromptNest need salvestada koos sisseehitatud muutujatega nagu {{meeting_notes}} — täida tühjad kohad kopeerimisel ja terviklik prompt on kleepimiseks valmis.

Töövoog "alusta zero-shotiga, lisa midagi vajaduse korral"

Siin on praktiline lähenemine, mis säästab nii aega kui ka tokeneid:
Samm 1: Proovi kõigepealt zero-shotiga. Kirjuta selge prompt, mis kirjeldab, mida soovid. Ole ülesande osas konkreetne, kuid ära veel näiteid lisa.

Samm 2: Hinda väljundit. Kas see annab vajaliku? Kui jah, oledki valmis. Kui ei, tuvasta, mis on valesti — kas vorming? Toon? Puuduvad detailid? Ülesande täielik valesti mõistmine?

Samm 3: Lisa sihitud näited. Loo 2–3 näidet, mis demonstreerivad just seda asja, mille mudel valesti tegi. Kui vorming oli paigast ära, näita õiget vormingut. Kui toon oli vale, näita õiget tooni.
See töövoog on oluline, sest sa ei aima, kas vajad näiteid — sa reageerid tegelikele lünkadele. Mõnikord lahendab "Mõtleme samm-sammult" lisamine zero-shot prompti arutluskäigu probleeme ilma näideteta. Uuringud kinnitavad, et zero-shot mõtteahel edestab arutlusülesannetes sageli few-shoti.

Kui palju näiteid sa tegelikult vajad?

Uuringud osutavad järjekindlalt 2–5 näite kuldsele keskteele enamiku ülesannete puhul. Andmed näitavad järgmist:
- Esimesed 2–3 näidet annavad suurima täpsuse kasvu - Tulu väheneb järsult pärast 4–5 näidet - Rohkem näiteid võib tegelikult tulemuslikkust kahjustada, tuues mängu vastuolulisi mustreid - Näidete kvaliteet loeb rohkem kui kogus — kolm suurepärast näidet edestab kümmet keskpärast
Oluline on ka leid näidete järjekorra kohta: uuringud näitavad, et näidete järjestus mõjutab tulemusi ja optimaalne paigutus on mõnikord hea ja kehva tulemuslikkuse vaheline erinevus. Kui su few-shot prompt ei tööta hästi, proovi enne uute lisamist näiteid ümber järjestada.
Illustratsioon, mis näitab, kuidas näidiskaarte prompti lisatakse, kusjuures pärast esimesi väheneb tulu
Illustratsioon, mis näitab, kuidas näidiskaarte prompti lisatakse, kusjuures pärast esimesi väheneb tulu
Enamiku kasutusjuhtude puhul alusta 2 näitega. Kui täpsus pole sealt, kus vajad, lisa kolmas, mis katab teistsuguse variatsiooni. Harva läheb sul vaja rohkem kui 4.

Mõtteahel: kuldne kesktee arutluseks

Olemas on kolmas variant, mis töötab eriti hästi matemaatika, loogika ja mitmesammuliste ülesannete puhul: mõtteahela (chain-of-thought) promptimine. Sisendi-väljundi näidete näitamise asemel palud mudelil "mõelda samm-sammult".
Zero-shot mõtteahel näeb välja selline:

A store has 45 apples. They sell 12 in the morning and receive a shipment of 30 more. Then they sell 18 in the afternoon. How many apples do they have at closing?

Let's work through this step by step.
See lihtne fraas — "Let's work through this step by step" — käivitab mudeli näitama oma arutluskäiku, mitte kohe vastust välja pakkuma. Keerulise arutluse puhul edestab see sageli nii zero-shot kui ka few-shot lähenemisi.
Hiljutine arXivi uuring leidis, et tugevamate mudelite nagu GPT-4 ja Claude puhul edestab zero-shot mõtteahel arutlusülesannetes sageli few-shot promptimist. Näited võivad mudeli mõtlemist hoopis piirata, mitte aidata.
Kasuta mõtteahelat, kui:
  • Ülesanne nõuab mitut loogilist sammu
  • Vajad, et mudel selgitaks oma arutluskäiku (kasulik vigade tabamiseks)
  • Tegemist on matemaatika, koodiloogika või analüütiliste probleemidega
  • Soovid kontrollida mudeli lähenemist, mitte ainult vastust

Terviklikud promptide näited, mida saad kopeerida

Vaatame kolme lähenemist päris ülesannete peal kõrvuti. Kõik promptid on testitud GPT-4 ja Claude'iga ning kasutamiseks valmis.

Ülesanne 1: e-kirja tooni klassifitseerimine

Zero-shot versioon:

Classify the tone of this customer email as: frustrated, satisfied, neutral, or urgent.

Email:
{{email_text}}

Tone:
Few-shot versioon (parem erijuhtude jaoks):

Classify customer email tone as: frustrated, satisfied, neutral, or urgent.

Email: "I've been waiting 3 weeks for my order. This is ridiculous. I want a refund NOW."
Tone: frustrated

Email: "Just wanted to say thanks — the product arrived early and works great!"
Tone: satisfied

Email: "Hi, can you confirm my order shipped? Order #12345."
Tone: neutral

Email: "Our system is down and we need the replacement part TODAY or we lose the contract."
Tone: urgent

Email: {{email_text}}
Tone:
Few-shot versioon aitab mudelil mõista sinu konkreetseid definitsioone. "Kiireloomuline" vs "frustreeritud" võib olla kahemõtteline — näited muudavad piirid selgeks.

Ülesanne 2: tootekirjelduse ümberkirjutamine

Zero-shot versioon:

Rewrite this product description to be more engaging and benefit-focused. Keep it under 100 words.

Original: {{product_description}}

Rewritten version:
Few-shot versioon (parem brändihääle järjepidevuseks):

Rewrite product descriptions to be engaging and benefit-focused. Match this style:

Original: "Stainless steel water bottle. 24oz capacity. Keeps drinks cold for 24 hours."
Rewritten: "Stay hydrated all day with our sleek 24oz steel bottle. Your morning coffee stays hot through your commute. Your afternoon water stays ice-cold at the gym. One bottle, endless possibilities."

Original: "Wireless earbuds. 8-hour battery. Noise cancelling."
Rewritten: "Eight hours of your favorite podcasts, uninterrupted. Our wireless earbuds block out the noise so you can focus on what matters — whether that's deep work, your workout playlist, or finally finishing that audiobook."

Original: {{product_description}}
Rewritten:
Few-shot versioon õpetab konkreetset tekstistiili — kasutoodud, vestluslik, konkreetsete kasutusjuhtudega. Zero-shot annaks sulle mingi ümberkirjutuse, kuid mitte tingimata sinu hääle.

Ülesanne 3: vea teate struktureerimine

Zero-shot versioon:

Convert this bug report into a structured format with: Summary, Steps to Reproduce, Expected Behavior, and Actual Behavior.

Bug report: {{bug_report}}
Few-shot versioon (parem järjepideva vorminduse jaoks):

Convert bug reports into structured format.

Input: "The app crashes when I try to upload a PDF. I was on the dashboard, clicked upload, selected a 5MB PDF, and it just closed. Should show the file in my uploads but instead the whole app dies."

Output:
**Summary:** App crashes when uploading PDF files
**Steps to Reproduce:**
1. Navigate to dashboard
2. Click upload button
3. Select a PDF file (tested with 5MB file)
**Expected:** File appears in uploads section
**Actual:** Application crashes/closes unexpectedly

---

Input: {{bug_report}}

Output:
Tehnilise dokumentatsiooni puhul on järjepidevus oluline. Few-shot versioon tagab, et iga vea teade järgib sama struktuuri ja sama detailitaset.

Kiire otsustusraamistik

Kui vaatad uut ülesannet, käi läbi need küsimused:
1. Kas ülesanne on otsekohene ja hästi määratletud? → Alusta zero-shotiga 2. Kas vajad kindlat vormingut, mida mudel ei pruugi ära arvata? → Kasuta few-shoti 3. Kas ülesanne hõlmab mitmesammulist arutlust? → Proovi kõigepealt zero-shot mõtteahelat 4. Kas vajad järjepidevat brändihäält või valdkonna terminoloogiat? → Kasuta few-shoti selle hääle näidetega 5. Kas zero-shot andis 80% sellest, mida vajad? → Hoia see alles. Täiuslikkus pole kolmekordsete tokenite väärt.
Eesmärk pole kasutada kõige uhkemat tehnikat — vaid saada häid tulemusi tõhusalt. Zero-shot on vaikevalik. Lisa keerukust ainult siis, kui lihtsamatest viisidest jääb väheks.

Praktikasse rakendamine

Parim viis seda kõike omandada on katsetada. Võta ülesanne, mida teed regulaarselt — aruannete kokkuvõtmine, e-kirjade koostamine, tagasiside kategoriseerimine — ja proovi mõlemat lähenemist. Märka, kus zero-shot jääb hätta. Märka, kus few-shot teeb päriselt vahet.
Kui leiad promptid, mis töötavad, salvesta need kuhugi, kust hiljem ka tegelikult üles leiad. Kui kogud promptide kollektsiooni koos näidete ja muutujatega, on PromptNest emakeelne Maci rakendus ($19.99 ühekordne tasu Mac App Store'is, ilma tellimuse, ilma kontota, töötab lokaalselt), mis hoiab need korras, otsitavad ja ühe klahvikombinatsiooniga igast rakendusest kättesaadavad. Pole vaja enam kolme nädala tagust suurepärast few-shot prompti laialipillutatud märkmetest taga ajada.
Alusta lihtsalt. Lisa keerukust vajaduse korral. Salvesta see, mis töötab. Selles kogu strateegia seisnebki.