Few-shot vs. zero-shot -kehotteet: milloin kumpaakin kannattaa käyttää
Käytännönläheinen opas oikean kehotetavan valintaan – mukana valmiit esimerkit ja yksinkertainen päätöskehys.
Liität kehotteen ChatGPT:hen. Tulos on... ihan kelvollinen. Mutta olet nähnyt, miten muut saavat huomattavasti parempia tuloksia lisäämällä kehotteisiinsa ”esimerkkejä”. Pitäisikö sinunkin tehdä niin? Kuinka monta esimerkkiä? Onko sillä edes merkitystä juuri sinun tehtävässäsi?
Nämä kysymykset toistuvat jatkuvasti, eikä terminologia helpota asiaa. ”Zero-shot”, ”few-shot”, ”one-shot” – ne kuulostavat enemmän valokuvaustermeiltä kuin käytännön ohjeilta. Tämä opas raivaa jargonan tieltä ja antaa selkeän kehyksen sille, milloin mitäkin tapaa kannattaa käyttää. Mukana on myös valmiit kehotteet, jotka voit kopioida ja testata itse.
Mitä zero-shot-kehottaminen oikeastaan tarkoittaa
Zero-shot-kehottaminen tarkoittaa sitä, että annat tekoälylle tehtävän näyttämättä yhtään esimerkkiä siitä, mitä haluat. Kuvailet tarpeesi, ja malli päättelee koulutuksensa pohjalta, miten tehtävä hoidetaan.
Tässä on zero-shot-kehote palaverin tiivistämiseen:
Tiivistä seuraavat palaverimuistiinpanot 3–5 ranskalaiseen viivaan, jotka kattavat tärkeimmät tehdyt päätökset.
Palaverimuistiinpanot:
{{meeting_notes}}
Siinä se. Ei esimerkkejä ”hyvistä” tiivistelmistä, ei mallisyötteitä eikä mallivastauksia. Luotat siihen, että malli ymmärtää, miltä tiivistelmä näyttää ja mitä ”tärkeimmät päätökset” tarkoittaa. Yllättävän monessa tehtävässä tämä toimii erinomaisesti.
Mitä few-shot-kehottaminen oikeastaan tarkoittaa
Few-shot-kehottaminen tarkoittaa, että sisällytät kehotteeseesi 2–5 esimerkkiä, jotka näyttävät tekoälylle haluamasi mallin. Sanot pohjimmiltaan ”näin haluan, että käsittelet tämän”, ennen kuin annat varsinaisen tehtävän.
Tässä on sama palaverin tiivistystehtävä, mutta esimerkkien kanssa:
Tiivistä palaverimuistiinpanot 3–5 ranskalaiseen viivaan, jotka kattavat tärkeimmät päätökset.
Esimerkki 1:
Syöte: ”Tiimi keskusteli Q3:n tavoitteista. Sarah ehdotti myyntitavoitteen nostamista 15 %. Mark oli eri mieltä ja ehdotti, että 10 % on realistisempi nykyisen myyntiputken valossa. Tiimi äänesti ja sopi 12 %:sta. Päätettiin myös siirtää verkkosivuston uudistus Q4:lle.”
Vastaus:
- Sovittiin Q3:n myyntitavoitteen 12 %:n kasvusta (kompromissi 15 %:n ja 10 %:n ehdotusten välillä)
- Verkkosivuston uudistus siirrettiin Q4:lle
Esimerkki 2:
Syöte: ”Budjettikatsaus. Nykyiset menot ovat 8 % yli ennusteen. Talousjohtaja suositteli matkabudjetin leikkaamista 50 % ja uusien rekrytointien jäädyttämistä 60 päiväksi. Toimitusjohtaja hyväksyi molemmat toimet astumaan voimaan välittömästi.”
Vastaus:
- Matkabudjettia leikataan 50 % (voimaan välittömästi)
- 60 päivän rekrytointijäädytys hyväksytty
- Reagointi 8 %:n budjettiylitykseen
Tiivistä nyt tämä:
{{meeting_notes}}
Huomaa ero. Esimerkit näyttävät mallille tarkalleen, missä muodossa haluat vastauksen (ranskalaiset viivat sulkeissa olevine taustatietoineen), kuinka yksityiskohtaisesti ja miten useat päätökset käsitellään. Malli oppii mieltymyksesi kontekstista – ilman hienosäätöä.
Tärkeimmät erot yhdellä silmäyksellä
Näin nämä kaksi tapaa vertautuvat tärkeimpien tekijöiden osalta:
Nopeus: zero-shot on nopeampi. Vähemmän käsiteltäviä tokeneita tarkoittaa nopeampaa vastausta.
Hinta: zero-shot on edullisempi. Maksat tokeneista, ja esimerkit kasvattavat laskua.
Vaiva: zero-shot vaatii sitä tuskin lainkaan. Few-shot vaatii hyvien esimerkkien etsimistä tai tekemistä.
Tarkkuus yksinkertaisissa tehtävissä: suunnilleen sama. Nykyiset mallit hoitavat suoraviivaiset pyynnöt hyvin kummallakin tavalla.
Tarkkuus monimutkaisissa tai räätälöidyissä tehtävissä: few-shot voittaa yleensä. Kun tarvitset tietyn muotoilun tai alan termit, esimerkit tekevät selvästi mitattavan eron.
Vaihtokauppa on selvä: zero-shot on yksinkertaisempi ja halvempi, mutta few-shot antaa enemmän hallintaa lopputulokseen. Kysymys kuuluu: milloin ylimääräinen hallinta on vaivan arvoista?
Milloin zero-shot toimii parhaiten
Zero-shot-kehottaminen loistaa silloin, kun tehtävä on jotain sellaista, jonka malli jo ”ymmärtää” koulutuksestaan. Tähän kuuluvat:
Yleistietokysymykset: selitysten, määritelmien tai faktatiedon pyytäminen. Malli tietää, miltä hyvä selitys näyttää.
Luova ideointi: ideoiden tuottaminen, ensimmäisten luonnosten kirjoittaminen tai vaihtoehtojen kehittäminen. Tässä halutaankin vaihtelua, ei tiukkaa kaavaa.
Tavanomainen tiivistäminen: artikkeleiden, sähköpostien tai dokumenttien tiivistäminen, kun et tarvitse mitään erityistä muotoa.
Kääntäminen: tekstin muuntaminen kielten välillä, joilla malli on koulutettu.
Yksinkertainen luokittelu: asioiden jaottelu yleisiin kategorioihin (positiivinen/negatiivinen, kiireellinen/ei kiireellinen), kun kategoriat ovat itsestäänselviä.
Hyvä nyrkkisääntö: jos pystyt kuvailemaan tarpeen tavallisilla sanoilla niin, että ihminenkin ymmärtäisi sen ilman esimerkkejä, zero-shot toimii todennäköisesti.
Vuokaavio päätösprosessista: aloita zero-shot-kehotteella, arvioi tulokset ja lisää esimerkkejä vain tarvittaessa
Milloin few-shot ansaitsee ylimääräiset tokenit
Few-shot-kehottaminen lunastaa paikkansa silloin, kun lopputuloksen tulee noudattaa kaavoja, joita malli ei pysty päättelemään pelkistä ohjeista:
Räätälöity muotoilu: kun tarvitset vastaukset tietyssä rakenteessa – JSON tietyillä kentillä, taulukot täsmällisillä sarakkeilla, ranskalaiset viivat tietyssä tyylissä. Esimerkit näyttävät muodon paremmin kuin kuvaukset selittävät.
Omat luokitteluluokat: jos jaottelet asiakassähköposteja luokkiin kuten ”laskutuskysymys”, ”ominaisuustoive”, ”bugi-ilmoitus” ja ”yleinen tiedustelu”, esimerkkien näyttäminen kustakin auttaa mallia ymmärtämään määritelmäsi.
Brändiäänen tai sävyn vastaavuus: haluatko tekoälyn kirjoittavan kuin yrityksesi olemassa oleva sisältö? Näytä sille 2–3 esimerkkiä siitä äänestä. Ohjeet kuten ”kirjoita ammattimaisesti mutta ystävällisesti” ovat epämääräisiä; esimerkit ovat täsmällisiä.
Alan terminologia: jos toimialallasi käytetään jargonaa tai lyhenteitä, joilla on muualla eri merkitys, esimerkit opettavat mallille kontekstisi.
Reunatapaukset ja vivahteet: sarkasmin tunnistaminen, ironia tai hienovaraiset erot, jotka kompastuttavat zero-shot-lähestymistavat. Tutkimukset osoittavat, että few-shot-kehottaminen parantaa merkittävästi tunneanalyysin reunatapausten kuten kieltojen ja sarkasmin käsittelyä.
Eräässä tutkimuksessa havaittiin, että Twitter-tunneluokittelussa few-shot-kehottaminen jo 20–50 esimerkillä lähestyi mallien suorituskykyä, jotka oli hienosäädetty yli 10 000 esimerkillä. Sellainen voima hyvin valituilla esimerkeillä on.
Jos huomaat keräileväsi few-shot-kehotekirjastoa eri tehtäviin, PromptNestin kaltainen työkalu auttaa tallentamaan ne valmiiksi muuttujilla kuten {{meeting_notes}} – täytä aukot kopioidessasi, ja täydellinen kehote on valmiina liitettäväksi.
”Aloita zerolla, päivitä tarvittaessa” -työtapa
Tässä käytännöllinen tapa, joka säästää sekä aikaa että tokeneita:
Vaihe 1: Kokeile ensin zero-shotia. Kirjoita selkeä kehote, joka kuvaa haluamasi. Ole täsmällinen tehtävän suhteen, mutta älä vielä lisää esimerkkejä.
Vaihe 2: Arvioi tulos. Antaako se sinulle sen, mitä tarvitset? Jos kyllä, olet valmis. Jos ei, mieti, mikä meni pieleen – muoto? sävy? puuttuvat yksityiskohdat? väärinymmärretty tehtävä?
Vaihe 3: Lisää kohdennettuja esimerkkejä. Tee 2–3 esimerkkiä, jotka näyttävät juuri sen, missä malli epäonnistui. Jos muoto oli pielessä, näytä oikea muoto. Jos sävy oli väärä, näytä oikea sävy.
Tämä työtapa on tärkeä, koska et arvaile, tarvitsetko esimerkkejä – reagoit todellisiin puutteisiin. Joskus ”Mietitäänpä askel askeleelta” -lauseen lisääminen zero-shot-kehotteeseen korjaa päättelyongelmat ilman esimerkkejä. Tutkimus vahvistaa, että zero-shot chain-of-thought päihittää usein few-shotin päättelytehtävissä.
Kuinka monta esimerkkiä todella tarvitset?
Tutkimus osoittaa johdonmukaisesti, että useimmissa tehtävissä 2–5 esimerkkiä osuu nappiin. Data näyttää tältä:
- 2–3 ensimmäistä esimerkkiä tuovat suurimman tarkkuuden lisäyksen
- Hyöty laskee jyrkästi 4–5 esimerkin jälkeen
- Liika esimerkkien määrä voi itse asiassa heikentää suoritusta tuomalla mukaan ristiriitaisia kaavoja
- Esimerkkien laatu ratkaisee enemmän kuin määrä – kolme erinomaista esimerkkiä päihittää kymmenen keskinkertaista
Tärkeä havainto koskee myös esimerkkien järjestystä: tutkimukset osoittavat, että esimerkkien järjestys vaikuttaa tuloksiin – paras järjestys voi joskus tehdä eron hyvän ja heikon suorituksen välillä. Jos few-shot-kehotteesi ei toimi kunnolla, kokeile järjestyksen vaihtamista ennen kuin lisäät uusia esimerkkejä.
Kuva siitä, miten esimerkkikortteja lisätään kehotteeseen ja hyöty pienenee parin ensimmäisen jälkeen
Useimmissa käyttötapauksissa kannattaa aloittaa kahdella esimerkillä. Jos tarkkuus ei ole tarvittavalla tasolla, lisää kolmas, joka kattaa eri muunnelman. Harvoin tarvitset enempää kuin neljä.
Chain-of-thought: päättelytehtävien välimaasto
On olemassa kolmaskin vaihtoehto, joka toimii erityisen hyvin matematiikassa, logiikassa ja monivaiheisissa tehtävissä: chain-of-thought- eli ajatusketjukehottaminen. Sen sijaan että näyttäisit syöte–vastaus-pareja, pyydät mallia ”ajattelemaan askel askeleelta”.
Zero-shot chain-of-thought näyttää tältä:
Kaupassa on 45 omenaa. Ne myyvät 12 aamupäivällä ja saavat lisätoimituksen, jossa on 30 omenaa. Sitten ne myyvät 18 iltapäivällä. Kuinka monta omenaa kaupassa on sulkemisaikaan?
Käydäänpä tämä läpi askel askeleelta.
Tämä yksinkertainen lause – ”Käydäänpä tämä läpi askel askeleelta” – saa mallin näyttämään päättelynsä sen sijaan, että se hyppäisi suoraan vastaukseen. Monimutkaisessa päättelyssä tämä päihittää usein sekä zero-shot- että few-shot-tavat.
Tuore tutkimus arXivissa havaitsi, että vahvoilla malleilla kuten GPT-4 ja Claude zero-shot chain-of-thought päihittää usein few-shot-kehottamisen päättelytehtävissä. Esimerkit voivat itse asiassa kahlita mallin ajattelua sen sijaan, että auttaisivat sitä.
Käytä chain-of-thoughtia kun:
Tehtävä vaatii useita loogisia askelia
Haluat mallin selittävän päättelynsä (hyödyllistä virheiden havaitsemiseen)
Kyseessä on matematiikka, koodilogiikka tai analyyttinen ongelma
Haluat varmistaa mallin tavan ratkaista ongelma, et pelkkää vastausta
Valmiit kehote-esimerkit kopioitavaksi
Katsotaanpa kolmea tapaa rinnakkain todellisissa tehtävissä. Kaikki kehotteet on testattu GPT-4:llä ja Claudella, ja ne ovat valmiita käyttöön.
Tehtävä 1: sähköpostin sävyn luokittelu
Zero-shot-versio:
Luokittele tämän asiakassähköpostin sävy yhdeksi seuraavista: turhautunut, tyytyväinen, neutraali tai kiireellinen.
Sähköposti:
{{email_text}}
Sävy:
Few-shot-versio (parempi reunatapauksiin):
Luokittele asiakassähköpostin sävy: turhautunut, tyytyväinen, neutraali tai kiireellinen.
Sähköposti: ”Olen odottanut tilaustani 3 viikkoa. Tämä on naurettavaa. Haluan rahat takaisin NYT.”
Sävy: turhautunut
Sähköposti: ”Halusin vain kiittää – tuote tuli etuajassa ja toimii hienosti!”
Sävy: tyytyväinen
Sähköposti: ”Hei, voitteko vahvistaa, että tilaukseni on lähtenyt? Tilaus #12345.”
Sävy: neutraali
Sähköposti: ”Järjestelmämme on alhaalla ja tarvitsemme varaosan TÄNÄÄN tai menetämme sopimuksen.”
Sävy: kiireellinen
Sähköposti: {{email_text}}
Sävy:
Few-shot-versio auttaa mallia ymmärtämään juuri sinun määritelmäsi. ”Kiireellinen” ja ”turhautunut” voivat olla tulkinnanvaraisia – esimerkit tekevät rajat selviksi.
Tehtävä 2: tuotekuvauksen uudelleenkirjoittaminen
Zero-shot-versio:
Kirjoita tämä tuotekuvaus uudelleen niin, että se on kiinnostavampi ja hyötykeskeisempi. Pidä mitta alle 100 sanassa.
Alkuperäinen: {{product_description}}
Uudelleenkirjoitettu versio:
Kirjoita tuotekuvaukset uudelleen kiinnostaviksi ja hyötykeskeisiksi. Noudata tätä tyyliä:
Alkuperäinen: ”Ruostumattomasta teräksestä valmistettu vesipullo. 700 ml tilavuus. Pitää juomat kylminä 24 tuntia.”
Uudelleenkirjoitettu: ”Pysy nestetasapainossa läpi päivän tyylikkäällä 700 millin teräspullollamme. Aamukahvisi pysyy kuumana koko työmatkan. Iltapäivän vetesi pysyy jääkylmänä salilla. Yksi pullo, loputtomat mahdollisuudet.”
Alkuperäinen: ”Langattomat nappikuulokkeet. 8 tunnin akku. Vastamelu.”
Uudelleenkirjoitettu: ”Kahdeksan tuntia lempipodcastejasi keskeytyksettä. Langattomat nappikuulokkeemme vaimentavat metelin, jotta voit keskittyä siihen mikä on tärkeää – oli kyse syvätyöstä, treenisoittolistasta tai vihdoin sen äänikirjan loppuunkuuntelusta.”
Alkuperäinen: {{product_description}}
Uudelleenkirjoitettu:
Few-shot-versio opettaa tietyn copytyylin – hyötylähtöisen, keskustelevan ja konkreettisiin käyttötilanteisiin nojaavan. Zero-shot antaisi jonkin uudelleenkirjoituksen, mutta ei välttämättä sinun ääntäsi.
Tehtävä 3: bugi-ilmoituksen jäsentäminen
Zero-shot-versio:
Muunna tämä bugi-ilmoitus jäsenneltyyn muotoon, jossa on osiot: tiivistelmä, toistamisen vaiheet, odotettu käyttäytyminen ja todellinen käyttäytyminen.
Bugi-ilmoitus: {{bug_report}}
Few-shot-versio (parempi yhtenäiseen muotoiluun):
Muunna bugi-ilmoitukset jäsenneltyyn muotoon.
Syöte: ”Sovellus kaatuu, kun yritän ladata PDF-tiedostoa. Olin koontinäytöllä, klikkasin lataa, valitsin 5 megan PDF:n, ja sovellus vain sulkeutui. Pitäisi näyttää tiedosto latauksissani, mutta sen sijaan koko sovellus kuolee.”
Vastaus:
**Tiivistelmä:** sovellus kaatuu PDF-tiedostoja ladatessa
**Toistamisen vaiheet:**
1. Siirry koontinäytölle
2. Klikkaa Lataa-painiketta
3. Valitse PDF-tiedosto (testattu 5 megan tiedostolla)
**Odotettu:** tiedosto näkyy lataukset-osiossa
**Todellinen:** sovellus kaatuu/sulkeutuu odottamatta
---
Syöte: {{bug_report}}
Vastaus:
Teknisessä dokumentaatiossa yhtenäisyys on ratkaisevaa. Few-shot-versio varmistaa, että jokainen bugi-ilmoitus noudattaa samaa rakennetta ja yhtä yksityiskohtaista tasoa.
Nopea päätöskehys
Kun seisot uuden tehtävän edessä, käy nämä kysymykset läpi:
1. Onko tehtävä suoraviivainen ja hyvin määritelty? → aloita zero-shotilla
2. Tarvitsetko tietyn muodon, jota malli ei välttämättä arvaa? → käytä few-shotia
3. Vaatiiko tehtävä monivaiheista päättelyä? → kokeile ensin zero-shot chain-of-thoughtia
4. Tarvitsetko yhtenäistä brändiääntä tai alan terminologiaa? → käytä few-shotia esimerkkeineen siinä äänessä
5. Antoiko zero-shot 80 % siitä, mitä tarvitset? → pidä se. Täydellisyys ei ole kolminkertaisten tokenien arvoinen.
Tarkoitus ei ole käyttää hienointa tekniikkaa, vaan saada hyvät tulokset tehokkaasti. Zero-shot on oletus. Lisää monimutkaisuutta vain, kun yksinkertaisempi tapa ei riitä.
Käytäntöön
Paras tapa sisäistää tämä on kokeilla. Ota tehtävä, jota teet säännöllisesti – raporttien tiivistäminen, sähköpostien luonnostelu, palautteen luokittelu – ja kokeile molempia tapoja. Huomaa, missä zero-shot ei riitä. Huomaa, missä few-shot tekee aidon eron.
Kun löydät toimivat kehotteet, tallenna ne paikkaan, josta löydät ne uudelleen. Jos rakennat kokoelmaa esimerkkejä ja muuttujia sisältävistä kehotteista, PromptNest on natiivi Mac-sovellus ($19.99 kertamaksuna Mac App Storessa, ei tilausta, ei tiliä, toimii paikallisesti), joka pitää ne järjestyksessä, hakukelpoisina ja avattavissa pikanäppäimellä mistä tahansa sovelluksesta. Ei enää sitä etsimistä hajanaisten muistiinpanojen joukosta sen kolme viikkoa sitten kirjoitetun täydellisen few-shot-kehotteen perään.
Aloita yksinkertaisesti. Lisää monimutkaisuutta tarvittaessa. Tallenna se mikä toimii. Siinä on koko strategia.