Atpakaļ uz blogu

Soli pa solim domāšana: padari MI gudrāku ar uzvedni

Iemācies vienkāršu uzvedni, kas paaugstināja MI precizitāti no 18% līdz 79% loģiskos uzdevumos — ar gataviem kopējamiem piemēriem tavam ikdienas darbam.

Soli pa solim domāšana: padari MI gudrāku ar uzvedni
Tu uzdevi ChatGPT jautājumu, kuram bija nepieciešama pārdomāšana — varbūt salīdzināt divus variantus, izanalizēt lēmumu vai izstrādāt vairāku soļu uzdevumu. MI atbildēja zibenīgi un pārliecināti. Vienīgā problēma — atbilde bija pilnīgi nepareiza.
Tas notiek biežāk, nekā šķiet. MI asistenti ir trenēti veidot ticami skanošas atbildes, nevis patiesi izanalizēt problēmu. Kad uzdod sarežģītu jautājumu parastajā veidā, MI bieži izlaiž domāšanas posmu un uzreiz pasaka atbildi — dažreiz ārkārtīgi nepareizu, taču ar pilnu pārliecību balsī.
Risinājums pastāv. 2022. gadā Google pētnieki atklāja, ka, pievienojot uzvednei vienu frāzi — "Domāsim soli pa solim" — precizitāte matemātikas uzdevumos pieauga no 17,7% līdz 78,7%. Tā nav drukas kļūda. Viens teikums padarīja MI četras reizes precīzāku.
Šo paņēmienu sauc par soli pa solim domāšanas uzvedni (chain-of-thought prompting), un tas darbojas tāpēc, ka liek MI parādīt savu darba gaitu, nevis pārlēkt secinājumiem. Lūk, kā to izmantot reāliem uzdevumiem — ne tikai matemātikai.

Kas ir soli pa solim domāšanas uzvedne?

Soli pa solim domāšanas (chain-of-thought, jeb CoT) uzvedne ir tieši tas, ko nosaukums saka: tu lūdz MI izskaidrot savu domu gaitu pa soļiem, pirms tas sniedz galīgo atbildi. Tā vietā, lai jautātu "Kāda ir atbilde?", tu jautā "Izskaidro savu domāšanu, pēc tam pasaki atbildi".
Iztēlojies, ka lūdz kolēģim parādīt savu darba gaitu. Ja kāds tev iedod ieteikumu bez paskaidrojuma, tu nespēj saprast, vai viņš to tiešām pārdomāja vai vienkārši uzminēja. Bet, ja viņš izved tevi cauri savai domu gaitai — "apsvēru X, atmetu Y argumenta Z dēļ, un tas mani aizveda pie šī secinājuma" — tu vari pamanīt loģikas plaisas.
Tas pats princips attiecas arī uz MI. Kad piespied to formulēt starpsoļus, notiek divas lietas:
  1. MI pats pamana savas kļūdas spriešanas vidū
  2. Tu redzi, kur tieši loģika sagāja greizi, ja atbilde nav pareiza

Kāpēc MI izlaiž soļus (un kļūdās)

Lūk, kas vairākumam paslīd garām: MI modeļi patiesībā "nedomā" tāpat kā cilvēki. Tie meklē atbilstības starp miljardiem teksta piemēru, lai paredzētu, kuriem vārdiem jāseko nākamajiem. Kad uzdod tiešu jautājumu, tie izvēlas statistiski iespējamāko atbildi.
Vienkāršiem jautājumiem tas darbojas labi. "Kāda ir Francijas galvaspilsēta?" neprasa spriešanu — MI šo jautājumu un atbildi ir redzējis pārī jau miljoniem reižu.
Bet visam, kam patiešām vajadzīga loģika — variantu salīdzināšanai, kompromisu izsvēršanai, vairāku soļu uzdevumu risināšanai — paraugu atbilstības pieeja vienkārši izirst. MI izvēlas atbildi, kas izklausās pareiza, bet neveic darbu, lai pārliecinātos, ka tā tiešām ir pareiza.
Soli pa solim domāšanas uzvedne pārtrauc šo īso ceļu. Liekot MI spriest skaļi, tu liec tam izveidot starpsoļus — un šie soļi ierobežo, kāda var būt galīgā atbilde. Daudz grūtāk nonākt pie nepareiza secinājuma, kad jāparāda ceļš, kas pie tā novedis.
Salīdzinājums: MI lec tieši pie atbildes pretstatā MI, kurš pirms atbildes izvērtē situāciju soli pa solim
Salīdzinājums: MI lec tieši pie atbildes pretstatā MI, kurš pirms atbildes izvērtē situāciju soli pa solim

Vienkāršākais veids, kā lietot soli pa solim domāšanu

Vieglākajā variantā nav vajadzīgs nekāds iestatījums. Vienkārši pievieno uzvednei beigās vienu no šīm frāzēm:
  • "Domāsim soli pa solim."
  • "Izved mani cauri savai domu gaitai."
  • "Izskaidro savu domāšanu, pirms sniedz galīgo atbildi."
  • "Sadali to soļos."
Pētnieki noskaidroja, ka frāze "Domāsim soli pa solim" testos darbojās vislabāk, lai gan vēlāks pētījums atklāja vēl labāku formulējumu: "Izstrādāsim šo soli pa solim, lai pārliecinātos, ka atbilde ir pareiza."
Lūk, kā tas izskatās praksē. Pieņemsim, ka mēģini izlemt, vai pieņemt darba piedāvājumu.
Bez soli pa solim domāšanas:

Vai man pieņemt darba piedāvājumu, kas maksā par 20% vairāk, bet prasa pārcelšanos uz pilsētu ar 40% augstākām dzīves izmaksām?


MI varētu pasviest tev ātru "jā" vai "nē", balstoties uz virspusēju paraugu atbilstību.
Ar soli pa solim domāšanu:

Vai man pieņemt darba piedāvājumu, kas maksā par 20% vairāk, bet prasa pārcelšanos uz pilsētu ar 40% augstākām dzīves izmaksām?

Izdomāsim to soli pa solim, ņemot vērā finansiālo ietekmi, dzīves kvalitātes faktorus un karjeras sekas, pirms tiek izdarīts secinājums.


Tagad MI sadalīs katru faktoru, izrēķinās, vai 20% lielāka alga sedz 40% augstākas izmaksas, apsvērs, ko vari iegūt vai zaudēt, un sniegs pamatotu ieteikumu.

Few-shot CoT: parādi MI, kā jādomā

Pieeja "Domāsim soli pa solim" tiek dēvēta par zero-shot CoT, jo tu nerādi nevienu piemēru. Tas darbojas labi daudzās situācijās, taču sarežģītiem vai specializētiem uzdevumiem var iegūt vēl labākus rezultātus, ja parādi MI to spriešanas paraugu, kuru gribi.
To sauc par few-shot CoT — uzvednē iekļauj vienu vai divus izstrādātus piemērus, kas parāda MI tieši tā, kā jāspriež līdzīgos uzdevumos.
Lūk, šablons biznesa lēmumu izvērtēšanai:

Vajag palīdzēt izvērtēt iespējas. Lūk, kā gribu, lai tu spried par katru no tām:

Piemērs:
Jautājums: Vai pārslēgties no ikmēneša uz gada norēķiniem?

1. solis — galvenie faktori: naudas plūsmas paredzamība, klientu aiziešanas risks, cenu uztvere.

2. solis — katra faktora analīze:
- Naudas plūsma: gada norēķini dod ieņēmumus uzreiz, uzlabojot paredzamību
- Aiziešanas risks: klientiem, kuri maksā gadā, ir zemāks aiziešanas rādītājs
- Cenas: varam piedāvāt atlaidi gada plānam, neko nezaudējot

3. solis — kompromisu izsvēršana: galvenais mīnuss ir lielāka berze jauniem reģistrētājiem.

4. solis — secinājums: jā, bet piedāvāt abus variantus ar 15% atlaidi gada plānam.

Tagad pielieto šo pašu spriešanas struktūru manam jautājumam:
{{question}}
Piemēram nav jāatbilst tavam tiešajam jautājumam — pietiek, ja tas parāda spriešanas struktūru, kuru gribi. MI pielāgos paraugu tavai konkrētajai situācijai.

Kad soli pa solim domāšana patiešām palīdz (un kad nē)

CoT uzvedne nav burvju nūjiņa katram MI dialogam. Vārtonas pētījums atklāja, ka tā uzlabo sniegumu sarežģītos uzdevumos, taču vienkāršiem var pat samazināt precizitāti, ievazājot lieku sarežģītību.
Izmanto soli pa solim domāšanu, kad:
  • Salīdzini vairākus variantus vai izsver kompromisus
  • Uzdevumam vajadzīga vairāku soļu spriešana vai aprēķini
  • Jārisina vai jādiagnosticē problēma
  • Atbilde prasa cēloņu un seku analīzi
  • Gribi saprast MI spriešanas gaitu, ne tikai saņemt atbildi
Atstāj malā, kad:
  • Lūdz vienkāršus faktus vai definīcijas
  • Vajag radošu izpildi, piemēram, ideju ģenerēšanu vai rakstīšanu
  • Gribi kopsavilkumu vai tulkojumu
  • Ātrums ir svarīgāks par precizitāti
  • Uzdevumā nav loģiskas spriešanas
Vēl viena lieta, ko vērts ievērot: CoT uzvedne ir mazāk efektīva ar mazākiem MI modeļiem. Sākotnējais Google pētījums atklāja, ka pamanāms uzlabojums parādās tikai modeļiem ar 100+ miljardiem parametru. Ar pašreizējiem patērētāju MI rīkiem — ChatGPT-4, Claude un Gemini — tu esi pareizajā diapazonā. Bet, ja izmanto vecākus vai mazākus modeļus, rezultāti var atšķirties.

5 gatavas CoT uzvednes reālam darbam

Lūk, kopējamas uzvednes, kuras vari sākt lietot jau šodien. Katrā no tām soli pa solim spriešanas struktūra ir jau ielikta.

1. Lēmuma analīze

Palīdzi izlemt: {{decision_to_make}}

Izved mani cauri tam soli pa solim:
1. Uzskaiti galvenos faktorus, kas man jāņem vērā
2. Izanalizē, kā katrs variants darbojas attiecībā uz šiem faktoriem
3. Norādi galvenos riskus un kompromisus
4. Sniedz ieteikumu ar pamatojumu

Esi konkrēts un balsties uz manu reālo situāciju, nevis uz vispārīgiem padomiem.

2. Plusu un mīnusu salīdzinājums

Salīdzini šos variantus: {{option_1}} pret {{option_2}}

Izdomā to sistemātiski:
1. Vispirms norādi 5 kritērijus, kas šim lēmumam ir vissvarīgākie
2. Novērtē katru variantu pēc katra kritērija
3. Atzīmē jebkurus izšķirošus mīnusus vai prasības
4. Izsver kopējos kompromisus
5. Sniedz skaidru ieteikumu

Neuzskaiti tikai plusus un mīnusus — patiesi pamato, kuri faktori sver vairāk un kāpēc.

3. Pamatcēloņa analīze

Palīdzi saprast, kāpēc tā notiek: {{problem_description}}

Izmanto šādu spriešanas plūsmu:
1. Precizē, kas patiesi notiek pretstatā tam, kam vajadzētu notikt
2. Uzskaiti visus iespējamos cēloņus (arī mazticamos)
3. Katram cēlonim apsver, kādi pierādījumi to apstiprinātu vai izslēgtu
4. Balstoties uz pieejamo informāciju, norādi visticamāko pamatcēloni
5. Iesaki, kā to pārbaudīt un ko ar to darīt

4. Plāns soli pa solim

Man jā{{goal}}.

Sadali to soļos:
1. Vispirms norādi, kam jānotiek pirms visa pārējā (priekšnoteikumi)
2. Pēc tam ieskicē galvenos posmus vai atskaites punktus
3. Katram posmam uzskaiti konkrētās darbības
4. Atzīmē jebkuras atkarības (kam jānotiek pirms tā, lai varētu sākt nākamo)
5. Norādi iespējamos šķēršļus un kā tos pārvarēt

Esi konkrēts — dod man rīcības soļus, ne miglainus padomus.

5. Sarežģīta jautājuma analīze

{{complex_question}}

Pirms atbildi, izstrādāsim to rūpīgi:
1. Noskaidro, ko šis jautājums patiesībā prasa
2. Norādi pieņēmumus, kas jautājumā ir iebūvēti
3. Apsver galvenos faktorus, kas ietekmē atbildi
4. Izspried katru faktoru
5. Pēc tam dod atbildi ar pamatojumu, kas to balsta

Ja pastāv reāla nenoteiktība, atzīsti to, nevis izliecies, ka esi pārliecināts.
Šīs uzvednes seko vienam un tam pašam paraugam: pasaki, kas tev vajadzīgs, un pēc tam skaidri apraksti spriešanas plūsmu, kuru gribi, lai MI ievēro. Šī struktūra novirza MI uz pamatīgu analīzi tā vietā, lai tas pārlēktu uzreiz pie secinājuma.
Uzvednes šablona kartīte ar mainīgo vietām, kuras tiek pielāgotas dažādiem uzdevumiem
Uzvednes šablona kartīte ar mainīgo vietām, kuras tiek pielāgotas dažādiem uzdevumiem
Ja pieķer sevi pie tā, ka šīs uzvednes lieto atkal un atkal — katru reizi mainot citu lēmumu, problēmu vai jautājumu — tāds rīks kā PromptNest ļauj tās saglabāt ar jau ievietotiem {{variables}} placeholderiem. Kad uzvedne nepieciešama, vienkārši aizpildi tukšumus un nokopē gatavu prompt.

Risinājums, ja spriešana aiziet greizi

Reizēm pielietosi soli pa solim uzvedni, un MI parādīs soļus... bet tomēr nonāks pie nepareiza secinājuma. Lūk, ko darīt.
Spriešana izskatās laba, bet secinājums ir aplams. MI varbūt sācis no kļūdaina pieņēmuma. Pajautā: "Kādus pieņēmumus tu šeit izdari? Uzskaiti tos atklāti." Bieži kļūda slēpjas neizteiktajā priekšnoteikumā, ne pašā loģikā.
MI izlaida svarīgus faktorus. Atbildi: "Tu neapsvēri {{factor}}. Kā tas maina tavu analīzi?" MI iekļaus jauno informāciju un nereti pārskatīs secinājumu.
Spriešana iet pa apli vai paliek miglaina. Pieprasi konkrētību: "2. solī tu teici 'tas varētu būt riskanti'. Par kādiem konkrētiem riskiem tu runā un kā tu tos novērtētu skaitļos?" Konkrētu detaļu prasīšana atklāj neskaidru domāšanu.
Tev rodas aizdomas, ka MI ir pārmērīgi pārliecināts. Mēģini: "Spēlē velna advokātu. Kāds ir spēcīgākais arguments pret šo secinājumu?" Tas bieži atklāj vājās vietas, kuras MI sākotnēji noslidināja garām.
Soli pa solim uzvednes jēga nav tikai labākas atbildes — tā padara MI domāšanu redzamu, lai tu vari pamanīt un izlabot kļūdas. Pirmo atbildi uztver kā sākumpunktu, ne kā galīgo vārdu.

Sāc lietot soli pa solim domāšanu jau šodien

Tev nav jāiegaumē tehnikas vai jāseko sarežģītiem ietvariem. Atceries vienu galveno domu: kad tev vajag, lai MI patiesi domā, nevis minētu, palūdz parādīt darba gaitu.
Sāc ar vienu uzdevumu, kuram regulāri lieto MI — ar kaut ko, kas saistīts ar analīzi, salīdzināšanu vai problēmu risināšanu. Pievieno "Izdomāsim to soli pa solim" un paskaties, kā mainās atbilde. Kad būsi pamanījis atšķirību, sāksi pats just, kad to pielietot.
Ja gribi izveidot bibliotēku ar spriešanas uzvednēm, tādām kā augstāk, tās vari saglabāt jebkur — piezīmju lietotnē, dokumentā, jebkur, ko jau lieto. Vai, ja gribi kaut ko, kas radīts tieši šim mērķim, PromptNest ir vietējā Mac lietotne ($19.99 vienreizēja maksa Mac App Store, bez abonementa, bez konta, darbojas lokāli) un sakārto tavas uzvednes ar mainīgajiem jau iekšā. Jebkurā gadījumā galvenais ir, lai labākās uzvednes ir pa rokai tad, kad vajag — nevis aizraktas vecu sarakstes vēsturē.
Atšķirība starp MI, kas palīdz domāt, un MI, kas tikai izklausās pārliecināts, bieži nāk no četriem vārdiem: "Domāsim soli pa solim."