Minčių grandinės promptai: DI, mąstantis žingsnis po žingsnio
Paprasta promptų technika, kuri DI tikslumą logikos užduotyse padidino nuo 18 iki 79 procentų — su paruoštais pavyzdžiais kasdieniam darbui.
Uždavei ChatGPT klausimą, kuriam reikėjo bent šiek tiek pamąstyti — tarkim, palyginti du variantus, išanalizuoti sprendimą ar suvaldyti kelių žingsnių uždavinį. DI iškart išspjovė pasitikintį atsakymą. Tik vienas niuansas: jis buvo visiškai klaidingas.
Taip nutinka dažniau, nei atrodo. DI asistentai apmokyti generuoti įtikinamai skambančius atsakymus, o ne iš tikrųjų svarstyti problemą. Kai sudėtingą klausimą užduodi įprastai, DI dažnai praleidžia mąstymo dalį ir iškart šauna su atsakymu — kartais skambiai klysdamas, bet vis tiek atrodydamas absoliučiai užtikrintas.
Ši technika vadinasi minčių grandinės promptai (angl. chain-of-thought) ir veikia todėl, kad priverčia DI parodyti savo darbą, o ne šokti tiesiai prie išvados. Štai kaip ją pritaikyti realioms užduotims, ne tik matematikai.
Kas yra minčių grandinės promptai?
Minčių grandinės (angl. CoT) promptai daro būtent tai, ką siūlo pavadinimas: paprašai DI prieš galutinį atsakymą paaiškinti savo svarstymą žingsnis po žingsnio. Vietoj „koks atsakymas?“ klausi „papasakok, kaip mąstai, ir tada duok atsakymą“.
Pagalvok apie tai kaip apie prašymą bendradarbiui parodyti darbą. Jei kas nors duoda rekomendaciją be jokių paaiškinimų, negali pasakyti, ar jis tikrai apgalvojo, ar tiesiog spėjo. Bet jei paaiškina svarstymą — „apsvarsčiau X, atmečiau Y dėl Z, todėl priėjau šios išvados“ — gali pastebėti logikos spragas.
Tas pats principas galioja DI. Kai priverti jį suformuluoti tarpinius žingsnius, įvyksta du dalykai:
DI pats pagauna savo klaidas svarstymo viduryje
Tu matai, kur nuėjo logika, jei atsakymas pasirodo netikęs
Kodėl DI praleidžia žingsnius (ir suklysta)
Štai ko dauguma žmonių nesuvokia: DI modeliai iš tiesų „nemąsto“ taip, kaip žmonės. Jie tiesiog ieško šablonų milijarduose teksto pavyzdžių, kad nuspėtų, koks žodis turėtų eiti toliau. Kai uždedi tiesų klausimą, jie šoka prie statistiškai labiausiai tikėtino atsakymo.
Paprastiems klausimams to pakanka. „Kokia Prancūzijos sostinė?“ samprotavimo nereikia — DI šį klausimą su atsakymu yra matęs kartu milijonus kartų.
Bet visur, kur reikia tikros logikos — palyginti variantus, pasverti kompromisus, spręsti kelių žingsnių uždavinius — šablonų atpažinimas griūva. DI pasirenka atsakymą, kuris skamba teisingai, bet nepatikrina, ar jis tikrai yra teisingas.
Minčių grandinės promptas šį trumpąjį kelią nukerta. Paprašęs DI samprotauti garsiai, priverti jį generuoti tarpinius žingsnius — o tie žingsniai apriboja, koks gali būti galutinis atsakymas. Sunkiau prieiti klaidingos išvados, kai tenka parodyti kelią, kuriuo prie jos atėjai.
Palyginimas: DI šokantis tiesiai prie atsakymo prieš DI, samprotaujantį žingsniais prieš atsakydamas
Paprasčiausias būdas pritaikyti minčių grandinę
Lengviausia versija nereikalauja jokių paruošimų. Tiesiog pridėk vieną iš šių frazių prompto pabaigoje:
„Pamąstykime žingsnis po žingsnio.“
„Papasakok, kaip samprotauji.“
„Paaiškink savo mąstymą prieš pateikdamas galutinį atsakymą.“
„Išskirstyk tai į žingsnius.“
Tyrėjai išsiaiškino, kad „pamąstykime žingsnis po žingsnio“ jų testuose veikė geriausiai, o vėlesnis tyrimas atrado dar tikslesnę formuluotę: „pamąstykime tai žingsnis po žingsnio, kad būtume tikri dėl atsakymo“.
Štai kaip tai atrodo praktikoje. Tarkim, sprendi, ar priimti darbo pasiūlymą.
Be minčių grandinės:
Ar priimti darbo pasiūlymą, kuris moka 20 % daugiau, bet reikia persikelti į miestą, kuriame pragyvenimo išlaidos 40 % didesnės?
DI greičiausiai paleis greitą „taip“ arba „ne“, paremtą paviršutinišku šablonų atitikimu.
Su minčių grandine:
Ar priimti darbo pasiūlymą, kuris moka 20 % daugiau, bet reikia persikelti į miestą, kuriame pragyvenimo išlaidos 40 % didesnės?
Pamąstykime tai žingsnis po žingsnio, įvertindami finansines pasekmes, gyvenimo kokybės veiksnius ir poveikį karjerai prieš darant išvadą.
Dabar DI po vieną išskaidys kiekvieną veiksnį, suskaičiuos, ar 20 % didesnis atlyginimas padengia 40 % didesnes išlaidas, apsvarstys, ką laimi ar pralaimi, ir duos pagrįstą rekomendaciją.
Few-shot CoT: parodyk DI, kaip mąstyti
Frazė „pamąstykime žingsnis po žingsnio“ vadinama zero-shot CoT — neduodi jokių pavyzdžių. Daugelyje situacijų ji veikia gerai, bet sudėtingoms ar specifinėms užduotims geresnių rezultatų gausi parodydamas norimą samprotavimo modelį.
Tai vadinama few-shot CoT — į promptą įdedi vieną ar du jau išspręstus pavyzdžius, kurie DI parodo, kaip tiksliai turėtų mąstyti panašias problemas.
Štai šablonas verslo sprendimams analizuoti:
Reikia pagalbos vertinant variantus. Štai kaip noriu, kad samprotautum kiekvienu atveju:
Pavyzdys:
Klausimas: Ar pereiti nuo mėnesinio prie metinio mokėjimo plano?
1 žingsnis – Pagrindiniai veiksniai: pinigų srauto nuspėjamumas, klientų atsisakymo rizika, kainodaros psichologija.
2 žingsnis – Kiekvieno veiksnio analizė:
- Pinigų srautas: metinis planas duoda pajamas iš anksto, pagerina nuspėjamumą
- Atsisakymo rizika: metiniai klientai išeina rečiau
- Kainodara: galim siūlyti nuolaidą metiniam planui ir vis tiek nepralaimėti
3 žingsnis – Kompromisų svėrimas: didžiausias minusas — didesnis trintis registruojantis naujiems vartotojams.
4 žingsnis – Išvada: taip, bet siūlyti abu variantus, metinį su 15 % nuolaida.
Dabar tą pačią samprotavimo struktūrą pritaikyk mano klausimui:
{{question}}
Pavyzdys neturi tiksliai atitikti tavo klausimo — pakanka, kad parodytų norimą samprotavimo struktūrą. DI šabloną pritaikys tavo konkrečiai situacijai.
Kada minčių grandinė tikrai padeda (ir kada – ne)
CoT promptai nėra stebuklinga lazdelė kiekvienai DI sąveikai. Vartono mokyklos tyrimas parodė, kad, nors sunkiose užduotyse jie pagerina rezultatus, lengvuose klausimuose tikslumas net gali nukristi — atsiranda nereikalingas sudėtingumas.
Naudok minčių grandinę, kai:
Lygini kelis variantus arba sveri kompromisus
Užduotis reikalauja kelių žingsnių samprotavimo ar skaičiavimų
Reikia diagnozuoti ar išspręsti problemą
Atsakymas reikalauja priežasties ir pasekmės analizės
Nori suprasti DI samprotavimą, ne tik gauti atsakymą
Praleisk minčių grandinę, kai:
Klausi paprasto fakto ar apibrėžimo
Reikia kūrybos — idėjų generavimo, rašymo
Nori santraukos arba vertimo
Greitis svarbiau už tikslumą
Užduotis nereikalauja loginio samprotavimo
Dar viena pastaba: CoT mažiau efektyvus su mažesniais DI modeliais. Pirminis „Google“ tyrimas parodė, kad reikšmingi pagerinimai pasirodo tik modeliuose su 100 ir daugiau milijardų parametrų. Su šiuolaikiniais vartotojų įrankiais kaip ChatGPT-4, Claude ir Gemini esi tame intervale. Bet jei naudoji senesnį ar mažesnį modelį, rezultatai gali svyruoti.
5 paruošti CoT promptai realiam darbui
Štai paruošti promptai, kuriuos gali pradėti naudoti šiandien. Kiekviename jau įdėta minčių grandinės struktūra.
1. Sprendimo analizė
Padėk man nuspręsti: {{decision_to_make}}
Pamąstyk tai žingsnis po žingsnio:
1. Išvardink pagrindinius veiksnius, į kuriuos turėčiau atsižvelgti
2. Įvertink, kaip kiekvienas variantas pagal juos atsiskleidžia
3. Įvardink pagrindines rizikas ir kompromisus
4. Duok rekomendaciją su pagrindimu
Būk konkretus ir remkis mano realia situacija, ne bendrais patarimais.
2. Privalumų ir trūkumų palyginimas
Palygink šiuos variantus: {{option_1}} prieš {{option_2}}
Pamąstyk sistemingai:
1. Pirmiausia įvardink 5 kriterijus, kurie šio tipo sprendimui svarbiausi
2. Įvertink kiekvieną variantą pagal kiekvieną kriterijų
3. Atkreipk dėmesį į esminius minusus arba būtinybes
4. Pasverk bendrus kompromisus
5. Duok aiškią rekomendaciją
Netiesiog vardink privalumus ir trūkumus — iš tikrųjų pagrįsk, kurie veiksniai svarbesni ir kodėl.
3. Pagrindinės priežasties analizė
Padėk man išsiaiškinti, kodėl tai vyksta: {{problem_description}}
Naudok šį samprotavimo procesą:
1. Pasakyk, kas iš tikrųjų vyksta ir kas turėtų vykti
2. Išvardink visas galimas priežastis (net mažai tikėtinas)
3. Kiekvienai priežasčiai apsvarstyk, kokie įrodymai ją patvirtintų ar atmestų
4. Remdamasis turima informacija, įvardink labiausiai tikėtiną pagrindinę priežastį
5. Pasiūlyk, kaip tai patikrinti ir ką su tuo daryti
4. Plano sudarymas žingsnis po žingsnio
Reikia {{goal}}.
Išskaidyk tai į žingsnius:
1. Pirmiausia – kas turi įvykti prieš viską (būtinos sąlygos)
2. Tada nubrėžk pagrindinius etapus ar kontrolinius taškus
3. Kiekvienam etapui įvardink konkrečius veiksmus
4. Pažymėk priklausomybes (kas turi įvykti prieš ką)
5. Paminėk galimas kliūtis ir kaip jas spręsti
Būk konkretus — duok veiksmus, kuriuos galima atlikti, ne miglotus patarimus.
5. Sudėtingo klausimo analizė
{{complex_question}}
Prieš atsakydamas, atidžiai pasvarstyk:
1. Suformuluok, ko šis klausimas iš tikrųjų klausia
2. Įvardink prielaidas, kurios slypi klausime
3. Apsvarstyk pagrindinius veiksnius, kurie turi įtakos atsakymui
4. Pasamprotauk apie kiekvieną veiksnį
5. Tada duok atsakymą su jį pagrindžiančiu samprotavimu
Jei yra realus neapibrėžtumas, pripažink jį, o ne apsimesk tikru.
Visi šie promptai sukurti pagal tą patį šabloną: pasakai, ko nori, ir aiškiai aprašai, kokiu samprotavimo keliu DI turi eiti. Struktūra veda jį per nuoseklią analizę, o ne leidžia pulti prie išvadų.
Prompto šablono kortelė su kintamųjų laukais, kurie pritaikomi skirtingoms užduotims
Jei tokius promptus naudoji vėl ir vėl — kaskart pakeisdamas sprendimą, problemą ar klausimą — įrankis kaip PromptNest leidžia juos išsaugoti su jau įdėtais {{kintamaisiais}}. Kai prireikia, tiesiog užpildai laukus ir nukopijuoji visą promptą.
Kai samprotavimas pakrypsta ne ta linkme
Kartais panaudosi minčių grandinę, DI parodys žingsnius… ir vis tiek prieis klaidingos išvados. Štai kaip su tuo elgtis.
Samprotavimas atrodo logiškas, bet išvada klaidinga. Greičiausiai DI rėmėsi klaidinga prielaida. Paklausk: „Kokias prielaidas darai? Išvardink jas aiškiai.“ Klaida dažniausiai slypi neišsakytoje pradinėje sąlygoje, ne logikoje.
DI praleido svarbius veiksnius. Atsakyk: „Neapsvarstei {{factor}}. Kaip tai pakeičia analizę?“ DI įtrauks naują informaciją ir dažnai peržiūrės išvadą.
Samprotavimas eina ratu arba miglotas. Paprašyk konkretumo: „2 žingsnyje rašai, kad tai gali būti rizikinga. Apie kokias konkrečiai rizikas kalbi ir kaip jas pamatuotum?“ Reikalavimas konkretumo iškart parodo neapibrėžtą mąstymą.
Įtari, kad DI per daug pasitiki savimi. Pabandyk: „Pavaidink advokatą prieš save. Koks stipriausias argumentas prieš šią išvadą?“ Tai dažnai išryškina silpnybes, kurias DI iš pradžių pridengė.
Minčių grandinės tikslas — ne vien gauti geresnius atsakymus, bet padaryti DI samprotavimą matomą, kad galėtum pastebėti ir ištaisyti klaidas. Pirmąjį atsakymą laikyk atspirties tašku, ne galutiniu rezultatu.
Pradėk naudoti minčių grandinę šiandien
Nereikia iš galvos mokytis technikų ar vykdyti sudėtingų metodikų. Užtenka pagrindinės minties: kai nori, kad DI iš tikrųjų mąstytų, o ne spėliotų, paprašyk parodyti darbą.
Pradėk nuo vienos užduoties, kuriai reguliariai naudoji DI — tos, kurioje yra analizės, palyginimo ar problemų sprendimo. Pridėk „pamąstykime tai žingsnis po žingsnio“ ir žiūrėk, kaip pasikeičia atsakymas. Pamatęs skirtumą, greitai pradėsi atpažinti, kada tą reikia daryti.
Jei nori susikurti samprotavimo promptų biblioteką, gali laikyti juos bet kur — užrašų programėlėje, dokumente, kur jau dirbi. Arba, jei nori specialiai tam skirto įrankio, PromptNest yra lietuviams patogi native Mac programa ($19.99 vienkartinis mokestis Mac App Store, jokių prenumeratų, jokios paskyros, viskas veikia lokaliai), kuri laiko tavo promptus tvarkingus su jau paruoštais kintamaisiais. Bet kuriuo atveju — svarbiausia turėti geriausius promptus po ranka, o ne palaidotus senose pokalbių istorijose.
Skirtumas tarp DI, kuris padeda mąstyti, ir DI, kuris tik skamba užtikrintai, dažnai telpa į keturis žodžius: „pamąstykime žingsnis po žingsnio“.