Blog पर वापस जाएँ

Chain-of-Thought प्रॉम्प्टिंग: AI से चरण-दर-चरण सोच

वो आसान प्रॉम्प्टिंग तकनीक सीखें जिसने रीज़निंग टास्क पर AI की सटीकता 18% से 79% तक पहुँचा दी — रोज़मर्रा के कामों के लिए कॉपी-पेस्ट उदाहरणों के साथ।

Chain-of-Thought प्रॉम्प्टिंग: AI से चरण-दर-चरण सोच
तुमने ChatGPT से कोई ऐसा सवाल पूछा जिसमें थोड़ा सोचना ज़रूरी था — शायद दो विकल्पों की तुलना, किसी फैसले का विश्लेषण, या कोई मल्टी-स्टेप समस्या। AI ने पल भर में पूरे विश्वास के साथ जवाब दे दिया। दिक्कत बस इतनी थी कि वो जवाब पूरी तरह गलत था।
ये जितना तुम सोचते हो उससे कहीं ज़्यादा होता है। AI असिस्टेंट को सच में सोचने के लिए नहीं, बल्कि भरोसे लायक सुनाई देने वाले जवाब बनाने के लिए ट्रेन किया जाता है। जब तुम कोई जटिल सवाल सीधे-सीधे पूछते हो, तो AI अक्सर सोचने का हिस्सा छोड़कर सीधे जवाब पर कूद जाता है — कई बार पूरे आत्मविश्वास के साथ बहुत बड़ी गलती करता है।
इसका एक तोड़ है। 2022 में Google के रिसर्चरों ने पाया कि प्रॉम्प्ट में सिर्फ़ एक वाक्य जोड़ने से — "Let's think step by step" — गणित की समस्याओं पर सटीकता 17.7% से बढ़कर 78.7% हो गई। ये कोई टाइपो नहीं है। एक वाक्य ने AI को चार गुना ज़्यादा सटीक बना दिया।
इस तकनीक को chain-of-thought प्रॉम्प्टिंग कहते हैं, और ये इसलिए काम करती है क्योंकि AI को सीधे नतीजे पर कूदने के बजाय अपना काम दिखाने पर मजबूर करती है। यहाँ बता रहे हैं इसे असली कामों में कैसे इस्तेमाल करना है — सिर्फ़ गणित के सवालों में नहीं।

Chain-of-Thought प्रॉम्प्टिंग क्या है?

Chain-of-thought (CoT) प्रॉम्प्टिंग ठीक वही है जो नाम से लगती है: तुम AI से कहते हो कि अंतिम जवाब देने से पहले अपनी सोच को चरण-दर-चरण समझाए। "जवाब क्या है?" पूछने के बजाय तुम पूछते हो "पहले अपनी सोच बताओ, फिर जवाब दो।"
इसे ऐसे समझो जैसे किसी सहकर्मी से अपना काम दिखाने को कहना। अगर कोई बिना समझाए सिर्फ़ सिफ़ारिश दे दे, तो तुम्हें पता नहीं चलेगा कि उसने सच में सोचा है या बस अंदाज़ा लगाया है। लेकिन अगर वो अपना तर्क समझाए — "मैंने X देखा, Z की वजह से Y को रद्द किया, तब इस नतीजे पर पहुँचा" — तो तुम उसकी सोच में किसी भी कमज़ोर कड़ी को पकड़ सकते हो।
AI के साथ भी यही होता है। जब तुम उसे बीच के कदम बोलने पर मजबूर करते हो, तो दो चीज़ें होती हैं:
  1. AI सोचने के बीच में अपनी ही गलतियाँ पकड़ लेता है
  2. अगर जवाब गलत भी हो, तो तुम्हें ठीक से दिख जाता है कि तर्क कहाँ बिगड़ा

AI कदम क्यों छोड़ देता है (और गलतियाँ क्यों करता है)

एक बात ज़्यादातर लोग नहीं समझते: AI मॉडल असल में इंसानों की तरह "सोच" नहीं रहे। वो अरबों टेक्स्ट उदाहरणों से पैटर्न मिला रहे हैं ताकि अंदाज़ा लगा सकें कि अगला शब्द क्या होगा। जब तुम सीधा सवाल पूछते हो, तो वो आँकड़ों के हिसाब से सबसे संभावित जवाब पर कूद जाते हैं।
आसान सवालों के लिए ये तरीका ठीक काम करता है। "फ्रांस की राजधानी क्या है?" में सोचने की ज़रूरत नहीं — AI ने ये सवाल और जवाब करोड़ों बार साथ देखा है।
लेकिन जहाँ सच में तर्क की ज़रूरत हो — विकल्पों की तुलना, ट्रेडऑफ़ का विश्लेषण, मल्टी-स्टेप समस्याएँ हल करना — वहाँ ये पैटर्न-मैचिंग वाला तरीका बिखर जाता है। AI ऐसा जवाब चुन लेता है जो सुनने में सही लगे, बिना ये जाँचे कि वो सच में है भी सही या नहीं।
Chain-of-thought प्रॉम्प्टिंग इस शॉर्टकट को रोक देती है। AI से ज़ोर से सोचने को कहकर तुम उसे बीच के कदम बनाने पर मजबूर करते हो — और वो कदम तय कर देते हैं कि अंतिम जवाब क्या हो सकता है। जब रास्ता दिखाना पड़े, तो गलत मंज़िल पर पहुँचना मुश्किल हो जाता है।
AI सीधे जवाब पर कूदते हुए बनाम AI के सोच के कदमों के साथ जवाब देते हुए की तुलना
AI सीधे जवाब पर कूदते हुए बनाम AI के सोच के कदमों के साथ जवाब देते हुए की तुलना

Chain-of-Thought इस्तेमाल करने का सबसे आसान तरीका

सबसे सरल तरीका शून्य सेटअप माँगता है। बस अपने प्रॉम्प्ट के अंत में इनमें से कोई एक वाक्य जोड़ दो:
  • "Let's think step by step."
  • "अपनी सोच चरण-दर-चरण बताओ।"
  • "अंतिम जवाब देने से पहले अपना तर्क समझाओ।"
  • "इसे चरण-दर-चरण तोड़कर बताओ।"
रिसर्चरों ने पाया कि उनके टेस्ट में "Let's think step by step" सबसे अच्छा काम करता है, हालाँकि आगे की रिसर्च में एक और बेहतर वाक्य मिला: "Let's work this out in a step by step way to be sure we have the right answer."
व्यवहार में ये कैसा दिखता है, समझो। मान लो तुम तय कर रहे हो कि किसी जॉब ऑफ़र को मानना चाहिए या नहीं।
Chain-of-thought के बिना:

क्या मुझे एक जॉब ऑफ़र स्वीकार करना चाहिए जो 20% ज़्यादा सैलरी देती है, लेकिन ऐसे शहर में शिफ़्ट होना पड़ेगा जहाँ रहने का खर्च 40% ज़्यादा है?


AI शायद सतही पैटर्न-मैचिंग के आधार पर झट से "हाँ" या "नहीं" बोल देगा।
Chain-of-thought के साथ:

क्या मुझे एक जॉब ऑफ़र स्वीकार करना चाहिए जो 20% ज़्यादा सैलरी देती है, लेकिन ऐसे शहर में शिफ़्ट होना पड़ेगा जहाँ रहने का खर्च 40% ज़्यादा है?

इस पर चरण-दर-चरण सोचो — पहले फ़ाइनेंशियल असर, फिर लाइफ़स्टाइल पर असर, फिर करियर पर असर देखो, और तब निष्कर्ष पर पहुँचो।


अब AI हर पहलू को अलग करेगा, हिसाब लगाएगा कि 20% बढ़ी सैलरी 40% बढ़े खर्च को कवर करती है या नहीं, सोचेगा कि तुम क्या पा रहे हो और क्या खो रहे हो, और एक तर्कसंगत सिफ़ारिश देगा।

Few-Shot CoT: AI को सोचने का तरीका दिखाओ

"Let's think step by step" वाले तरीके को zero-shot CoT कहते हैं क्योंकि तुम कोई उदाहरण नहीं दिखा रहे। ये कई जगह अच्छा काम करता है, लेकिन जटिल या किसी ख़ास क्षेत्र के कामों में, अगर तुम वो सोचने का पैटर्न दिखा दो जो तुम चाहते हो, तो नतीजे और बेहतर हो सकते हैं।
इसे few-shot CoT कहते हैं — तुम एक-दो हल किए हुए उदाहरण देते हो जो AI को ठीक-ठीक दिखाते हैं कि ऐसी समस्याओं पर तर्क कैसे करना है।
बिज़नेस से जुड़े फ़ैसलों के विश्लेषण के लिए एक टेम्पलेट:

मुझे विकल्पों के बीच चुनने में मदद चाहिए। मैं चाहता हूँ कि तुम हर विकल्प पर ऐसे सोचो:

उदाहरण:
सवाल: क्या हमें मासिक बिलिंग से सालाना बिलिंग पर शिफ़्ट होना चाहिए?

कदम 1 - मुख्य पहलू पहचानो: कैश फ़्लो की पक्की भविष्यवाणी, कस्टमर churn का जोखिम, प्राइसिंग साइकोलॉजी।

कदम 2 - हर पहलू का विश्लेषण:
- कैश फ़्लो: सालाना बिलिंग से रेवेन्यू पहले मिलता है, predictability बढ़ती है
- Churn जोखिम: सालाना भुगतान करने वाले कस्टमर कम छोड़ते हैं
- प्राइसिंग: हम सालाना प्लान पर डिस्काउंट दे सकते हैं बिना नुक़सान के

कदम 3 - ट्रेडऑफ़ तौलो: सबसे बड़ी कमज़ोरी ये कि नए साइनअप के लिए रुकावट बढ़ जाती है।

कदम 4 - निष्कर्ष: हाँ, लेकिन दोनों विकल्प रखो — सालाना पर 15% डिस्काउंट के साथ।

अब इसी तर्क-संरचना को मेरे सवाल पर लगाओ:
{{question}}
उदाहरण को तुम्हारे सवाल से ठीक मिलना ज़रूरी नहीं — उसे बस वो सोचने का ढाँचा दिखाना चाहिए जो तुम चाहते हो। AI पैटर्न को तुम्हारी ख़ास स्थिति के हिसाब से ढाल लेगा।

Chain-of-Thought कब काम आती है (और कब नहीं)

CoT प्रॉम्प्टिंग हर AI बातचीत का जादुई इलाज नहीं है। Wharton की एक रिसर्च में पाया गया कि भले ये कठिन समस्याओं पर परफ़ॉर्मेंस सुधारती है, आसान सवालों पर ग़ैरज़रूरी पेचीदगी डालकर सटीकता घटा भी सकती है।
Chain-of-thought तब इस्तेमाल करो जब:
  • तुम कई विकल्पों की तुलना कर रहे हो या ट्रेडऑफ़ तौल रहे हो
  • काम में मल्टी-स्टेप तर्क या हिसाब-किताब है
  • तुम्हें किसी समस्या को ट्रबलशूट या डायग्नोज़ करना है
  • जवाब कारण और प्रभाव के विश्लेषण पर टिका है
  • तुम सिर्फ़ जवाब नहीं, AI की सोच भी समझना चाहते हो
Chain-of-thought छोड़ दो जब:
  • तुम सिर्फ़ तथ्य या परिभाषा पूछ रहे हो
  • तुम्हें ब्रेनस्टॉर्मिंग या लेखन जैसा क्रिएटिव आउटपुट चाहिए
  • तुम्हें सारांश या अनुवाद चाहिए
  • सटीकता से ज़्यादा रफ़्तार ज़रूरी है
  • काम में तार्किक रीज़निंग है ही नहीं
एक और बात: छोटे AI मॉडल के साथ CoT प्रॉम्प्टिंग कम असरदार है। Google की मूल रिसर्च में पाया गया कि असली सुधार सिर्फ़ 100 अरब+ पैरामीटर वाले मॉडल में दिखे। आज के कंज़्यूमर AI टूल जैसे ChatGPT-4, Claude और Gemini इसी रेंज में हैं। लेकिन अगर तुम पुराने या छोटे मॉडल इस्तेमाल कर रहे हो, तो नतीजे अलग हो सकते हैं।

असली काम के लिए 5 तैयार-मिले CoT प्रॉम्प्ट

नीचे कॉपी-पेस्ट प्रॉम्प्ट हैं जो तुम आज से इस्तेमाल कर सकते हो। हर एक में chain-of-thought वाला ढाँचा पहले से जुड़ा है।

1. फ़ैसले का विश्लेषण

मुझे फ़ैसला करने में मदद चाहिए: {{decision_to_make}}

इस पर चरण-दर-चरण सोचो:
1. वो मुख्य पहलू बताओ जिन पर मुझे ध्यान देना चाहिए
2. हर विकल्प इन पहलुओं पर कैसा परफ़ॉर्म करता है, उसका विश्लेषण करो
3. मुख्य जोखिम और ट्रेडऑफ़ पहचानो
4. तर्क के साथ अपनी सिफ़ारिश दो

ख़ास रहो और मेरी असली स्थिति के हिसाब से बात करो, सामान्य सलाह मत दो।

2. फ़ायदे-नुक़सान की तुलना

इन विकल्पों की तुलना करो: {{option_1}} बनाम {{option_2}}

इस पर ढंग से सोचो:
1. पहले 5 मानदंड पहचानो जो ऐसे फ़ैसले के लिए सबसे ज़्यादा मायने रखते हैं
2. हर विकल्प को हर मानदंड पर परखो
3. अगर कोई dealbreaker या must-have हो तो नोट करो
4. कुल मिलाकर ट्रेडऑफ़ तौलो
5. साफ़ सिफ़ारिश दो

सिर्फ़ pros और cons की लिस्ट मत बनाओ — तर्क करके बताओ कि कौन-से पहलू ज़्यादा मायने रखते हैं और क्यों।

3. मूल कारण विश्लेषण

मुझे समझने में मदद करो कि ऐसा क्यों हो रहा है: {{problem_description}}

इस तर्क-प्रक्रिया से जाओ:
1. साफ़ करो कि असल में क्या हो रहा है बनाम क्या होना चाहिए था
2. सारे संभावित कारण लिखो (असंभव लगने वाले भी)
3. हर कारण के लिए सोचो कि क्या सबूत उसे साबित या ख़ारिज करेगा
4. उपलब्ध जानकारी के आधार पर सबसे संभावित मूल कारण पहचानो
5. बताओ इसकी पुष्टि कैसे करें और आगे क्या करें

4. चरण-दर-चरण योजना

मुझे {{goal}} करना है।

इसे चरणों में तोड़ो:
1. पहले बताओ कि किसी भी काम से पहले क्या ज़रूरी है (prerequisites)
2. फिर मुख्य phases या milestones का नक़्शा बनाओ
3. हर phase के लिए ज़रूरी ख़ास कदम लिखो
4. कोई dependency हो तो flag करो (कौन-सा काम किसके बाद ही हो सकता है)
5. संभावित रुकावटें और उनसे निपटने का तरीका बताओ

ठोस रहो — मुझे actionable कदम दो, धुँधली सलाह नहीं।

5. जटिल सवाल का विश्लेषण

{{complex_question}}

जवाब देने से पहले इस पर ढंग से सोचो:
1. साफ़ करो कि ये सवाल असल में क्या पूछ रहा है
2. सवाल में जो भी पूर्व-धारणाएँ छुपी हैं उन्हें पहचानो
3. वो मुख्य पहलू देखो जो जवाब को प्रभावित करते हैं
4. हर पहलू पर तर्क करो
5. फिर अपना जवाब दो — साथ में वो तर्क भी जो उसे टिकाते हैं

अगर सच में कुछ अनिश्चित हो, तो स्वीकार करो; पक्के होने का दिखावा मत करो।
इन सभी प्रॉम्प्ट का पैटर्न एक जैसा है: पहले बताओ क्या चाहिए, फिर साफ़-साफ़ बताओ कि AI को किस तर्क-प्रक्रिया से गुज़रना है। ये ढाँचा AI को सीधे नतीजे पर कूदने नहीं देता, बल्कि गहरे विश्लेषण की तरफ़ ले जाता है।
वेरिएबल प्लेसहोल्डर वाला एक प्रॉम्प्ट टेम्पलेट कार्ड जिसे अलग-अलग कामों के लिए कस्टमाइज़ किया जा रहा है
वेरिएबल प्लेसहोल्डर वाला एक प्रॉम्प्ट टेम्पलेट कार्ड जिसे अलग-अलग कामों के लिए कस्टमाइज़ किया जा रहा है
अगर तुम ख़ुद को ये प्रॉम्प्ट बार-बार इस्तेमाल करते हुए पाओ — हर बार फ़ैसले, समस्याएँ या सवाल बदलते हुए — तो PromptNest जैसा टूल इन्हें {{variables}} के साथ सेव कर देता है। ज़रूरत पड़ने पर बस ख़ाली जगहें भरो और पूरा प्रॉम्प्ट कॉपी कर लो।

ट्रबलशूटिंग: जब तर्क पटरी से उतर जाए

कभी-कभी chain-of-thought प्रॉम्प्टिंग के बाद भी AI अपने कदम तो दिखाएगा... लेकिन फिर भी ग़लत नतीजे पर पहुँच जाएगा। ऐसे हालात में क्या करना है, यहाँ देखो।
तर्क ठीक लगता है पर निष्कर्ष ग़लत है। हो सकता है AI ने कोई ग़लत पूर्व-धारणा से शुरुआत की हो। पूछो: "तुम यहाँ कौन-सी पूर्व-धारणाएँ बना रहे हो? साफ़-साफ़ लिस्ट करो।" अक्सर गड़बड़ी तर्क में नहीं, बल्कि किसी अनकही धारणा में होती है।
AI ने ज़रूरी पहलू छोड़ दिए। जवाब दो: "तुमने {{factor}} पर ध्यान नहीं दिया। उससे तुम्हारा विश्लेषण कैसे बदलता है?" AI नई जानकारी जोड़कर अक्सर अपना नतीजा बदल देगा।
तर्क घूम-फिरकर वही दोहरा रहा है या धुँधला है। ज़्यादा बारीकी माँगो: "कदम 2 में तुमने कहा 'इसमें जोखिम हो सकता है।' कौन-से ख़ास जोखिम, और उन्हें कैसे माप सकते हैं?" ठोस ब्योरा माँगने पर धुँधली सोच पकड़ी जाती है।
तुम्हें लगता है AI ज़रूरत से ज़्यादा भरोसे में है। ये आज़माओ: "Devil's advocate बनो। इस निष्कर्ष के ख़िलाफ़ सबसे मज़बूत तर्क क्या है?" इससे अक्सर वो कमज़ोरियाँ सामने आ जाती हैं जिन्हें AI ने पहली बार में चुपके से दबा दिया था।
Chain-of-thought प्रॉम्प्टिंग का मक़सद सिर्फ़ बेहतर जवाब पाना नहीं है — मक़सद ये है कि AI की सोच दिख जाए ताकि तुम ग़लतियाँ पकड़कर सुधार सको। पहले जवाब को अंतिम मत समझो; उसे शुरुआत समझो।

Chain-of-Thought आज से इस्तेमाल करना शुरू करो

तुम्हें कोई तकनीक रटने या भारी-भरकम फ़्रेमवर्क पर चलने की ज़रूरत नहीं। बस एक बात याद रखो: जब तुम चाहते हो कि AI सच में सोचे, अंदाज़ा न लगाए, तो उससे अपना काम दिखाने को कहो।
एक ऐसे काम से शुरू करो जिसके लिए तुम अक्सर AI का सहारा लेते हो — कुछ ऐसा जिसमें विश्लेषण, तुलना या ट्रबलशूटिंग हो। उसमें "इस पर चरण-दर-चरण सोचो" जोड़ दो और देखो जवाब कैसे बदलता है। एक बार फ़र्क़ दिख गया, तो तुम्हें ख़ुद-ब-ख़ुद समझ आ जाएगा कि कब इसका इस्तेमाल करना है।
अगर तुम ऊपर बताए जैसे रीज़निंग प्रॉम्प्ट की एक लाइब्रेरी बनाना चाहते हो, तो उन्हें कहीं भी सेव कर सकते हो — कोई नोट ऐप, कोई Google Doc, जो भी पहले से इस्तेमाल कर रहे हो। और अगर इसी काम के लिए बना कोई टूल चाहो, तो PromptNest एक नेटिव Mac ऐप है ($19.99 में एक बार ख़रीदो, Mac App Store पर — कोई सब्सक्रिप्शन नहीं, कोई अकाउंट नहीं, सब कुछ लोकल चलता है) जो तुम्हारे प्रॉम्प्ट को वेरिएबल के साथ व्यवस्थित रखता है। तरीक़ा जो भी हो — असली बात ये है कि ज़रूरत के वक़्त तुम्हारे सबसे अच्छे प्रॉम्प्ट हाथ में हों, पुरानी चैट हिस्ट्री में दबे न रह जाएँ।
एक AI जो तुम्हें सोचने में मदद करता है, और एक AI जो बस आत्मविश्वास से बोलता है — दोनों के बीच का फ़र्क़ अक्सर इन छह शब्दों में सिमट जाता है: "इस पर चरण-दर-चरण सोचो।"