লং ডকুমেন্টের জন্য Claude বনাম ChatGPT: কনটেক্সট কে ভালো সামলায়?
বড় ডকুমেন্ট নিয়ে কাজ করার সময় Claude আর ChatGPT কেমন পারফর্ম করে — আসল কনটেক্সট উইন্ডোর সীমা, রিকল টেস্ট আর প্রম্পটিং কৌশলসহ একটা বাস্তব তুলনা।
ডাউনলোড ফোল্ডারে আপনার একটা ৫০ পৃষ্ঠার চুক্তি পড়ে আছে। অথবা একগাদা রিসার্চ পেপার, যেগুলো একটা রিপোর্টের জন্য মিলিয়ে গুছিয়ে আনতে হবে। পুরোটা AI চ্যাটে পেস্ট করে ৩৭ নম্বর পৃষ্ঠা নিয়ে একটা প্রশ্ন করলেন — উত্তর এলো বেশ আত্মবিশ্বাসী সুরে, কিন্তু আসল পয়েন্টটা যে মিস হয়েছে সেটা পরিষ্কার বোঝা যাচ্ছে।
Claude আর ChatGPT — দুজনেই বিশাল কনটেক্সট উইন্ডোর কথা বলে, লক্ষ লক্ষ টোকেন। কিন্তু একটা AI কতটুকু টেক্সট নিতে পারে আর প্রশ্নের উত্তর দেওয়ার সময় কতটুকু আসলে মনে রাখতে পারে — এই দুটো এক জিনিস না। লং ডকুমেন্টের সঙ্গে কাজ করার সময় এই পার্থক্যটাই সবচেয়ে বড় হয়ে দাঁড়ায়।
এই গাইডে দেখবো লং-ডকুমেন্ট কাজে দুটো টুল বাস্তবে কেমন পারফর্ম করে: লিগ্যাল কনট্র্যাক্ট, রিসার্চ পেপার, কোডবেস — সবই থাকছে। কোনো মার্কেটিং বুলি নেই, শুধু যেটা আসলে কাজ করে সেটাই।
কনটেক্সট উইন্ডোর সাইজই পুরো গল্প না কেন
কনটেক্সট উইন্ডো হলো এক কথোপকথনে একটা AI মডেল মোট কতটা টেক্সট প্রসেস করতে পারে তার পরিমাণ। মাপা হয় টোকেনে — মোটামুটি প্রতি টোকেনে ০.৭৫ শব্দ। ২ লক্ষ টোকেনের কনটেক্সট উইন্ডো মানে মডেলটা তত্ত্বগতভাবে প্রায় ১,৫০,০০০ শব্দ ধরে রাখতে পারে, অর্থাৎ মোটামুটি ৫০০ পৃষ্ঠার টেক্সট।
কিন্তু মার্কেটিংয়ে যেটা বলা হয় না সেটা হলো: কনটেক্সট ধারণক্ষমতা আর কনটেক্সট মনে রাখার ক্ষমতা — দুটো আলাদা ব্যাপার। মডেল হয়তো আপনার গোটা ২০০ পৃষ্ঠার ডকুমেন্ট নিয়ে নিল, কিন্তু এর মানে এই না যে ১ নম্বর পৃষ্ঠার মতো একই নির্ভুলতায় সে ৪৭ নম্বর পৃষ্ঠার একটা নির্দিষ্ট ডিটেইল মনে করতে পারবে।
ব্যাপারটা অনেকটা একবসায় একটা উপন্যাস পড়ার মতো। শুরু আর শেষটা স্পষ্ট মনে থাকে, কিন্তু মাঝখানটা একটু ঝাপসা হয়ে যায়। AI মডেলগুলোর ধরনটাও কাছাকাছি — আর আলাদা মডেল এই সমস্যাটা আলাদাভাবে সামলায়।
সংখ্যায় হিসাব: ২০২৬-এ Claude বনাম ChatGPT-র কনটেক্সট উইন্ডো
শুরু করা যাক একদম স্পেসিফিকেশন দিয়ে। এই সংখ্যাগুলো ২০২৬-এর শুরুর দিকের হিসাব অনুযায়ী:
Claude (Anthropic):
Claude Sonnet 4.5: স্ট্যান্ডার্ড ২০০K টোকেন, এন্টারপ্রাইজের জন্য বিটায় ১M টোকেন পর্যন্ত
Claude Opus 4.1: ২০০K টোকেন
Claude Haiku 4.5: ২০০K টোকেন
প্রতি রেসপন্সে সর্বোচ্চ আউটপুট: ৬৪K টোকেন
Claude.ai Enterprise: ৫০০K টোকেন কনটেক্সট উইন্ডো
ChatGPT (OpenAI):
ফ্রি টিয়ার: ৮K টোকেন
ChatGPT Plus: ৩২K টোকেন
ChatGPT Pro/Enterprise: ১২৮K টোকেন
GPT-5 API: ৪০০K টোকেন পর্যন্ত (২৭২K ইনপুট + ১২৮K আউটপুট)
GPT-4.1 API: ১M টোকেন পর্যন্ত (তবে ChatGPT ইন্টারফেসে নেই)
বাস্তব হিসেবে: Claude-এর পেইড প্ল্যান ব্যবহার করলে মোটামুটি ৫০০ পৃষ্ঠা পেস্ট করতে পারবেন। ChatGPT Plus-এ সেটা কমে দাঁড়ায় প্রায় ৪০ পৃষ্ঠায়। ChatGPT Pro-তে ১৬০ পৃষ্ঠার কাছাকাছি যাওয়া যায়।
ফারাকটা ছোট না। তবে শুধু কাঁচা ক্যাপাসিটি দিয়ে পুরো গল্প বোঝা যায় না।
নিডল ইন আ হেস্ট্যাক টেস্ট: কে বেশি ভালো মনে রাখে?
AI মডেলগুলো লং কনটেক্সটে কতটা ভালোভাবে তথ্য ধরে রাখতে পারে সেটা মাপতে গবেষকরা "নিডল ইন আ হেস্ট্যাক" নামের একটা বেঞ্চমার্ক ব্যবহার করেন। সেটআপটা সহজ: একটা বিশাল ডকুমেন্টের ("হেস্ট্যাক") কোথাও একটা র্যান্ডম তথ্য ("নিডল") লুকিয়ে রাখা হয়, তারপর মডেলকে সেটা বের করতে বলা হয়।
নিডল ইন হেস্ট্যাক টেস্টের ধারণার চিত্র — একটা লম্বা ডকুমেন্টের ভেতরে হাইলাইট করা একটা বাক্য দেখানো হয়েছে
মূল টেস্টে শত শত পৃষ্ঠার অপ্রাসঙ্গিক রচনার মধ্যে এমন একটা বাক্য লুকানো হয়েছিল: "সান ফ্রান্সিসকোয় করার সবচেয়ে ভালো কাজ হলো একটা স্যান্ডউইচ খাওয়া আর রোদ ঝলমলে দিনে ডলোরেস পার্কে বসা"। তারপর মডেলকে জিজ্ঞেস করা হয়: "সান ফ্রান্সিসকোয় করার সবচেয়ে ভালো কাজ কী?"
Claude 3-এর ফলাফল ছিল চমকপ্রদ। Anthropic-এর টেস্টিংয়ে Claude 3 Opus ৯৯%-এর বেশি রিট্রিভাল অ্যাকুরেসি অর্জন করেছিল — নিডলটা যেখানেই বসানো হোক, প্রায় নিখুঁত রিকল। এক বিখ্যাত ঘটনায় Claude আসলে ধরে ফেলেছিল যে টেস্টের বাক্যটা কৃত্রিমভাবে ঢোকানো — যারা টেস্ট করছিল, তাদেরকেই সে রীতিমতো ধরে ফেলেছিল।
আগের মডেলগুলোর একটা প্যাটার্ন ছিল: ডকুমেন্টের একদম শুরু আর শেষের দিকের তথ্য নির্ভুলভাবে মনে করতে পারত, কিন্তু মাঝখানের কনটেন্ট (বিশেষ করে ৫০-৭০% জায়গার আশেপাশের অংশ) প্রায়ই মিস হয়ে যেত। Claude 3 আর তার পরের ভার্সনগুলো এই সমস্যাটা মোটামুটি সমাধান করে ফেলেছে।
ChatGPT-র পারফরম্যান্স মডেলের ভার্সন আর ডকুমেন্টের দৈর্ঘ্যভেদে অনেক বদলায়। GPT-4-এর শুরুর টেস্টিংয়ে মাঝখানের রিকলে একই ধরনের সমস্যা দেখা গিয়েছিল, যদিও GPT-5 অনেকটাই উন্নত হয়েছে। তবে ChatGPT ইন্টারফেসে যেহেতু কনটেক্সট উইন্ডো ছোট (Plus-এ ৩২K, Pro-তে ১২৮K), সেহেতু রিকল ডিগ্রেডেশনের সুযোগই কম তৈরি হয় — এত টেক্সট তো আর আঁটেই না।
বাস্তব টেস্ট: লিগ্যাল কনট্র্যাক্ট রিভিউ
অ্যাবস্ট্র্যাক্ট বেঞ্চমার্ক কাজের, কিন্তু আসল ব্যাপার হলো এই টুলগুলো বাস্তব কাজে কেমন পারফর্ম করে। লিগ্যাল কনট্র্যাক্ট রিভিউয়ের কথাই ধরা যাক — লং-ডকুমেন্ট AI-এর একটা সাধারণ ব্যবহার।
কাজটা: ৪৫ পৃষ্ঠার একটা কমার্শিয়াল লিজ চুক্তি রিভিউ করা। আগাম বাতিলকরণ সংক্রান্ত সব উল্লেখ খুঁজে বের করা, বিরোধী ক্লজ চিহ্নিত করা আর বাড়িওয়ালার বাধ্যবাধকতাগুলো সারাংশ আকারে সাজানো।
Claude দিয়ে: পুরো চুক্তিটা একসঙ্গে পেস্ট করা যায়। ক্রস-রেফারেন্স Claude ভালোভাবে সামলায় — যখন সে বলে "যেমনটা সেকশন ৪.২-এ সংজ্ঞায়িত আছে", তখন সেকশন ৪.২-এ আসলে কী আছে সেটা সে রেফারেন্স করতে পারে। সেকশন ৭-এর মেইনটেন্যান্স বাধ্যবাধকতা আর একটা পরিশিষ্টে লুকানো একটা ব্যতিক্রমের মধ্যকার বিরোধ সে ধরে ফেলেছিল। বিশ্লেষণটা গোছানো এবং পূর্ণাঙ্গ ছিল।
ChatGPT Plus দিয়ে: ৩২K টোকেনে ৪৫ পৃষ্ঠার চুক্তি পুরোটা ঢুকবে না। চাঙ্কে ভেঙে দিতে হবে, যার মানে AI-র সেকশনগুলোর মধ্যে ক্রস-রেফারেন্স করার ক্ষমতা চলে যাবে। ChatGPT Pro-র ১২৮K এটা সামলাতে পারে, কিন্তু টেস্টিংয়ে দেখা গেছে এটা নির্দিষ্ট ক্লজের বিরোধ ধরার চেয়ে বরং সাধারণ সারাংশ দিতে বেশি ঝোঁকে।
লিগ্যাল কাজে বিজয়ী: Claude। বড় কনটেক্সট উইন্ডো আর ডকুমেন্টের বিভিন্ন অংশজুড়ে ভালো রিকল মিলে কনট্র্যাক্ট রিভিউ, লিগ্যাল রিসার্চ আর কমপ্লায়েন্স যাচাইয়ের কাজে এটাকে বেশ এগিয়ে রাখে।
বাস্তব টেস্ট: রিসার্চ পেপার সিনথেসিস
কাজটা: রিমোট ওয়ার্কের প্রোডাক্টিভিটির ওপর প্রভাব বিষয়ক পাঁচটা একাডেমিক পেপার (মোট প্রায় ৮০ পৃষ্ঠা) থেকে ফাইন্ডিংস মিলিয়ে আনা। ঐকমত্যের জায়গা, পরস্পরবিরোধী জায়গা আর গবেষণার ফাঁকগুলো চিহ্নিত করা।
Claude দিয়ে: পাঁচটা পেপারই কনটেক্সট উইন্ডোতে আরাম করে এঁটে গেছে। Claude একটা গোছানো সিনথেসিস তৈরি করেছে — কোন দাবিটা কোন পেপার থেকে এসেছে সেটা ট্র্যাক করেছে, স্টাডি A কোথায় স্টাডি C-র সঙ্গে বিরোধে গেছে সেটা ধরেছে আর পদ্ধতিগত যেসব পার্থক্য বিরোধগুলোর কারণ হতে পারে সেগুলো চিহ্নিত করেছে। গোটা কর্পাসজুড়ে ধারাবাহিকতা ধরে রাখতে পেরেছে।
ChatGPT দিয়ে: ChatGPT Pro দিয়েও পাঁচটা পেপার আঁটানো বেশ টাইট। সিনথেসিস তুলনামূলক সাধারণ ছিল আর মাঝে মাঝে ভিন্ন পেপারের ফাইন্ডিংস মিলিয়ে ফেলেছে। তবে ChatGPT-র ওয়েব সার্চ ইন্টিগ্রেশন বাড়তি কনটেক্সট আর মূল পেপারে না থাকা আরও সাম্প্রতিক স্টাডি টেনে আনতে পেরেছে — যেসব রিসার্চে সাম্প্রতিকতা দরকার, সেখানে এটা সত্যিকারের সুবিধা।
বিজয়ী: শুধু সিনথেসিসে Claude, ওয়েব সোর্স দরকার এমন রিসার্চে ChatGPT। একটা ব্যবহারিক ওয়ার্কফ্লো: ChatGPT-র ওয়েব সার্চ দিয়ে সাম্প্রতিক সোর্স জোগাড় করুন, তারপর গভীর বিশ্লেষণের জন্য পুরো সংগ্রহটা Claude-কে দিন।
বাস্তব টেস্ট: কোড রিপোজিটরি বিশ্লেষণ
কাজটা: একটা মাঝারি সাইজের কোডবেস (৫০টা ফাইলে প্রায় ১৫,০০০ লাইন) বিশ্লেষণ করে অথেন্টিকেশন ফ্লো বোঝা আর সম্ভাব্য সিকিউরিটি ইস্যু চিহ্নিত করা।
Claude দিয়ে: পুরো কোডবেস এঁটে যায়। Claude একাধিক ফাইলজুড়ে অথেন্টিকেশন ফ্লো ট্রেস করেছে, সেশন টোকেন কোথায় জেনারেট, স্টোর আর ভ্যালিডেট হচ্ছে চিহ্নিত করেছে আর একটা সম্ভাব্য সমস্যা ধরিয়ে দিয়েছে — এরর মেসেজগুলো অতিরিক্ত বিস্তারিত ছিল (যা আক্রমণকারীদের কাছে তথ্য ফাঁস করতে পারত)। একটা ফাইলে পরিবর্তন অন্যগুলোয় কীভাবে প্রভাব ফেলবে সেটাও সে বুঝতে পেরেছে।
ChatGPT দিয়ে: ফাইল বা সারাংশ বেছে বেছে শেয়ার করতে হবে। আলাদা ফাইল বিশ্লেষণে ChatGPT যথেষ্ট দক্ষ, কিন্তু পুরো কোডবেসজুড়ে ডিপেন্ডেন্সি ট্রেস করার ক্ষমতা হারিয়ে ফেলে। নির্দিষ্ট ফাংশন নিয়ে টার্গেটেড প্রশ্নে এটা ঠিকই কাজ করে। কিন্তু সামগ্রিক আর্কিটেকচারাল বিশ্লেষণে হিমশিম খায়।
বিজয়ী: একতরফাভাবে Claude। স্কেলে কোড রিভিউয়ে Claude-এর কনটেক্সট উইন্ডো একটা বড় ব্যবহারিক সুবিধা। বড় প্রজেক্টে কাজ করা ডেভেলপারদের কাছে Claude জনপ্রিয় হওয়ার এটাই একটা কারণ।
কনটেক্সট রিটেনশন বাড়ানোর প্রম্পটিং কৌশল
যে টুলই ব্যবহার করুন না কেন, কিছু প্রম্পটিং টেকনিক লং ডকুমেন্ট থেকে ভালো ফলাফল পেতে সাহায্য করে।
১. গুরুত্বপূর্ণ তথ্য শুরু আর শেষে রাখুন। দুটো মডেলেই কনটেক্সটের শুরু আর শেষের কনটেন্টের রিকল বেশি শক্তিশালী। ইনস্ট্রাকশন যোগ করলে সেগুলো একদম শুরুতে রাখুন আর সবচেয়ে জরুরিগুলো প্রশ্নের ঠিক আগে শেষেও আবার দিন।
২. স্পষ্টভাবে রিকলের নির্দেশ দিন। "চুক্তিতে টার্মিনেশন নিয়ে কী বলা আছে?" জিজ্ঞেস করার বদলে চেষ্টা করুন: "পুরো ডকুমেন্ট খুঁজে টার্মিনেশন, আগাম বাতিলকরণ বা চুক্তি শেষ হওয়ার সব উল্লেখ বের করো — প্রতিটা যেখানে আছে সেই সেকশন নম্বরসহ একটা তালিকা দাও।"
৩. গোছানো আউটপুট চান। নির্দিষ্ট ফরম্যাটে রেসপন্স চান — সেকশন রেফারেন্সসহ বুলেট পয়েন্ট, বিভিন্ন ক্লজ তুলনার একটা টেবিল, বা একটা নাম্বারড লিস্ট। এতে মডেল রিট্রিভালে আরও সিস্টেম্যাটিক হতে বাধ্য হয়।
৪. জটিল প্রশ্ন ধাপে ভাগ করুন। একসঙ্গে সব জিজ্ঞেস না করে প্রথমে মডেলকে সব প্রাসঙ্গিক সেকশন চিহ্নিত করতে বলুন, তারপর ওই নির্দিষ্ট সেকশনগুলো নিয়ে বিশ্লেষণমূলক প্রশ্ন করুন।
ডকুমেন্ট বিশ্লেষণে ভালো কাজ করে এমন একটা প্রম্পট টেমপ্লেট:
You are analyzing a {{document_type}}. Your task is to {{specific_task}}.
First, identify all sections relevant to this analysis and list them with their page/section numbers.
Then, for each relevant section, extract the key information and note any conflicts or ambiguities.
Finally, provide a synthesis that addresses: {{specific_questions}}
Document:
{{document_content}}
যদি দেখেন বিভিন্ন ডকুমেন্টের জন্য এমন প্রম্পট বারবার ব্যবহার করছেন — শুধু ডকুমেন্ট টাইপ, টাস্ক আর প্রশ্ন বদলে — তাহলে PromptNest-এর মতো একটা প্রম্পট ম্যানেজার কাজে আসতে পারে। {{document_type}} আর {{specific_task}}-এর মতো ভেরিয়েবলসহ টেমপ্লেটটা একবার সেভ করুন, তারপর প্রতিবার ব্যবহারের সময় শুধু ফাঁকা জায়গাগুলো ভরে দিন। আবার লেখার চেয়ে দ্রুত, আর যে স্ট্রাকচার কাজ করে সেটা ভুলবেনও না।
কখন কোনটা: একটা দ্রুত সিদ্ধান্তের গাইড
ভিন্ন ডকুমেন্ট টাস্কের জন্য Claude নাকি ChatGPT ব্যবহার করবেন তা দেখানো একটা ডিসিশন ফ্লোচার্ট
Claude বাছুন যখন:
আপনার ডকুমেন্ট ৪০ পৃষ্ঠার বেশি (ChatGPT Plus-এর সীমা)
দূরবর্তী সেকশনগুলোর মধ্যে ক্রস-রেফারেন্স দরকার
লিগ্যাল, কমপ্লায়েন্স বা কনট্র্যাক্টের কাজ করছেন
কোডবেস বা টেকনিক্যাল ডকুমেন্টেশন বিশ্লেষণ করছেন
গতির চেয়ে রিকলের নির্ভুলতা বেশি জরুরি
ChatGPT বাছুন যখন:
আপনার ডকুমেন্ট ৪০ পৃষ্ঠার কম আর আপনার টিয়ারের সীমার মধ্যে এঁটে যায়
ডকুমেন্ট বিশ্লেষণের সঙ্গে ওয়েব সার্চ লাগবে
টেক্সটের পাশাপাশি ভয়েস ইনপুট/আউটপুট বা ইমেজ অ্যানালাইসিস চান
কাস্টম GPT নিয়ে ইতিমধ্যেই OpenAI ইকোসিস্টেমে আছেন
ফ্রি টিয়ার দরকার (কনটেক্সটে ChatGPT Free, Claude Free-কে হারায়)
দুটোই ভাবুন যখন:
ChatGPT-র ওয়েব সার্চ দিয়ে সোর্স আর সাম্প্রতিক তথ্য জোগাড় করুন
Claude-এর বড় কনটেক্সট দিয়ে গভীর সিনথেসিস আর বিশ্লেষণ করুন
রায়: লং ডকুমেন্টে Claude জিতে, কিছু শর্তসহ
লং ডকুমেন্ট প্রসেসিং আর বিশ্লেষণে Claude-এর সুবিধাগুলো স্পষ্ট: স্ট্যান্ডার্ড পেইড টিয়ারে বড় কনটেক্সট উইন্ডো (ChatGPT Plus-এর ৩২K-র তুলনায় ২০০K), বেঞ্চমার্ক টেস্টিংয়ে প্রমাণিত ভালো রিকল আর কনট্র্যাক্ট রিভিউ ও কোড অ্যানালাইসিসের মতো বাস্তব কাজে শক্তিশালী পারফরম্যান্স।
সাবস্ক্রিপশন টিয়ার তুলনা করলে পার্থক্যটা বিশেষভাবে চোখে পড়ে। Claude Pro-র ২০০K টোকেন বনাম ChatGPT Plus-এর ৩২K টোকেন — ব্যবহারিক ক্যাপাসিটিতে ৬ গুণ পার্থক্য। Claude-এর স্ট্যান্ডার্ড অফারের সঙ্গে মেলাতে হলে আপনাকে ChatGPT Enterprise লাগবে।
তবে ChatGPT-রও নিজের শক্তি আছে। ইকোসিস্টেমটা বেশি পরিণত — কাস্টম GPT, প্লাগইন, ওয়েব ব্রাউজিং, ইমেজ জেনারেশন আর ভয়েস — সব মিলেমিশে ভালোভাবে কাজ করে। আপনার ওয়ার্কফ্লোতে যদি ছোট ডকুমেন্টের সঙ্গে ওয়েব রিসার্চ বা মাল্টিমোডাল কাজ থাকে, ChatGPT-ই বরং ভালো পছন্দ হতে পারে।
ব্যবহারিক উপসংহার: লং-ডকুমেন্টের কাজ যদি আপনার রোজকার দায়িত্বের নিয়মিত অংশ হয় — লিগ্যাল রিভিউ, রিসার্চ সিনথেসিস, কোড অ্যানালাইসিস, পলিসি ড্রাফটিং — তাহলে Claude ট্রাই করার মতো। কনটেক্সট উইন্ডোর সুবিধাটা সত্যি, আর আউটপুটের মানে এর প্রভাব স্পষ্ট চোখে পড়ে।
ডকুমেন্ট বিশ্লেষণের ওয়ার্কফ্লোতে যেসব প্রম্পট সবচেয়ে ভালো কাজ করে সেগুলো একবার পেয়ে গেলে তাদের চ্যাট হিস্ট্রির ভেতর হারিয়ে যেতে দেবেন না। একটাই টুলে থাকুন বা দুটোই ব্যবহার করুন — সেরা প্রম্পটগুলো গোছানো আর পুনঃব্যবহারযোগ্য রাখলে প্রতিটা ভবিষ্যৎ প্রজেক্টে সময় বাঁচে। PromptNest একটা নেটিভ Mac অ্যাপ, Mac App Store-এ $19.99-এ ওয়ান-টাইম — কোনো সাবস্ক্রিপশন নেই, অ্যাকাউন্টও নেই, পুরোপুরি লোকালি চলে। এটা আপনার প্রম্পটগুলোকে একটা পাকাপোক্ত ঘর দেয় — প্রজেক্ট অনুযায়ী গোছানো, সার্চযোগ্য আর যেকোনো অ্যাপ্লিকেশন থেকে কীবোর্ড শর্টকাটে হাতের নাগালে।