퍼플렉시티 AI vs. ChatGPT: 리서치에는 어느 쪽이 더 나을까?

둘 다 출처까지 붙은 자신만만한 답을 내놓습니다. 하지만 한 연구에 따르면 그 출처가 37~67%는 틀렸습니다. 실제로 믿을 만한 도구가 어느 쪽인지 가려봅니다.

2026년 6월 1일

퍼플렉시티 AI vs. ChatGPT: 리서치에는 어느 쪽이 더 나을까?

질문을 던지면 몇 초 만에 깔끔하고 자신감 넘치는 답이 링크와 함께 돌아옵니다. 퍼플렉시티가 그렇고, ChatGPT도 그렇죠. 답은 제대로 조사된 것처럼 보이고, 권위 있게 들리고, 출처까지 인용합니다. 그래서 우리는 그 답을 믿게 됩니다.

그런데 불편한 진실이 있습니다. 컬럼비아대 토우 디지털 저널리즘 센터가 8개 AI 검색 도구에 1,600개의 질문을 돌려본 결과, 도구들은 출처 인용을 60% 넘게 틀렸습니다 (Columbia Journalism Review, 2025년 3월). 링크는 분명히 있었어요. 다만 그 링크에는 AI가 말한 내용이 적혀 있지 않았을 뿐입니다.

그러니 리서치에서 진짜 중요한 질문은 "어느 도구가 답을 주느냐"가 아닙니다. 둘 다 답은 줍니다. 핵심은 "어느 쪽을 실제로 믿을 수 있고, 어떻게 검증하느냐"예요. 이 글은 그 두 가지에 답합니다. 대부분의 비교글이 슬그머니 재탕하는 지어낸 정확도 수치가 아니라, 직접 확인할 수 있는 숫자로요.

진짜 차이: 검색 엔진이냐, 대화냐

퍼플렉시티가 "검색창 달린 ChatGPT일 뿐"이라는 오해가 흔합니다. 아니에요. 두 도구는 애초에 다른 일을 하라고 만들어졌고, 그 차이가 나머지 모든 것을 좌우합니다.

퍼플렉시티는 답변 엔진(answer engine)입니다. 먼저 실시간 웹을 검색한 뒤, 찾은 내용에 근거해 짧은 답을 쓰고, 거의 모든 문장 뒤에 번호 매긴 인용을 붙입니다. 내부적으로는 자체 모델(Sonar)에 더해, 유료 플랜이라면 질문을 GPT-5.5, 클로드, 제미나이로 넘길 수 있는 라우터를 돌립니다. 퍼플렉시티의 존재 이유는 찾아내고 인용하는 것이에요.

ChatGPT는 대화형 어시스턴트입니다. 추론하고, 긴 대화를 이어가고, 초안을 쓰고, 다시 고쳐 쓰도록 만들어졌어요. 웹 검색도 할 수 있지만, ChatGPT가 스스로 필요하다고 판단했거나 검색·딥 리서치 모드를 켰을 때뿐입니다. 그렇지 않으면 학습 데이터만으로 답하고 출처는 전혀 붙지 않아요. ChatGPT의 존재 이유는 생각하고 쓰는 것입니다.

리서치에서는 이 구분이 어떤 벤치마크보다 중요합니다. 무언가가 어디서 왔는지 알아야 할 때 손이 가는 건 퍼플렉시티예요. 찾은 것으로 뭔가를 해야 할 때 손이 가는 건 ChatGPT고요. 같은 분기는 제미나이 vs. ChatGPT 일상 사용 비교에서도 그대로 나타납니다. "최고의" 도구는 결국 무슨 일을 하느냐에 달려 있어요.

1라운드: 인용과 출처

여기는 퍼플렉시티의 안방입니다. 모든 답에 문장 안에 번호 매긴 인용이 따라오고, 눌러서 들어갈 수 있는 출처 패널까지 붙어요. 각 주장이 어느 페이지에서 나왔다는 건지 따로 묻지 않아도 보입니다. 연구자들이 퍼플렉시티를 선호하는 가장 큰 이유가 바로 이 투명성이에요.

ChatGPT도 출처를 인용합니다. 단, 검색 모드나 딥 리서치일 때뿐이에요. 일반 채팅에서는 출처 하나 없이 사실, 날짜, 통계를 태연하게 말하고, 그게 어딘가에서 읽은 건지 지어낸 건지 알 길이 없습니다. 리서치에서 출처 없는 답은 출발점 축에도 못 끼어요.

실제 테스트도 이를 뒷받침합니다. Zapier가 두 도구에 "화성의 NASA 로버 최신 소식이 뭐야?"라고 물었더니, ChatGPT는 New York Post와 SlashGear까지 섞인 품질이 들쭉날쭉한 출처를 스무 개쯤 긁어모은 반면, 퍼플렉시티는 NASA 본사와 과학 간행물 같은 더 권위 있는 출처를 더 적게, 더 깔끔한 형식으로 돌려줬습니다 (Zapier, 2026년 3월). 사실 확인과 시사 질문이라면 이 라운드는 퍼플렉시티의 승리입니다.

2라운드: 정확도 — 아무도 시험하고 싶어 하지 않는 부분

대부분의 "퍼플렉시티 vs ChatGPT" 글은 한쪽이 "정확도 92%"나 "리서치 질문 94%"를 찍었다고 주장합니다. 그 숫자를 쫓아가 보면 흔적도 없이 사라져요. 연구 근거 하나 없는 SEO 페이지에서 나와, 이 사이트 저 사이트로 복사된 것들이거든요. 우리는 그걸 반복하지 않을 겁니다. 실제 연구가 밝혀낸 사실은 이렇습니다.

토우 센터는 8개 AI 검색 도구에 뉴스 기사에서 그대로 따온 인용문을 주고, 각 도구에 헤드라인, 발행사, 날짜, URL을 찾으라고 했습니다. 기본적인 인용 작업이죠. 1,600개 질문에 걸친 결과는 이랬습니다:

퍼플렉시티: 37% 오답 — 8개 중 가장 나았지만, 그래도 셋 중 하나 이상은 틀렸습니다
ChatGPT 검색: 67% 오답 — 200개 응답 중 134개가 틀렸어요
그록 3: 94% 오답 — 최악의 성적

(Columbia Journalism Review, 2025년 3월)

그러니까 퍼플렉시티가 출처 면에서 ChatGPT보다 확실히 정확하긴 합니다. 다만 여기서 "더 정확하다"는 건 "3분의 2가 아니라 3분의 1만 틀린다"는 뜻이에요. 어느 쪽도 진실 기계가 아닙니다. 둘 다 빠르고 자신만만하지만 가끔은 대놓고 틀리는 리서치 보조라고 여기세요.

그 연구에서 짚고 넘어갈 발견이 두 가지 있습니다. 첫째, 연구진은 도구들이 "부정확한 답을 놀라울 정도로 자신만만하게 내놓으면서, 단서를 다는 표현은 거의 쓰지 않았다"고 지적했어요. ChatGPT가 조금이라도 불확실함을 내비친 건 200개 답 중 15번뿐이었고, 답을 거절한 적은 단 한 번도 없었습니다. 둘째, 직관과 달리 유료 등급이 오히려 더 자신 있게 틀리는 경우가 많았어요. 정확해진 게 아니라요. 프리미엄 도구들은 "답을 거절하기보다 단정적이지만 틀린 답"을 내놨습니다. Pro 결제로 사는 건 속도와 기능이지, 진실의 보장이 아닙니다.

인용이 곧 증거는 아니다: 30초 검증 습관

퍼플렉시티의 함정은 인용이 붙으면 답이 검증된 것처럼 느껴진다는 점입니다. 사실은 아니에요. 가장 흔한 실패 유형은 가짜 링크가 아니라 인용 불일치입니다. URL은 진짜이고 권위도 있는데, 거기에 붙은 특정 주장이 정작 그 페이지에는 없거나, 과장·왜곡됐다는 거죠.

돋보기로 AI 인용을 살펴보는 만화 캐릭터, 옆에는 초록색 체크 표시와 주황색 물음표

그래서 AI가 가져온 사실을 실제 업무에 쓰기 전에, 핵심을 떠받치는 주장에 대해 30초짜리 점검을 돌리세요:

인용 링크를 눌러보세요. 페이지가 실제로 존재하고 열리나요?
그 페이지에서 해당 주장을 직접 찾으세요. 숫자나 문구를 Ctrl+F로 검색하세요. 없다면 그건 인용 불일치이니 버리세요.
출처 자체를 확인하세요. 원본(학술지, NASA, 정부 사이트)인가요, 아니면 다른 걸 요약한 블로그인가요? 원본까지 거슬러 올라가세요.
날짜를 확인하세요. 오래된 데이터를 최신인 양 제시하는 것이야말로 가장 조용히 틀리는 방식입니다.

이 작업의 대부분은 AI에게 시킬 수 있습니다. 아래 프롬프트는 퍼플렉시티(Pro Search)와 ChatGPT(검색 켜고, GPT-5.5) 양쪽에서 모두 작동해요:

이 주장을 쓰기 전에 검증하고 싶어: "{{claim}}"

다음을 해줘:
1. 원본 1차 출처를 찾아줘 (블로그나 뉴스 요약 말고).
2. 그 출처에서 이 주장을 뒷받침하거나 반박하는 정확한 문장을 인용해줘.
3. 발행일과, 더 최신 데이터가 있는지 알려줘.
4. 등급을 매겨줘: 확인됨, 일부 사실, 미검증, 거짓 — 그리고 이유를 말해줘.

본격적으로 팩트체크를 한다면, 이 프롬프트를 주장만 바꿔가며 끊임없이 붙여 넣게 될 거예요. 바로 그런 프롬프트야말로 {{claim}} 자리표시자를 넣어 한 번 저장해 둘 만한 종류입니다. 매번 전체 구조를 다시 타이핑하지 않아도 되게요. 이건 아래에서 더 다룰게요.

3라운드: 딥 리서치 모드, 정면 대결

두 도구 모두 이제 검색을 수십 번 돌리고, 수십 개 페이지를 읽고, 출처를 단 긴 보고서를 써주는 "딥 리서치" 모드를 갖췄습니다. 접근 방식은 사뭇 달라요.

퍼플렉시티 딥 리서치는 빠릅니다. 보통 3분 안에 끝나고, 큰 출처 풀에서 끌어옵니다. 한 정면 대결에서는 약 49개를 모았고, 거의 모든 문장 뒤에 인용을 붙였어요. 폭과 속도를 위해 만들어진 모드입니다.

ChatGPT 딥 리서치는 더 느리고 더 깊어요. 시작하기 전에 명확히 하는 질문을 먼저 던지는 경우가 많고, 이후 5분에서 30분까지 웹을 돌아다닌 뒤 더 길고 짜임새 있는 보고서를 돌려줍니다. G2의 테스트에서는 약 8분이 걸렸고, 조금 더 작은 출처 묶음에서 "명확한 전략적 구조"를 뽑아냈어요 (G2, 2026년 4월). 종합을 위해 만들어진 모드입니다.

경험칙은 이렇습니다. 빠르게 움직이는 주제를 빠르고 출처 탄탄하게 훑어야 할 땐 퍼플렉시티 딥 리서치를, 더 깊고 잘 정리된 분석이 필요하고 기다릴 여유가 있을 땐 ChatGPT 딥 리서치를 쓰세요. 특히 문서가 많은 긴 종합 작업이라면, 클로드 vs. ChatGPT 긴 문서 비교에서 ChatGPT가 어떤지 살펴볼 만합니다.

4라운드: 퍼플렉시티 Pro는 ChatGPT Plus만큼 값어치를 할까?

가격이 거의 똑같아서, 리서치 사용자에게 "20달러 vs 20달러" 선택은 진짜로 막상막하입니다.

ChatGPT Plus는 월 $20입니다. 광고가 없고, 플래그십 GPT-5.5 모델을 주며, 매월 딥 리서치 10회에 더해 Projects, 에이전트 모드, Canvas를 포함해요. 무료 등급도 쓸 만한 모델을 주지만, 사용량 제한이 더 빡빡합니다.

퍼플렉시티 Pro도 월 $20(또는 연 $200)예요. 리서치만 놓고 보면 한도가 더 넉넉합니다. Pro Search 무제한, 딥 리서치 쿼리 하루 약 20회, 그리고 퍼플렉시티 안에서 GPT-5.5, 클로드, 제미나이를 골라 돌릴 수 있는 모델 선택기까지요. 무료 등급이 여기서는 유독 쓸모 있어요. 인용이 기본으로 켜져 있고 딥 리서치 쿼리도 하루 5회라, 돈 내기 전에 도구를 진지하게 평가해 보기에 충분합니다.

양쪽 다 헤비 파워 유저를 겨냥한 월 $200 최상위 등급(ChatGPT Pro, 퍼플렉시티 Max)이 있습니다. 하지만 리서치를 하는 대부분의 사람에게 의미 있는 선택은 $20 등급이에요. 그리고 작업이 인용 중심이라면, 퍼플렉시티 Pro의 훨씬 넉넉한 딥 리서치 한도가 결정타가 됩니다. ChatGPT 쪽을 여전히 저울질 중이라면 ChatGPT Plus, 결제할 만할까?에서 더 깊이 다루고, 무료 선택지는 2026년 최고의 무료 AI 챗봇에 정리해 뒀습니다.

둘 다 이기는 워크플로: 함께 쓰기

노련한 연구자들이 깨달은 핵심은 이겁니다. 하나만 고르지 마세요. 각 도구는 일의 절반씩을 가장 잘합니다. 이기는 워크플로는 퍼플렉시티로 찾고 검증한 뒤, ChatGPT로 종합하고 쓰는 것이에요.

정리된 리서치 노트가 담긴 폴더를 화살표를 따라 주고받는 두 만화 로봇, 하나는 돋보기를 다른 하나는 연필을 들고 있다

실전 리서치 흐름은 이렇게 생겼습니다:

퍼플렉시티에서 큰 그림을 그리세요. 넓은 질문을 던져 주요 출처와 관점을 파악하세요.
초점을 좁힌 인용 질문으로 파고드세요 — 학술 출처가 필요하면 Academic 포커스 모드로 전환하세요.
핵심 주장을 검증하세요. 위의 30초 점검으로요. 대부분이 건너뛰는 단계가 바로 이겁니다.
검증된 결과를 ChatGPT에 넘기세요. 구조화하고, 종합하고, 초안을 쓰게요.

이 흐름의 대부분은 프롬프트 두 개가 끌고 갑니다. 퍼플렉시티(Pro Search 또는 딥 리서치)에서 출처 달린 개요를 뽑으려면:

{{year}} 기준 {{topic}}의 현재 상황을 조사해줘.

포함할 것:
- 최근 12개월간의 핵심 통계, 각각 1차 출처와 함께
- 주요 플레이어나 학파, 그리고 그들이 어디서 의견이 갈리는지
- 최근의 변화나 새로운 흐름
- 잘 보도되지 않거나 통념을 거스르는 관점 하나

서로 다른 1차 출처를 최소 8개 인용해줘.

그런 다음 결과를 검증했다면, ChatGPT(GPT-5.5)에 넘겨 글을 쓰게 하세요:

{{audience}}을(를) 위한 {{topic}} 관련 {{document_type}} 작성을 도와줘.

다음은 내가 검증한 사실과 출처야:
{{verified_findings}}

이걸 명확하고 짜임새 있는 초안으로 종합해줘. 모든 사실 주장은 내가 준 출처에 묶어 두고 — 내가 주지 않은 사실은 더하지 마.

이 프롬프트들을 {{이중 중괄호}} 안의 부분만 바꿔가며 끊임없이 재사용하게 된다는 점에 주목하세요. 매번 다시 쓰는 대신 어딘가 재사용 가능한 곳에 두어야 할 이유가 바로 이겁니다. PromptNest가 정확히 이걸 위해 만들어졌어요. 프롬프트를 {{topic}}과 {{verified_findings}} 자리표시자와 함께 한 번 저장해 두면, 복사할 때 빈칸을 채우는 작은 폼이 떠서, 완성된 프롬프트가 어느 도구에든 붙여 넣을 수 있도록 클립보드에 올라옵니다. (이 기법은 AI 프롬프트의 변수 가이드에서 더 다룹니다.)

그래서 리서치엔 어느 쪽이 더 나을까?

하나만 골라야 한다면, 퍼플렉시티가 더 나은 리서치 도구입니다. 기본으로 인용하고, 출처를 덜 틀리며, 리서치가 요구하는 바로 그 투명성을 중심으로 설계됐거든요. ChatGPT는 사실을 손에 쥔 다음 단계, 즉 생각하고 쓰는 데 더 나은 도구고요.

더 정확히 말하면:

빠르고 출처 달린 시사 리서치 → 퍼플렉시티
학술·과학 출처 → 퍼플렉시티(Academic 포커스 모드)
복잡한 주제의 깊고 짜임새 있는 종합 → ChatGPT 딥 리서치
결과를 글 초안으로 옮기기 → ChatGPT
진짜 의존하게 될 진지한 리서치 → 위의 찾고-쓰는 워크플로로, 둘 다

실전 핵심 정리

어느 도구에도 판단을 외주 주지 마세요. 이 글에서 가장 중요한 숫자는, 가장 나은 AI 검색 도구조차 인용을 37%나 틀렸다는 사실입니다. 퍼플렉시티도 ChatGPT도 빠르고 유능한 리서치 보조예요. 그리고 둘 다 거짓을 완벽한 자신감으로 말합니다.

찾고 인용하는 데는 퍼플렉시티를, 종합하고 쓰는 데는 ChatGPT를 쓰세요. 핵심을 떠받치는 주장은 30초 안에 직접 검증하고요. 그렇게만 하면, AI 리서치의 속도를 누리면서도 그 실수까지 물려받지는 않게 됩니다.

리서치 프롬프트를 늘 준비해 두세요

잘 작동하는 프롬프트를 찾고 나면 — 주장 검증 점검, 출처 달린 개요 요청, 종합 프롬프트 — 진짜 시간을 아끼는 길은 매 세션마다 다시 쓰지 않는 것입니다. 우선 가장 잘 쓰는 리서치 프롬프트를 찾기 쉬운 곳에 저장해 두세요. 메모든 문서든, 이미 쓰고 있는 무엇이든요.

혹은 그걸 위해 만들어진 도구를 원한다면, PromptNest는 프롬프트를 프로젝트별로 정리하고, 검색 가능하게 하고, 어떤 앱에서든 단축키 하나로 불러올 수 있게 해주는 네이티브 Mac 앱입니다(Mac App Store에서 한 번만 결제하는 $19.99 — 구독 없음). 리서치 프롬프트를 {{variable}} 자리표시자와 함께 저장하고, 복사할 때 빈칸을 채워, 완성된 프롬프트를 퍼플렉시티나 ChatGPT에 바로 붙여 넣으세요. 리서치는 여전히 여러분의 몫이에요 — 도구는 그저 그 일을 더 빠르게 만들어 줄 뿐입니다.

진짜 차이: 검색 엔진이냐, 대화냐

1라운드: 인용과 출처

2라운드: 정확도 — 아무도 시험하고 싶어 하지 않는 부분

인용이 곧 증거는 아니다: 30초 검증 습관

3라운드: 딥 리서치 모드, 정면 대결

4라운드: 퍼플렉시티 Pro는 ChatGPT Plus만큼 값어치를 할까?

둘 다 이기는 워크플로: 함께 쓰기

그래서 리서치엔 어느 쪽이 더 나을까?

실전 핵심 정리

리서치 프롬프트를 늘 준비해 두세요

다른 언어로 읽기