2과2-2

긴 문서 다루기

100만 토큰 컨텍스트를 활용해 대용량 문서를 분석하고 요약하는 방법을 배웁니다

100만 토큰이 얼마나 큰가요?

100만 토큰은 실로 엄청난 양입니다. 한국어 기준으로 계산하면 A4 약 1,500장 분량의 문서를 한 번에 올려놓고 AI와 대화할 수 있습니다. 실무 예시로 비교해보면: 보통 업무 계약서 1건이 5~20페이지, 연간 보고서가 50~100페이지, 노동 관련 취업규칙이 20~40페이지 수준입니다. 이 모든 문서를 한꺼번에 업로드하고 '이 중에서 연차 관련 조항들을 모두 찾아 비교해줘'와 같은 복합 질문도 가능합니다.

대용량 문서 분석 실전 기법

문서를 올릴 때는 AI에게 먼저 '이 문서의 전체 구조를 파악하고 목차를 정리해줘'라고 요청하세요. 구조를 파악하면 이후 '3장의 핵심 내용만 요약해줘', '5.2절과 7.1절을 비교 분석해줘'처럼 정밀한 질문이 가능합니다. 여러 문서를 비교할 때는 문서마다 이름을 붙여주세요. '문서A는 현행 취업규칙이고 문서B는 개정안이야. 두 문서의 차이점을 표로 정리해줘'처럼 구체적으로 지시하면 AI가 두 문서를 체계적으로 비교합니다.
# 대용량 문서 분석 프롬프트 예시

"다음은 우리 회사의 2025년 사업 보고서야. (문서 붙여넣기)

아래 순서로 분석해줘:
1. 전체 구조와 핵심 챕터 요약 (각 챕터 2-3줄)
2. 재무 실적: 매출, 영업이익, 전년 대비 증감
3. 리스크 요인 중 경영진이 강조한 3가지
4. 내년 전략 방향 키워드 5개"
TIP: 한 번에 너무 많은 질문을 던지면 답변이 피상적이 됩니다. 문서를 먼저 요약시키고, 이후 세부 분석을 요청하는 2단계 접근이 효과적입니다.

NotebookLM으로 문서 기반 AI 만들기

Google의 NotebookLM은 여러 문서를 업로드하면 그 문서들만을 기반으로 답변하는 AI를 만들어줍니다. 회사 내규, 법령, 판례 등을 등록해두면 '이 상황에서 적용 가능한 조항이 있나요?'처럼 특정 문서 집합 기반의 전문적인 질문이 가능합니다. 할루시네이션 위험도 크게 줄어듭니다. 업로드된 문서 내에서만 답변하기 때문에 AI가 없는 정보를 만들어낼 가능성이 낮습니다. 법률, 의료, 규정 관련 업무에 특히 유용합니다.

핵심 정리

  • 100만 토큰은 A4 약 1,500장 분량으로, 대부분의 업무 문서를 한꺼번에 처리할 수 있습니다.
  • 문서 분석 시 전체 구조 파악 → 세부 분석 요청의 2단계 접근법이 효과적입니다.
  • NotebookLM처럼 특정 문서 기반 AI를 만들면 할루시네이션을 크게 줄일 수 있습니다.

자주 묻는 질문

PDF 파일도 AI에게 올릴 수 있나요?+

네. Claude, ChatGPT, Gemini 모두 PDF 파일 업로드를 지원합니다. 스캔된 이미지 PDF도 OCR 기능으로 텍스트를 인식하지만, 정확도가 떨어질 수 있으니 텍스트 기반 PDF를 우선 활용하세요.

회사 기밀 문서를 AI에 올려도 괜찮나요?+

회사 정책을 반드시 확인하세요. 많은 기업이 외부 AI 서비스에 기밀 데이터 업로드를 금지하고 있습니다. 기밀 정보는 익명 처리 후 올리거나, 사내 AI 솔루션을 활용하는 것이 안전합니다.

이 강의가 어떠셨나요?