메인 콘텐츠로 건너뛰기

개요

SourceContent는 문서 청크를 나타냅니다. 업로드된 문서가 검색 가능한 단위로 분할된 것입니다. 각 청크는 원본 소스에 대한 참조를 유지하여 컨텍스트와 추적성을 보장합니다. 구조화된 기억과 청크 검색의 차이점에 대해서는 컨셉 개요를 참조하세요.

필드

필드타입설명
idstring고유 식별자
contentstring청크 텍스트 콘텐츠
sourceIdstring원본 문서에 대한 참조
sourceTypestring문서 유형 (예: pdf, markdown, text)
metadataobject추가 메타데이터 (페이지 번호, 섹션 등)
createdAtstring생성 일시

지원 형식

형식확장자비고
PDF.pdf페이지 단위 청킹
Markdown.md, .mdx섹션 단위 청킹
텍스트.txt단락 단위 청킹

청킹

문서는 의미 검색에 최적화된 청크로 자동 분할됩니다. 각 청크에는 원본 문서 내 위치에 연결되는 메타데이터가 유지됩니다. 수동 설정은 전혀 필요 없으며, 청킹 프로세스는 완전히 자동화되어 있습니다.
각 청크는 원본 소스와의 관계를 유지하므로, 검색 결과를 원래의 정확한 페이지, 섹션, 단락까지 추적할 수 있습니다.

Knowledge와의 관계

SourceContent에서 추출된 사실은 Knowledge가 될 수 있습니다. 원본 SourceContent가 소스 참조 역할을 하여 원시 문서에서 확정된 사실까지의 명확한 출처 체인을 유지합니다.
문서: "API 사양서 v2.pdf"
  |-- SourceContent 청크 1: "인증 섹션"
  |     --> Knowledge: "API는 OAuth2 인증 사용"
  |-- SourceContent 청크 2: "엔드포인트 섹션"
  |     --> Knowledge: "기본 URL은 /api/v2/"
  |-- SourceContent 청크 3: "에러 코드 섹션"
        --> Knowledge: "에러 429는 속도 제한 초과"

관련 페이지

데이터 타입

전체 데이터 타입 컨셉 개요

Knowledge API

SourceContent는 Knowledge와 함께 관리됩니다