개요
SourceContent는 문서 청크를 나타냅니다. 업로드된 문서가 검색 가능한 단위로 분할된 것입니다. 각 청크는 원본 소스에 대한 참조를 유지하여 컨텍스트와 추적성을 보장합니다. 구조화된 기억과 청크 검색의 차이점에 대해서는 컨셉 개요를 참조하세요.필드
| 필드 | 타입 | 설명 |
|---|---|---|
id | string | 고유 식별자 |
content | string | 청크 텍스트 콘텐츠 |
sourceId | string | 원본 문서에 대한 참조 |
sourceType | string | 문서 유형 (예: pdf, markdown, text) |
metadata | object | 추가 메타데이터 (페이지 번호, 섹션 등) |
createdAt | string | 생성 일시 |
지원 형식
| 형식 | 확장자 | 비고 |
|---|---|---|
.pdf | 페이지 단위 청킹 | |
| Markdown | .md, .mdx | 섹션 단위 청킹 |
| 텍스트 | .txt | 단락 단위 청킹 |
청킹
문서는 의미 검색에 최적화된 청크로 자동 분할됩니다. 각 청크에는 원본 문서 내 위치에 연결되는 메타데이터가 유지됩니다. 수동 설정은 전혀 필요 없으며, 청킹 프로세스는 완전히 자동화되어 있습니다.각 청크는 원본 소스와의 관계를 유지하므로, 검색 결과를 원래의 정확한 페이지, 섹션, 단락까지 추적할 수 있습니다.
Knowledge와의 관계
SourceContent에서 추출된 사실은 Knowledge가 될 수 있습니다. 원본 SourceContent가 소스 참조 역할을 하여 원시 문서에서 확정된 사실까지의 명확한 출처 체인을 유지합니다.관련 페이지
데이터 타입
전체 데이터 타입 컨셉 개요
Knowledge API
SourceContent는 Knowledge와 함께 관리됩니다

