작성일
2025.10.13
수정일
2025.10.13
작성자
김덕용
조회수
90

RA-TI CRAFT: 문서 레이아웃 4클래스 동시 분할

문서 이해(Document Understanding) 분야에서 텍스트 검출(CRAFT 계열)과 테이블 구조 검출은 일반적으로 별도의 모델로 수행되어 왔으며이로 인해 전처리·타일링·특성 추출·후처리 과정이 반복되는 비효율이 존재한다본 연구에서는 이러한 한계를 극복하기 위해 CRAFT 기반의 단일 4클래스 분할 모델 RA-TI (Region?Affinity?Table?Image) CRAFT를 제안한다제안 모델은 기존 CRAFT의 2클래스 출력(text, affinity)을 4클래스(text, affinity, table, image)로 확장하고입력을 RGB 대신 gradient·gray·high-pass 3채널로 구성하였다네트워크는 VGG16-BN 백본과 U-Net 디코더 기반으로 설계되어단일 추론(one-pass)으로 텍스트··이미지·공백 영역을 동시에 분할할 수 있다실험 결과클래스별 Precision, Recall, F1 Score, IoU, 등 주요 지표에서 기존 CRAFT 및 분리형 구조 대비 성능 향상이 확인되었으며실제 문서 처리 환경에서도 실용적 수준의 성능을 보였다.

학위연월
2026년 2월
지도교수
송길태
키워드
Image Segmentation, Korean Document Dataset, Text Detection, Document Understanding
소개 웹페이지
https://bluehart86.github.io/RATI-CRAFT/
첨부파일
첨부파일이(가) 없습니다.
다음글
End-to-End Framework for Condition-Specific Gene Regulatory Network Inference via Multi-View Attention from Single-Cell Multi-Ome
이수빈 2025-10-13 15:50:41.543
이전글
기하학적 정보를 담고 있는 슈퍼픽셀 기반의 라이다-카메라 캘리브레이션
김진완 2025-10-13 11:27:48.09
RSS 2.0 823
게시물 검색
석사학위논문
번호 제목 작성자 작성일 첨부파일 조회수
823 RAG를 적용한 컨테이너 기반 마이크로서비스의 오류 식별 방법 조대영 2025.12.15 0 224
822 Interpretable Cancer Risk Prediction with a Knowle 박한얼 2025.12.11 0 135
821 스토리지 분리화 환경에서 데이터 이동 최적화를 위한 Near-Data processing 도건우 2025.10.23 0 157
820 Learning a Differentiable Multi-Branch Decision Tr 박한얼 2025.10.21 0 321
819 분산 사이드카 아키텍처 기반 클라우드-네이티브 시스템 콜 모니터링 윤건우 2025.10.19 0 189
818 전시 환경에서의 관람객 행동 분석을 위한 Depth-Aware Zero-Shot HOI 조수현 2025.10.17 0 134
817 멀티모델 통합 선검출 기법의 환경 변화 강건성을 위한 베이지안 최적화 기반 파라미터 김정호 2025.10.17 0 168
816 레이더 기반 사람 행동 인식을 위한 경량 딥러닝 모델 설계 및 구현 곽도균 2025.10.17 0 148
815 메쉬 리깅 기반 안면 3D Gaussian Splatting의 부분 편집 기법 박현수 2025.10.17 0 173
814 가상현실에서 변형형 프록시가 감각 통합 및 일치감에 미치는 영향 연구 김민성 2025.10.17 0 125
813 이상 음향 탐지를 위한 경량 Diffusion Transformer 모델의 설계 및 구현 구동한 2025.10.17 0 160
812 VR 제자리걸음 중 주변부 시각 흐름의 위치와 속도가 비의도적 위치 이동에 미치는 영향 연 은승우 2025.10.17 0 168
811 실시간 공유화면 AI 분석을 통한 온라인 코딩 시험 부정행위 탐지 시스템 정해원 2025.10.17 0 283
810 지식 그래프 기반의 LLM 수학 추론 성능 향상 기법 박재현 2025.10.17 0 241
809 Autonomous Driving Agent Identification Under Host 도현철 2025.10.17 0 170
808 드론 기반 광역 모니터링 지연 시간 최소화를 위한 효율적 데이터 전송 프로토콜 및 선택적 박동진 2025.10.17 0 151
807 시공간 정보 토큰을 활용한 3D Human Pose Estimation 전민수 2025.10.16 0 146
806 격자기반 양자내성암호 ML-KEM 하드웨어 설계 및 검증 강은세 2025.10.15 0 320
805 배리어프리 전시 서비스를 위한 대화형 수어 질의응답 거대언어모델 연구 허석용 2025.10.15 0 162
804 Long-Axis Guided Diffusion Autoencoder for Through 김준희 2025.10.15 0 153