본문 바로가기

카테고리 없음

파일 시그니처와 포맷 구조 분석

1. 파일 시그니처

파일 시그니처(File Signature, Magic Number)
→ 파일이 어떤 형식인지 구분하기 위해 파일의 앞부분(헤더)에 기록된 고유한 바이트 값

운영체제나 분석 도구가 확장자가 아닌 실제 내용을 기준으로 파일을 식별할 수 있게 해줌.

확장자가 .jpg라고 되어 있어도, 내부 시그니처가 89 50 4E 47라면 실제로는 PNG 파일임을 알 수 있음.

 

주요 파일 시그니처 예시

포맷 시그니처(HEX) ASCII 해석
JPG FF D8 … FF D9 - 시작: FF D8, 끝: FF D9
PNG 89 50 4E 47 0D 0A 1A 0A .PNG.... 이미지 포맷 PNG
GIF 47 49 46 38 GIF8 GIF89a / GIF87a
PDF 25 50 44 46 %PDF PDF 문서
ZIP 50 4B 03 04 PK.. ZIP / DOCX / PPTX 등
MP4 66 74 79 70 ftyp MP4 파일의 시작 Box

 

포맷 구조 분석

 

(1) JPG 구조

헤더: FF D8 (Start of Image)

세그먼트(SOI, APP0, DQT 등)

이미지 데이터

푸터: FF D9 (End of Image)

 

(1) MP4 구조 (Box/Atom 구조)

MP4는 Box(Atom) 단위로 구성됨.

각 Box는 Size(4바이트) + Type(4바이트) + Data 형식으로