사용 가이드 — VOIX AdMarker

서비스 소개

VOIX AdMarker란?

VOIX AdMarker는 FAST(Free Ad-Supported Streaming TV) 채널·OTT·방송 편집자를 위한 AI 기반 광고 타임스탬프 자동 추천 도구입니다.

기존에는 편집자가 콘텐츠를 직접 시청하며 광고 적합 시점을 수동으로 마킹해야 했습니다. VOIX AdMarker는 음성 인식(STT)과 대규모 언어 모델(LLM)로 이 과정을 자동화합니다. 극적 흐름·발화 구조·무음 구간을 종합적으로 고려해 최적의 광고 위치를 추천합니다.

핵심 기능

01 — AI 추천

AI 기반 위치 추천

음성 인식 + LLM이 콘텐츠 흐름을 분석해 최적 광고 시점을 자동으로 계산합니다.

02 — 스냅 보정

무음 구간 자동 보정

추천 시점이 발화 중간일 경우 가장 가까운 무음·발화 경계로 미세 보정됩니다.

03 — 강도 조절

극적 강도 슬라이더

1~10 슬라이더로 잔잔한 전환점부터 클라이맥스까지 광고 분위기를 직접 설정합니다.

04 — 캐시

STT 캐시 지원

동일 파일의 음성 인식 결과를 재사용해 LLM 설정 변경 시 빠르게 재분석합니다.

05 — 추출

브라우저 내 오디오 추출

대용량 MXF/MP4 파일도 브라우저에서 직접 오디오를 추출해 전송량을 최소화합니다.

06 — 히스토리

분석 이력 관리

이전 분석 결과를 로컬에 저장하고, 결과 재조회 및 LLM 재실행이 가능합니다.

단계별 사용 방법

4단계로 시작하기

미디어 파일 선택

파일 선택 버튼을 클릭하거나 파일을 드래그 앤 드롭합니다. 비디오(MP4·MXF·MOV·MKV) 및 오디오(MP3·WAV·AAC 등)를 지원합니다. 비디오 파일은 오디오 자동 추출 체크박스를 활성화하면 브라우저에서 오디오를 먼저 추출한 뒤 분석합니다.

분석 옵션 설정

광고 삽입 개수(N)를 입력합니다. 파일을 선택하면 콘텐츠 길이 기반 권장 범위가 표시됩니다. 극적 강도 슬라이더로 광고 위치 분위기를 조정합니다. 장르 태그(드라마·영화·예능·스포츠·다큐·뉴스)를 선택하면 해당 장르 기본값이 적용됩니다.

광고 위치 추천 시작

광고 위치 추천 시작 버튼을 클릭합니다. 분석은 ①오디오 추출 → ②음성 인식(STT) → ③AI 추천(LLM) → ④무음 스냅 보정 순으로 진행됩니다. 콘텐츠 길이에 따라 수십 초 ~ 수 분이 소요됩니다. 동일 파일을 이전에 분석했다면 STT 캐시 재사용 여부를 선택할 수 있습니다.

결과 확인 및 내보내기

분석이 완료되면 타임라인 바와 타임스탬프 목록으로 결과를 확인합니다. 각 타임스탬프를 클릭하면 클립보드에 복사됩니다. timestamp 복사로 전체 목록을 한 번에 복사하거나, TXT 저장으로 분석 리포트를 파일로 저장할 수 있습니다.

지원 파일 형식

비디오

.mp4 .mxf .mov .mkv .avi .ts

오디오

.mp3 .wav .aac .flac .ogg .m4a

대용량 파일(수 GB 이상)은 오디오 자동 추출 옵션을 사용하면 전송 시간을 크게 줄일 수 있습니다. MP4·MXF·MOV·MKV 컨테이너에서 지원됩니다.

결과 태그 안내

광고 위치는 어떻게 결정되나요?

각 추천 타임스탬프에는 광고 시점 처리 방식을 나타내는 태그가 표시됩니다. AI 추천 시점을 발화·무음 구간 기준으로 미세 보정한 결과입니다.

태그	설명
무음 구간 정중앙	AI 추천 시점이 이미 무음 구간 안에 있어 그 구간의 정중앙으로 미세 조정됩니다. 광고 진입이 가장 자연스러운 상태입니다.
가까운 무음으로 이동	AI 추천 시점이 발화 중이었으나 30초 이내 무음 구간을 찾아 이동했습니다. 말을 끊지 않도록 자동 보정된 결과입니다.
발화 경계로 이동	무음 구간이 없어 가장 가까운 발화 시작·끝 경계로 이동했습니다. 말 중간을 피한 차선책입니다.
자연 공백 유지	어떤 발화에도 속하지 않는 자연스러운 공백 지점으로, 별도 조정 없이 추천 시점을 그대로 사용합니다.
조정 불가 (발화 중)	발화 한복판이고 주변에 이동할 곳이 없는 경우입니다. 광고 삽입 시 말이 잘릴 수 있어 수동 검토를 권장합니다.

권장 사용 환경

Google Chrome 또는 Microsoft Edge 최신 버전을 권장합니다.
Firefox는 일부 기능(오디오 추출 성능)에서 제한이 있을 수 있습니다. 모바일 환경보다 데스크톱 환경에서 안정적으로 작동합니다.

자주 묻는 질문

업로드한 파일은 어디에 저장되나요?

업로드된 파일은 AI 분석 목적으로만 서버에 전송되며, 분석 완료 즉시 삭제됩니다. 다른 사용자와 공유되거나 마케팅 용도로 활용되지 않습니다. 브라우저 내 오디오 추출 단계에서는 파일이 서버로 전송되지 않습니다.

결과를 영상 편집 툴에 어떻게 적용하나요?

타임스탬프를 클릭하거나 "timestamp 복사" 버튼을 눌러 클립보드에 복사한 뒤, Premiere Pro·DaVinci Resolve·Final Cut Pro 등 편집 툴의 타임라인에 직접 마커로 추가하시면 됩니다. TXT 파일로 저장하면 팀원과 쉽게 공유할 수 있습니다.

분석에 얼마나 시간이 걸리나요?

콘텐츠 길이에 따라 다르지만, 30분 분량 기준으로 음성 인식 2~5분, AI 추천 30초~1분 내외가 소요됩니다. 동일 파일 재분석 시 STT 캐시를 활용하면 음성 인식 단계를 건너뛰어 훨씬 빠르게 처리됩니다.

광고 개수는 몇 개로 설정하는 게 좋나요?

일반적으로 콘텐츠 10분당 1~2개를 권장합니다. 파일을 선택하면 콘텐츠 길이 기반 권장 범위가 자동으로 표시됩니다. 너무 많은 광고는 시청 경험을 해칠 수 있으니 방송사·플랫폼 가이드라인을 함께 참고하세요.

STT 캐시란 무엇인가요?

동일한 파일을 재분석할 때 음성 인식 결과를 재사용하는 기능입니다. 광고 개수나 극적 강도를 바꿔 재분석할 때 긴 STT 처리 없이 LLM 추천 단계만 빠르게 재실행할 수 있습니다. 캐시는 브라우저 로컬에만 저장됩니다.

무료로 사용할 수 있나요?

현재 VOIX AdMarker는 무료로 이용할 수 있습니다. 향후 사용량에 따라 일부 기능이 유료화될 수 있으며, 변경 시 서비스 내 공지를 통해 사전 안내할 예정입니다.

문의하기

사용 중 문제가 생겼거나 기능 개선 제안이 있으신가요?

kanghanstar@gmail.com