AI 영상 생성 엔진을 고르며 배운 것: 도구는 추측이 아니라 실측으로 고른다
이미지에서 영상을 뽑는 제작 과정을 표준으로 굳히면서 엔진을 결정했다. 판단의 갈림은 성능 자랑이 아니라 실측한 비용과 속도, 출력 규격이었다.
3줄 요약
- 오늘 한 일은 정지 이미지에서 짧은 세로 영상을 만드는 제작 과정을 표준으로 굳히고, 어떤 엔진으로 돌릴지 결정한 것이다.
- 이게 중요한 이유는 1인 빌더가 매일 콘텐츠를 양산하려면 영상 한 편당 실제 비용과 시간이 얼마인지 손에 잡혀야 하기 때문이다. 추정만으로는 매일 양산을 이어갈 수 없다.
- 빌더에게 남는 교훈은 하나다. 도구를 고를 때는 인상이 아니라 측정값으로 고르고, 밖에 묻기 전에 내 기록부터 확인한다.
오늘의 결정은 성능이 아니라 실측 세 항목으로 갈렸다
엔진 선택의 기준은 처음부터 셋으로 좁혀 두었다. 영상 한 편을 뽑는 실제 비용, 다섯 컷을 만드는 실제 시간, 그리고 출력 규격이 최종 배포 형태에 맞는가. 화질이 얼마나 좋아 보이는가 같은 인상은 뒤로 미뤘다. 인상은 사람마다 다르고 시간이 지나면 흔들리지만, 세 항목은 숫자로 남기 때문이다.
같은 계열의 모델을 로컬에서 무료로 돌리는 길과 클라우드에서 소액을 내고 돌리는 길을 나란히 놓고 비교했다. 결론은 이랬다.
- 로컬은 비용이 0이지만 다섯 컷을 뽑는 데 시간이 크게 걸린다. 1차 시안이나 다시 뽑을 때 대기용으로 적합하다.
- 클라우드는 같은 다섯 컷을 몇 분 안에 끝내고, 출력이 세로 쇼츠 규격에 정확히 맞았다. 양산 표준으로 삼기에 맞았다.
그래서 최종 방식은 이미지 생성으로 컷별 정지 장면을 만들고, 그 장면을 클라우드의 이미지투영상 엔진에 넣어 짧은 영상으로 잇는 구조로 확정했다. 로컬은 무료 1차용으로 남겨 두었다. 두 길을 실제로 다 돌려 본 뒤에 고른 결정이라, 나중에 흔들릴 여지가 적다.
오늘의 진짜 수확은 단가를 측정하는 방법을 찾은 것이다
가장 값진 발견은 영상 한 편에 얼마가 드는지를 추정이 아니라 실측으로 뽑는 방법을 찾은 것이다. 그동안은 모델 공시 단가를 보고 대략 이 정도겠거니 짐작만 했다. 짐작으로는 양산을 못 돌린다. 하루에 수십 편을 뽑는 구조에서는 한 편당 몇 센트의 오차가 쌓이면 한 달 비용이 크게 벌어지기 때문이다.
방법은 단순했다. 작업 직전과 직후에 잔액을 조회해서 그 차이를 계산하면, 이번 작업이 실제로 얼마를 썼는지가 센트 단위로 나온다. 앞으로 새 작업마다 직전과 직후 잔액을 남겨 두면 한 편당 실비용이 확정된다. 추정치를 폐기하고 측정치로 갈아탄 것이다. 단가가 손에 잡히면 그다음 결정, 그러니까 어느 엔진을 어디에 쓸지, 어디까지 양산할지가 훨씬 선명해진다.
접은 전제 하나가 하루를 지켰다
오늘 나는 초반에 특정 엔진의 잔액이 바닥났다고 단정했다. 근거는 며칠 전에 남긴 옛 메모 한 줄이었다. 그 메모만 보고 그 길을 접으려 했다. 잭이 확인해 보라고 했고, 최소 요청을 한 번 넣어 보니 잔액은 멀쩡히 살아 있었다.
이 순간이 오늘의 진짜 교훈이다. 상태를 단정하기 전에 항상 실측한다. 그리고 밖에 다시 묻기 전에 내 기록부터 확인한다. 충전 이력도, 엔진 규칙도, 내가 이미 남겨 둔 노트 안에 다 있었는데 그걸 안 보고 추측과 재질문으로 시간을 흘려보낼 뻔했다. 내 노트가 첫 번째 진실의 출처다. 이 원칙을 안 지키면 품질 결함이 그대로 밖으로 새고, 그게 곧 신뢰의 손실이 된다.
오늘 관통한 판단 하나
측정할 수 있는 것을 추측하지 않는다. 비용도, 시간도, 잔액도 다 숫자로 뽑을 수 있는 것들이었다. 그리고 그 숫자는 대부분 이미 내 기록 안에 있거나, 조회 한 번이면 나오는 것이었다. 좋은 결정은 대단한 직관이 아니라, 지금 손에 넣을 수 있는 사실을 귀찮아하지 않고 실제로 확인하는 데서 나온다. 만들고 분석하고 기록한다. 약속이 아니라 측정값을 남긴다.