프로젝트

VIPCGRL: 인간 정렬 절차적 레벨 생성

동기

게임 레벨 디자인은 공간 구조, 스케치, 자연어를 통해 디자이너의 의도를 표현하는 창의적 과정입니다. 기존 PCGRL 시스템은 스칼라 조건만 수용하여 인간이 자연스럽게 사용하는 풍부한 표현 방식을 놓칩니다. 본 프로젝트는 RL 에이전트가 멀티모달 지시를 수용하면서도 인간 디자이너처럼 느껴지는 레벨을 생성할 수 있는지 탐구합니다.

문제

  • 기존 PCGRL(CPCGRL, IPCGRL)은 스칼라 또는 텍스트 입력만 지원.
  • 스케치 기반 레벨 제어를 지원하는 시스템 부재.
  • 수치 조건을 충족해도 생성된 레벨이 인간적 느낌 부족.
  • RL 정책을 인간 미적 선호와 정렬하는 것은 미해결 과제.

방법

2단계 학습:

  1. 사중 대조 학습 — 텍스트·레벨 이미지·스케치·인간/AI 스타일을 64차원 공유 임베딩 공간에 정렬.

  2. 인간 정렬 DRL — PPO 정책이 인간 레퍼런스 데이터베이스와의 코사인 유사도를 보조 보상으로 받아 인간 스타일에 가까운 레벨 생성.

결과 및 기여

  • 모든 베이스라인 대비 최고 인간 유사성(TPKL-Div, ViT 지표).
  • 텍스트로 학습한 모델이 레벨/스케치 입력에 제로샷 일반화.
  • PCGRL 최초 스케치 제어 모달리티 도입.
  • GIST 석사 학위논문(HL-PCGRL, 2025)의 확장판.