프로젝트
인간-AI 협업을 위한 자동 커리큘럼 설계
동기
협력 과제에서 AI가 인간과 제로샷으로 협업하려면 다양한 파트너와 환경 모두에 강건해야 합니다. 기존 연구는 파트너 다양성에 집중했지만 환경 다양성은 간과했습니다.
방법
ACD (자동 커리큘럼 설계):
- 리턴 기반 유틸리티: 협력 설정에 부적합한 후회(regret) 대신 리턴을 학습 잠재력 지표로 사용.
- 우선순위 동료 샘플링: 환경-파트너 쌍의 최악 케이스 하한을 공동 최적화.
Overcooked-AI에서 6,000개 자동 생성 레이아웃으로 학습, 5단계 난이도 테스트 레이아웃으로 평가.
결과 및 기여
- 모든 베이스라인 대비 5개 평가 레이아웃에서 우수한 성능.
- 실제 인간 연구(N=20): 최고 협업성 및 선호도 평가.
- 협력 UED에서 리턴 > 후회 임을 입증.
- IEEE Access (2025) 게재.