연구
최신연구
View
[이근배 교수] EnSToM: Enhancing Dialogue Systems with Entropy-Scaled Steering Vectors for Topic Maintenance | ||
---|---|---|
작성자 시스템 | 작성일 25/06/13 (00:00) | 조회수 68 |
[연구의 필요성]
경량화된 대형 언어 모델(sLLMs)은 자원이 제한된 환경에서 활용도가 높지만, 업무 지향(task-oriented) 대화 시스템에서는 주제 일관성(topic consistency)을 유지하는 데 어려움을 겪는다. 이는 특히 서비스 챗봇과 같은 실사용 시나리오에서 중요하며, 잘못된 정보 전달, 사용자 신뢰도 저하, 보안 문제 등을 야기할 수 있다. 기존의 파인튜닝이나 프롬프트 엔지니어링 방식은 자원 비용이 크거나 복잡한 상황에서 효과가 제한적이다. 따라서, 별도의 학습 없이 주제 일관성을 유지할 수 있는 경량의 정렬 기법이 요구된다.
[포스텍이 가진 고유의 기술]
입력이 on-topic인지 off-topic인지에 따라 언어 모델 내부의 레이어별 생성 엔트로피가 다르게 나타나는 점에 착안하여, 이를 이용한 엔트로피 기반 스티어링 강도 조절 기법을 개발하였다. 스티어링 벡터(Steering Vector)는 기존처럼 고정 강도로 적용하는 대신, 입력의 엔트로피 값을 기준으로 동적으로 조정되어, off-topic 입력에는 강하게, on-topic 입력에는 약하게 작용한다. 이를 통해 주제 일관성은 강화하면서도 자연스러운 응답 품질을 유지할 수 있다. 이 방식은 모델 파라미터를 변경하지 않고도 적용 가능하며, 별도의 학습 없이 실시간 제어가 가능한 경량 정렬 기술이라는 점에서 기존 방법과 차별된다.
[연구의 의미]
본 연구는 경량 LLM 기반 대화 시스템의 핵심 문제였던 주제 유지 능력 부족 문제를 해결하기 위해, 모델 학습 없이도 시나리오 일관성을 유지할 수 있는 EnSToM(Entropy-scaled Steering vectors for Topic Maintenance)을 제안하였다. EnSToM은 입력의 엔트로피 분포를 분석해 상황에 따라 스티어링 벡터의 적용 강도를 조절하며, 이로써 잘못된 거부나 과도한 제약 없이 유연하고 정밀한 응답이 가능해진다. 실험 결과, 기존 방법 대비 주제 일탈 질문 거부 정확도가 최대 52.9% 향상되었고, 전반적인 정확도 역시 큰 폭으로 개선되었다. 이는 경량 모델에서도 고성능의 안전하고 신뢰할 수 있는 대화 시스템 구축 가능성을 입증하는 중요한 성과다.
[연구결과의 진행 상태 및 향후 계획]
본 연구는 ACL 2025에 채택되어 발표될 예정이며, 현재 Minstral-8B 모델과 같은 타 모델로의 확장 가능성도 검증 완료되었다. 향후 연구진은 다양한 도메인 및 멀티태스크 확장을 통해 EnSToM의 범용성을 강화하고, 계수 선택 자동화 및 학습 기반 최적화 기법 추가 등으로 실사용 환경에서의 적용성을 한층 높일 계획이다.
[성과와 관련된 실적]
Heejae Suh, Yejin Jeon, Deokhyung Kang, Taehee Park, Yejin Min, Gary Geunbae Lee,EnSToM: Enhancing Dialogue Systems with Entropy-Scaled Steering Vectors for Topic Maintenance, Annual Meeting of the Association for Computational Linguistics (ACL) 2025 Findings, Accepted
[성과와 관련된 이미지]