본문 바로가기

최신연구

View
[한욱신 교수] SAFE: Schema-Driven Approximate Distance Join for Efficient Knowledge Graph Querying
작성자 한욱신 작성일 25/09/03 (00:00) 조회수 54

[연구의 필요성]

 대규모 지식그래프(KG)를 활용한 질문응답 시스템은 신뢰할 수 있는 답변을 주기 위해 두 가지가 동시에 필요하다. 하나는 사용자의 질문을 그래프 형태로 정확하게 바꾸는 것이고, 다른 하나는 그 그래프와 맞는 부분을 거대한 지식그래프 속에서 빠르게 찾아내는 것이다. 지금까지 연구들은 크게 세 가지 방식으로 접근해왔다. 첫째, 질문을 SPARQL 같은 쿼리 언어로 변환하는 방식은 잘못된 변환이 이루어지면 전체 과정이 무너진다는 문제가 있다. 둘째, LLM이 직접 그래프를 탐색하는 에이전트 방식은 질문에 포함된 핵심 개체를 미리 알아야 하고, LLM을 여러 번 불러야 하므로 비효율적이다. 셋째, 질문을 그래프로 바꾼 뒤 그대로 지식그래프에 대입하는 방식은 실제 지식그래프와 구조가 조금만 달라도 매칭이 어렵다. 따라서 기존 방법들은 모두 대규모 지식그래프 환경에서 정확도와 효율성을 동시에 만족시키기 어렵다는 공통의 한계를 가진다.

 

[포스텍이 가진 고유의 기술]

  1.  본 연구진은 SAFE(Schema-Driven Approximate Distance Join)라는 새로운 프레임워크를 제안하였다. SAFE의 핵심은 스키마 그래프를 활용해 질문을 그래프로 표현하는 과정에서 생기는 불완전함을 보정하고, 효율적으로 정답 후보를 찾는 것이다.  SAFE는 네 단계로 이루어진다. 먼저 LLM이 질문을 바탕으로 초기 그래프를 생성하고, 이후 스키마 그래프에서 근사 탐색을 통해 이 구조를 보정한다. 이때, 질문을 해석하는 과정에서 중요한 연결이 빠지거나 불필요한 노드가 들어가는 실수가 생기더라도 SAFE는 이를 근사적인 경로로 대체해 자연스럽게 연결한다. 이렇게 하면 질문 해석 과정의 오류가 있어도 관련 있는 후보를 여전히 찾을 수 있다. 또한 방대한 지식그래프 전체를 탐색하는 대신, 그 구조를 단순화한 스키마 그래프에서 미리 거리 정보를 계산해 두어 훨씬 빠르고 가볍게 탐색을 진행한다. 다음 단계에서는 타입 제약과 의미적 유사도를 함께 고려해 후보들을 순위화한다. 마지막으로 LLM이 이렇게 좁혀진 후보 그래프를 근거로 최종 답변을 생성한다.

     

    [연구의 의미]

 본 연구는 기존 방법들이 가진 구조적 불일치와 비효율 문제를 동시에 해결할 수 있는 새로운 패러다임을 제시했다는 점에서 의미가 크다. SAFE는 WebQSP, CWQ, GrailQA 같은 대표적인 벤치마크에서 최신 기법들을 안정적으로 뛰어넘는 성능을 보였다. 특히 새로운 유형의 질문이나 처음 보는 조합에 대해서도 정확도가 높게 유지되었다. 예를 들어 CWQ에서는 79.4%, WebQSP에서는 90.6%, GrailQA 전체에서는 85.5%라는 높은 성능을 기록하였다. 또한 SAFE는 효율성에서도 강점을 보였다. 기존 기법들이 질문 하나를 처리할 때 평균 6회 이상 LLM 호출이 필요했다면, SAFE는 단 두 번의 호출만으로 충분했다. 그 결과 토큰 사용량과 응답 시간 모두 절반 이상 줄어들었다. 단계별 분석 결과, 전체 응답 지연의 대부분은 LLM이 초기 질의 그래프를 만드는 과정에서 발생했으며, 그 이후의 근사 탐색과 매칭 과정은 안정적이고 빠르게 동작하였다. 아울러 모듈별 실험을 통해 근사 거리 탐색, 의미 기반 매칭, 타입 제약 모두가 정확한 답변 생성에 필수적임을 확인하였다.


  1. [연구결과의 진행 상태 및 향후 계획]

본 연구진은 SAFE가 현재 ORDER BY, LIMIT, UNION, 복잡한 FILTER와 같은 고급 연산 처리까지 확장하여 더 복잡한 질문에도 대응할 수 있도록 발전시킬 계획이다. 또한 응답 지연의 주요 원인이 되는 초기 질의 그래프 생성 과정을 더 효율적으로 만들기 위해, 프롬프트 최적화와 LLM 추론 경량화를 연구 중이다. 향후에는 더 다양한 유형의 질문과 실제 대규모 지식그래프 환경에서의 실시간 응용을 목표로 하고 있다.

 

[성과와 관련된 실적]

Sangoh Lee, Sungho Park, Wook-Shin Han. “SAFE: Schema-Driven Approximate Distance Join for Efficient Knowledge Graph Querying”, EMNLP 2025 Main Conference

 

[성과와 관련된 이미지]

그림 1. 기존 방법들이 질의와 관련된 서브그래프를 정확히 검색하지 못하는 세 가지 사례를 보여주는 예시

그림 2. SAFE 프레임워크의 전반적인 동작 과정