연구
최신연구
View
[김동우/옥정슬 교수] Enhancing Ligand Validity and Affinity in Structure-Based Drug Design with Multi-Reward Optimization | ||
---|---|---|
작성자 시스템 | 작성일 25/07/08 (00:00) | 조회수 30 |
[연구의 필요성]
구조 기반 신약 설계(Structure-based Drug Design, SBDD)는 단백질 구조가 주어졌을 때, 이에 결합 가능한 3차원 분자를 생성하는 것을 목표로 합니다. 기존 연구들은 주로 학습 데이터의 통계적 분포를 모사하는 데 집중하여, 신약 개발에 요구되는 특정 성질에 최적화된 분자를 효과적으로 생성하지 못하였습니다. 또는, 하나의 특성(예: 결합 친화도)만을 최적화하는 방법에 그쳐, 합성 용이성이나 구조적 안정성과 같은 다른 중요한 속성의 저하를 초래하는 문제가 있었습니다. 따라서, 신약 개발에 필수적인 다양한 분자 특성들을 동시에 고려하고 최적화할 수 있는 연구가 필요시 됩니다.
[포스텍이 가진 고유의 기술]
이 연구는 SBDD에서 요구되는 다양한 분자 특성을 동시에 만족시키기 위해, 다중 보상 최적화(Multi-reward Optimization)를 직접 선호도 최적화(Direct Preference Optimization, DPO)와 결합한 새로운 프레임워크를 제안합니다. 분자 생성의 백본으로 Bayesian Flow Network(BFN)를 채택하고, 사전 학습된 생성 모델을 DPO를 통해 미세 조정(fine-tuning)하였습니다. 생성된 분자에 대해 외부 소프트웨어나 평가 지표를 활용해 보상 값을 계산한 뒤, 서로 다른 보상 간의 스케일 차이를 정규화하고, 보상 예측의 불확실성이 클 경우 패널티를 부여하는 전략을 적용하여 최종 보상을 산출합니다. 이 통합된 보상 신호를 기반으로 DPO를 수행함으로써, 모델이 다양한 분자 특성을 균형 있게 학습할 수 있도록 하였습니다. BFN과 DPO를 결합한 다중 보상 최적화 방식을 SBDD에 적용한 것은 본 연구가 최초입니다.
[연구의 의미]
이 연구는 SBDD에서 생성된 분자의 신약 후보로서의 활용 가능성을 크게 향상시켰다는 점에서 실질적인 의의를 가집니다. BFN에 DPO을 접목하여 다중 보상 최적화를 수행한 결과, 결합 친화도, 구조적 안정성, 약물화 가능성 등 신약 개발에 핵심적인 다수의 지표에서 동시적인 성능 향상을 달성하였습니다 특히, 기존 연구들이 도달했던 파레토 프론트(Pareto front)를 성공적으로 확장하였음을 실험적으로 확인하였으며, 생성된 분자의 유효성을 평가하는 벤치마크에서도 본 모델은 기존 최첨단 기법들 대비 현저히 높은 유효성 통과율을 기록하였습니다.
우리의 연구결과가 단일 지표에 최적화된 기존 모델들을 뛰어넘어, 다양한 분자 특성을 균형 있게 고려한 생성이 가능함을 입증합니다.
[연구결과의 진행 상태 및 향후 계획]
이 연구는 인공지능 분야 최우수 학술대회 중 하나인 ICML 2025 (International Conference on Machine Learning)에 채택되어 포스터 세션에서 발표될 예정입니다. 또한 현재 관련 기술에 대한 특허 출원도 준비 중에 있습니다. 향후에는 본 기법을 Reinforcement Learning 및 Multi-task Optimization의 최신 연구성과와 결합하여 성능을 더욱 향상시키는 것을 목표로 합니다. 아울러, 외부 평가 도구 사용에 따른 계산 비용 및 시간 소모를 줄이기 위해, Active Learning에서 활용되는 기법을 접목하여 후속 연구로 확장해 나갈 계획입니다.
[성과와 관련된 실적]
Seungbeom Lee, Munsun Jo, Jungseul Ok, Dongwoo Kim “Enhancing Ligand Validity and Affinity in Structure-Based Drug Design with Multi-Reward Optimization”, International Conference on Machine Learning (ICML), 2025.