본문 바로가기

뉴스

View
방대한 AI 데이터 처리 ‘GDBMS’ 급부상 (인공지능/IT융합 한욱신 교수)
작성자 시스템 작성일 24/06/25 (11:15) 조회수 138


최근 인공지능(AI) 분야에서 데이터를 처리하는 기술로 GDBMS가 주목받고 있다. / 언스플래시

 

최근 인공지능(AI) 분야에서 데이터를 처리하는 기술로 GDBMS(그래프 데이터베이스 관리 시스템)가 주목받고 있다. GDBMS는 AI가 급격하게 발전하면서 기하급수적으로 늘어나는 데이터 양을 모두 처리할 수 있는 기술이다.

GDBMS는 소셜 네트워크 분석, AI 훈련 데이터 구축, 의료정보 분석 등 다양한 분야에서 활용되고 있다. 그러나 기존 GDBMS 솔루션은 느린 처리 ​​속도와 제한된 확장성 등의 문제에 직면해 있다. 특히나 분석 질의 처리에 있어 매우 느린 성능을 보인다.

이에 포스텍(포항공과대학교)은 경희대학교, 강원대학교, 큐브리드, 한국공개소프트웨어협회(한국공개SW협회, KOSSA)와 협력해 초거대 그래프의 지능형 고속 처리를 위한 GDBMS를 개발하고 있다. 이는 AI 발전으로 인한 기하급수적인 데이터 증가를 해결하고 기존 DBMS의 한계를 뛰어넘는 중요한 혁신이자 새로운 방안이 될 수 있다.

국가 R&D 과제로 선정된 이 연구 프로젝트는 2021년에 시작돼 수많은 성과를 이뤄냈다. 특히 국제학술회의 출판물, 특허출원 및 등록 등을 통해 본 연구의 가치를 인정받고 있다. 연구는 2024년까지 계속될 예정이다.

이 연구를 통해 개발된 GDBMS는 몇 가지 주요 특징을 갖는다.

첫째, 스키마 유연성을 지원한다. 즉, 스키마가 없는 데이터에 대해 유연하면서도 빠른 연산을 지원한다. 이로 인해 그래프 질의를 포함한 다양한 분석 워크로드를 고속으로 처리 가능하다.

둘째, 지능형 그래프 응용을 지원한다. 세 가지 주요 그래프 질의인 그래프 패턴 탐색, 그래프 분석, 그래프 학습 질의가 혼합된 지능적 그래프 응용을 하나의 시스템 상에서 개발 가능하다.

셋째, 초거대 그래프에서 관계형 질의와 그래프 질의 두 종류 모두 고속 지원이 가능하다. 테스트 결과, 관계형 분석 처리 벤치마크인 TPC-H에서 관계형 DBMS 인 PostgreSQL 보다 평균 10배, 최고 57배 빠른 성능을 보였다.

한국공개SW협회 측은 이번에 개발된 GDBMS가 AI 훈련 데이터 구축, 빅데이터 분석, 의료정보 분석 등 다양한 분야에 활용될 것이며, 특히 의료정보 분석, 환자 진단 및 치료에 큰 도움이 될 것으로 기대된다고 설명했다.

연구책임자로 이번 과제를 이끌고 있는 포스텍 한욱신 교수는 “이번 프로젝트는 국내 AI 산업 발전에 크게 기여하고, 미래 사회에 필수적인 데이터 처리 기술의 진화를 견인하는 것을 목표로 하고 있다”며 “개발된 GDBMS는 오픈소스 소프트웨어인 만큼 포스텍은 한국공개SW협회와 적극 협력해 국내외 기업의 도입을 활성화할 계획”이라고 전했다.

이번 프로젝트의 주요 성과물은 올해 연말 기술소개자료를 통해 별도 공개 및 배포될 예정이다.

출처: IT조선 조상록 기자(https://it.chosun.com/news/articleView.html?idxno=2023092118275)