본문 바로가기

뉴스

View
‘한국어·외국어 병렬 말뭉치 구축의 쟁점과 활용 방안’ 워크숍(인공지능 김윤수 교수)
작성자 시스템 작성일 23/01/12 (11:14) 조회수 375

국립국어원, 14일 서울 코지모임공간 강남역 2호점에서
 
국립국어원은 오는 14일 오전 9시 서울 코지모임공간 강남역 2호점에서 ‘한국어·외국어 병렬 말뭉치 구축의 쟁점과 활용 방안’을 주제로 워크숍을 개최한다. 국어원이 구축하고 있는 한국어·외국어 병렬 말뭉치 활용 방안에 대한 전문가 특별강연과 구축 과정에서 발생하는 주요 쟁점에 대한 토론이 진행된다.
 
임희석 고려대 교수가 ‘딥러닝 기반의 최신 기계번역 연구 동향’을 주제로 기조강연을 한다. 딥러닝을 기반으로 하는 최신 기계번역, 기계번역 병렬 말뭉치 구축, 기계번역 기술의 응용 분야에 대해 설명한다. 최신 기술을 반영한 고려대 자연어처리연구실의 기계번역 분야 연구 성과도 소개할 예정이다.
 
조준형 경상대 교수는 ‘번역학에서 바라본 병렬 말뭉치 구축 및 활용의 유용성과 쟁점’을 주제로 발표한다. 병렬 코퍼스를 활용한 코퍼스 번역 연구에서 부딪히는 현실적인 어려움과 접근의 난이성을 소개한다. 이를 통해 병렬 코퍼스의 현실적인 방향성을 살펴본다.
 
김윤수 포항공대 교수는 ‘인간·컴퓨터 상호작용 번역의 최신 기술 동향’ 특강을 한다. 컴퓨터가 한 번역을 인간이 실시간으로 수정하는 방식은 콘텐츠 번역에서 가장 널리 쓰이고 있다. 고품질의 번역을 보장하면서도 속도가 빠르기 때문이다. 특강에서는 이러한 상호작용 기계번역의 최신 연구들을 설명한다. 다음 단어 다중예측, 용어 번역 강제 출력, 온라인 모델 적응, 완료된 번역 자동검수 등 번역사의 작업 효율을 극대화하는 인공지능 방법론을 소개한다.
 
패널 토의에서는 이정희 경희대 교수, 고려대 송상헌 교수, 김영택 솔트룩스이노베이션 부사장, 김유석 시스트란 대표, 이정수 플리토 대표가 쟁점 사항들을 검토하고 병렬 말뭉치 구축의 고도화를 위한 적용점을 탐색한다.
 
국어원은 2021년 1차 사업에서 약 800만 어절의 병렬 말뭉치를 구축했으며, 2022년 이후 1000만 어절 규모로 확대해 병렬 말뭉치를 구축하고 있다. 1차 사업에서 구축한 한국어·외국어 병렬 말뭉치는 연구 및 기술 개발의 기초 자료로 누구나 활용할 수 있도록 ‘모두의 말뭉치’(https://corpus.korean.go.kr)를 통해 올해 상반기에 공개할 예정이다.
 
이번 워크숍은 유튜브로 실시간 중계된다.