본문 바로가기

뉴스

View
셀렉트스타, POSTECH 컴퓨터비전 연구실 등과 8억원 규모 ‘AI 데이터셋 지원사업’ 시작 (박재식 교수)
작성자 시스템 작성일 22/06/07 (11:04) 조회수 27

7개 기업·2개 연구실과 협약

 

 

인공지능(AI) 학습 데이터 플랫폼 스타트업인 셀렉트스타(김세엽·신호욱 각자 대표)가 자사의 'AI 데이터셋 지원사업' 시작 소식을 30일 알렸다.
셀렉트스타가 작년부터 시작한 AI 데이터셋 지원사업은 선정된 1개팀당 약 1억원 상당의 혜택을 제공하는 민간기업 바우처 사업이다. 예컨대 7천만원 수준의 데이터 구축과 아마존, 엔비디아, 구글 등 컴퓨팅 크레딧 3천만원을 제공한다.

셀렉트스타는 지난 1월부터 데이터셋 구축을 희망하는 AI 관련 사업이나 연구를 하고 있는 중소기업, 스타트업, 연구실 등을 모집했다. 그 결과 총 8억원 규모의 지원사업을 최종 9개팀과 협약을 맺었다. 이번에 선정된 9개팀이 구축할 데이터셋은 한국어 자연어, 혐오표현 감지, 의료기기 데이터, 물체인식, 음식, 인체 데이터 등 다양하다.

셀렉트스타에 따르면, 지난해보다 올해 더 많은 팀들이 신청했다. 선정 기준 중 하나는 앞으로 함께 구축할 데이터셋의 AI 산업 기여도였다. 김세엽 대표는 "자사의 크라우드 소싱 플랫폼인 '캐시미션'을 통해 구축할 수 있는 데이터인지, 향후 구축될 데이터셋이 지금과는 다른 다양성이 있는지를 평가했다"고 밝혔다.

이어 무료로 구축하는 데이터셋의 품질 우려에 대해 김 대표는 "한국 대표 NLP(자연어처리기술) 데이터셋인 업스테이지의 클루(KLUE: Korean Language Understanding Evaluation) 데이터셋과 세계적인 AI 학술지 CVPR(Computer Vision and Pattern Recognition, 국제 컴퓨터비전·패턴인식 학술대회) 채택 논문에 사용된 POSTECH 컴퓨터비전 연구실의 InstaOrder(인스타오더) 데이터셋이 지난해 셀렉트스타의 지원사업으로 구축된 사례"라고 설명했다.

지난해에 이어 이번 지원사업에 다시 함께 하게 된 박재식 POSTECH 컴퓨터비전 연구실 교수는 "작년 셀렉트스타 지원사업으로 구축한 데이터셋과 관련된 연구가 컴퓨터비전 분야 최우수 학회인 2022 CVPR에 채택되는 성과를 달성했다"며 "올해에도 셀렉트스타와 함께 빠르고 효율적인 AI 데이터셋 구축을 함으로써 CVPR 논문 채택 등 의미 있는 결과물을 만들 것"이라고 밝혔다.

 

이번에 선정된 9개팀은 ▲리빌더AI ▲마젠타로보틱스 ▲미스터리코 ▲소프트리에이아이 ▲숭실대학교 연구실 ▲튜닙 ▲틸더 ▲POSTECH 컴퓨터비전 연구실 ▲CNAI 등 7개 기업과 2개 연구실이다.

KLUE와 InstaOrder 등 지난 구축 데이터셋은 현재 셀렉트스타의 오픈 데이터셋 홈페이지에서 무료로 다운로드할 수 있다. 올해 구축하는 데이터셋 9개도 추후 홈페이지에 공개되며, 무료 다운로드가 가능할 예정이다.

한편 이번 셀렉트스타 지원사업의 파트너사로는 아마존웹서비스(AWS), 엔비디아(NVIDIA), 카카오벤처스, 구글, 한국인공지능협회, 인공지능신문, Bay Area K-Group(실리콘밸리에서 활동하는 한국 개발자 모임) 등이다.

출처: 대덕넷