본문 바로가기

뉴스

View
“산학연관 협력체계로 AI 시대 변화 선제대응 전략 필요” (인공지능대학원 서영주 주임교수)
작성자 시스템 작성일 23/04/12 (09:50) 조회수 279

서영주 포스텍 AI대학원장 
 
서영주 포스텍 AI대학원장은 'ChatGPT 대응전략' 주제강연을 통해 ChatGPT가 몰고 온혁신과 변화, 경상북도와 구미시의 대응방 안 등을 제시했다. 
 
서 원장은 특히 “AI 발전으로 인한 미래사회 변화에 적극적이고 선제 대응전략이 필요하다" 며 “이와 관련 현재 우리나라 기업 수준은 데이 터 규모, 장비 규모, 핵심인재, 투자 규모 등 모 든면에서 'ChatGPT'를 출시한 OpenAI와 비 교가 불가능한 만큼 이러한 격차를 극복할 방안 마련에 고민해야 한다"고 강조했다. 
 
구체적으로 경상북도와 구미시에 빅데이터 구축, 지역 중소기업 경쟁력 강화를 위한 지역 기업 데이터 스토리지 지원, 지역 SW기업 육 성 및 당근 정책을 통한 우수 기업 유치, SW/ AI혁신연구소 설립 및 유치, 미네르바 대학, 에꼴42 등의 혁신 교육 벤치마킹 등을 제안했 다.
 
결국 AI 시대에도 답은 사람, 인재가 핵심 이라는 것이다. 특히 구미형 AI 인재양성 모 델을 만들어야한다고 강조했다. 
 
서 원장은 "좋은 대학과 배출하는 인재가 있 고그 인재를 활용할 SW/AI 연구소와 기업이 있고, 이를 적극적으로 지원할 지자체의 의지 가 있으면 그것이 진정한 산학관연 협력이고 이렇게 협력이 잘 이뤄지면 수도권 부럽지 않 은경쟁력을 가지게 될 것”이라고 밝혔다. 
 
이날 서 원장은 ChatGPT가 몰고 온 혁신 과 변화에 대해 '언어모델', 'ChatGPT', 대 응방안' 등으로 나눠 설명했다. 
 
ChatGPT의 언어모델은 이전 단어들의 문 맥을 고려해 다음 단어나 단어 시퀀스를 예측 한다. 문장이 얼마나 자연스러운지 확률적으 로 계산함으로써 문장 내 특정 위치에 출현하 기적하한단어를 예측하는 모델이다. 
 
즉 문장 내 앞서 등장한 단어를 기반으로 뒤 에 어떤 단어가 등장해야 문장이 자연스러운 지 판단하는 도구다. 언어모델은 기계학습 기 술인 신경망 또는 확률 모델 등을 사용해 도 서, 기사, 소셜미디어 게시물과 같은 대규모 텍스트 데이터셋에서 학습된다. 
 
모델 버전에 따라 사용된 데이터셋이 달라 GPT-1에서는 대규모 웹페이지 코퍼스(말뭉 치)에서 학습했고, GPT-2 및 GPT-3 등 후 속버전은 웹 페이지, 책, 학술논문 및 소셜 미 디어 게시물과 같이 훨씬 더 많고 다양한 데이 터셋에서 학습했다. 
 
이 중 2020년 출시된 GPT-3의 언어모델 구조는 GPT-2와같지만, 이전 모델들과는 비 교할 수 없이 큰 규모의 모델과 데이터셋을 사 용해 사람처럼 문장 구사가 가능해졌다. 
 
1750억 개의 피라미터 및 570GB 용량의 텍스트로 학습해 질문에 답하고 문서를 요약 하며 다양한 형식으로 이야기를 지어낼 수 있 을 뿐 아니라 영어, 프랑스어, 스페인어, 일본 등을 번역할 수 있다. 이후 2023년 3월 최 어 신 버전인 GPT-4 모델이 공개됐는데, GPT 4는 GPT-3에 비해 모델이 더 거대해졌으며 이미지 입력 등의 시각적 입력도 분석할 수 있 게 됐다. 
 
△ChatGPT. 
 
ChatGPT는 대규모 데이터를 기반으로 학 습된 생성형 자연어 처리 AI모델이다. GPT 와 Chat의 합성어로 GPT-3.5 또는 GPT-4. 0자연어처리 AI 모델을 활용해 사용자와 실 
 
시간으로 대화가 가능한 서비스를 제공한다. 
 
사람과 자연스러운 대화를 이어나갈 수 있 도록 대화 형식으로 작용하도록 했으며 이를 위해 수많은 대화 데이터를 기반으로 사전 훈 련된 후 특정한 대화 주제나 도메인에 맞춰 파 인 튜닝 과정을 거친다. 
 
하지만 틀린 사실에 확신 있게 사실처럼 답 변하고 제공된 정보에 대한 소스를 제공하지 않으며 편향된 정보 제공 우려가 있고 최신정 보 업데이트가 안돼 틀리거나 답을 못하는 경 우가 발생할 가능성이 있으며 데이터의 상관 관계로 터득한 논리와 계산을 달라 수학 계산 을 잘못하는 한계 또한 존재한다. 
 
ChatGPT 목표는 가능한 많은 데이터를학 언어의 패턴과 구조를 익혀 입력자의 습하고 의도에 적절하고 적합한 응답을 생성할 수 있 도록하는 것이다. 
 
이러한 언어모델은 번역기를 돌려 얻은 문장 중 더 자연스러운 문장으로 번역하는 기계 번역, 오타 발생으로 부자연스러운 문장을 교 체하는 오타 교정, 실제 텍스트와 발음 간의 차이를 교정하는 음성 인식, 사용자가 입력한 단어를 기반으로 뒤이어 입력할 단어를 추천 하는 검색어 추천 등에 활용된다. 
 
최근에는 ChatGPT를 기반으로 연구개발 영역에서 수익을 위한 비즈니스 영역으로 전 환해 마이크로소프트는 OpenAI에 110억 달 투자해 회사의 지분 46%를 확보했다. 러를 OpenAI 결과물은 마이크로소프트가 가장 먼 저 활용한다. 또한 ChatGPT 등장으로 검색 시장의 판이 흔들려 구글 등 경쟁 기업들은 초 비상이다. 
 
△대응 방안. 
 
OpenAI의 ChatGPT 성공은 엄청난 양의 이러한 언어모델은 번역기를 돌려 얻은 문 데이터 및 엄청난 수량의 고성능 컴퓨터 확보 
 
와 핵심인재, 그리고 기술력만 보고 아낌없이 투자한 회사와 투자자가 있어 가능했다
 
이에 비해 우리나라 관련 산업의 기업 수준 은 아직 데이터 규모나 장비, 핵심인재, 투자 규모 등 모든 면에서 비교할 수 없을 만큼 차이 가 크다. 이러한 격차 극복 방안에 대한 고민 이 필요하다. 
 
또한 AI가 인류를 위한 기술인가 인류를 멸 망시킬 기술인가에 대한 논란이 있다. 역사적 으로 새로운 기술이 나타날 때면 항상 사회 전 반에 문제가 발생했다. 
 
기계화 시대가 왔을 때 공해와 사고, 상해, 실직 등의 문제가 있었고, 인터넷이 등장했을 때에는 사기, 범죄, 바이러스, 해킹, 중독, 가 짜정보 등의 문제가, 이동통신 발달은 보이스 피싱 및 범죄, 분실 시 큰 위험, 근무의 연속등 의 문제가 제기됐다. 
 
지난 2차 산업혁명과 3차 산업혁명 때에도 사람들은 일자리가 줄어들 것으로 예상하며 크게 걱정했지만, 정작 당시 미국의 실업률은 크게 높지 않았고 오히려 1인당 GDP가 급속 히 상승했으며 근로자의 연간 근무시간 역시 줄었다. AI 역시 AI 발전으로 인한 미래사회 변화에 적극적이고 선제 대응전략이 필요하 다. 특히 사회·윤리적 문제에 대한 고찰이 매 우 중요하다. 
 
앞으로 경상북도와 구미시 역시 글로벌 기 업이나 선진국만큼은 아니더라도 경상북도와 구미시민이 보유한 데이터를 수집해 빅데이터 를 구축하는 것이 중요하다. 
 
또한 지역 중소기업의 경쟁력을 높이기 위 해 지역기업에 데이터 스토리지 지원 방안을 모색하고 대단위설비가 필요없는소프트웨어 산업의 특성을 고려해 지역에 SW 기업 육성 및 당근 정책을 통한 우수기업 유치방안을 찾 아야한다. 
 
특히 몬트리올 AI 연구소 MILA 같은 SW /AI 혁신연구소 설립 및 유치를 통해 경상북 도와 구미시에 인재가 모이게 하는 등 인구절 벽시대에 청년 인구가 지역에 정착할 방안을 찾는 노력이 중요하다. 
 
미네르바 대학, 에콜 42등의 혁신 교육을 벤 치마킹해 ChatGPT가 교육을 망친다는 생각 을 뛰어넘어 지역 인재를 양성하는 혁신 교육 방안을 세워야 한다. 
 
결국 좋은 대학과 배출하는 인재가 있고 그 인재를 활용할 AI/SW 연구소와 기업, 그리 고 이를 적극적으로 지원할 지자체의 의지가 있으면 그것이 진정한 산학연관 협력이고 이 협력이 잘 이루어지면 경상북도 구미시가 수도권 부럽지 않은 경쟁력을 갖출 수 있다.