사진을 보고 답변 '척척'…서울대 연구팀 국제인공지능(AI)대회 준우승
사진을 보고 답변 '척척'…서울대 연구팀 국제인공지능(AI)대회 준우승
  • 인저리타임 인저리타임
  • 승인 2018.06.25 07:58
  • 업데이트 2018.06.25 07:58
  • 댓글 0
이 기사를 공유합니다

페이스북 연구팀 이어 공동 2위…"무인카메라로 목표물 찾기 가능해져"

인공지능 질의·응답 예시[서울대 공대 제공=연합뉴스]
인공지능 질의·응답 예시[서울대 공대 제공=연합뉴스]

안경을 끼고 있는 남성과 끼지 않은 여성이 있는 사진을 인공지능(AI)에 보여주고, 안경 낀 사람이 누군지 물어본다면 대답할 수 있을까.

시각 정보와 인간의 언어를 인공지능이 얼마나 분석·처리할 수 있는지를 겨루는 미국의 국제 인공지능 대회에서 서울대 연구팀이 준우승을 차지했다.

서울대 공대는 컴퓨터공학부 장병탁 교수 연구팀(김진화 박사과정·전재현 석사과정)이 18일 미국 솔트레이크시티에서 열린 2018 컴퓨터 비전 패턴 인식학회(IEEE) 워크숍 '인공지능 시각 질의·응답 대회'에서 준우승을 했다고 25일 밝혔다.

전 세계 40개팀이 참여한 이번 대회에서 페이스북 연구팀이 총점 72.41점으로 우승을 차지했고, 서울대 연구팀이 71.69점으로 공동 2위를 차지했다.

연구팀은 단일모델 부문에서 가장 우수한 성능을 보였으나, 앙상블 모델 부문에서 근소한 차이로 뒤져 준우승했다.

단일모델 부문은 인공지능 모델 1개의 성능을 평가하고, 앙상블 모델 부문은 인공지능 모델 여러 개를 합쳐 성능을 평가한다.

발표하는 김진화씨[서울대 공대 제공=연합뉴스]
발표하는 김진화씨[서울대 공대 제공=연합뉴스]

인공지능은 12만개의 다른 이미지, 이미지에 대한 65만개의 질문, 650만개의 답변을 학습한 뒤 대회에서 이미지 관련 질문에 알맞은 답을 내린다.

질문은 '네·아니오'로 답할 수 있거나 숫자를 물어보는 식이다.

예컨대 우산을 거꾸로 쓰고 있는 사진을 보여주고, '우산을 거꾸로 쓰고 있는가'라고 질문하면 인공지능이 '네'라고 대답해야 점수를 획득한다. 숫자 질문에는 '사람이 몇 명인가', 기타 질문에는 '누가 남자인가' 등이 있다.

서울대 연구팀이 개발한 인공지능은 이러한 질의·응답에서 사람들이 가장 많이 답한 '정답'을 찾아냈다. 사람의 정답률이 83.3%였고, 인공지능의 정답률은 71%가량 됐다.

시각 정보와 인간의 언어를 이해하는 인공지능의 개발은 무인카메라가 스스로 주어진 정보를 토대로 목표물을 찾는 것을 가능하게 할 것이라고 연구팀은 설명했다. 또 시각장애인들이 일상생활에서 인공지능의 질의·응답을 통해 정보를 얻을 수 있을 것으로 기대된다.

연구팀 리더인 김진화(33)씨는 "이미지와 자연어를 동시에 분석해 사람처럼 답을 낼 수 있는 인공지능 연구가 활발히 진행 중"이다며 "추후 SNS(사회관계망서비스)에서도 폭넓게 활용할 수 있을 것"이라고 말했다. (연합뉴스) 최평천 기자. pc@yna.co.kr