LG AI연구원, 세계 최고 권위 AI 학회서 ‘최고논문상’ 수상

LG AI연구원, 세계 최고 권위 AI 학회서 ‘최고논문상’ 수상

이범수 기자
이범수 기자
입력 2025-04-30 18:06
수정 2025-04-30 18:06
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    0
이미지 확대
빅젠 벤치마크는 생성형 인공지능(AI) 모델이 갖추어야 할 9가지 핵심 역량을 기준으로 77개의 세부 역할 수행 능력을 객관적이고 종합적으로 평가하도록 설계됐다. LG 제공
빅젠 벤치마크는 생성형 인공지능(AI) 모델이 갖추어야 할 9가지 핵심 역량을 기준으로 77개의 세부 역할 수행 능력을 객관적이고 종합적으로 평가하도록 설계됐다.
LG 제공


LG AI연구원은 최고 권위의 자연어처리(NLP) 학회인 북미전산언어학회(NAACL)에서 가장 혁신적인 논문 1편에 수여하는 ‘최고 논문상’을 수상했다고 30일 밝혔다.

LG AI연구원과 서민준 한국과학기술원(KAIST) 교수 연구팀이 주도한 이번 논문은 생성형 인공지능(AI) 모델의 성능을 평가하는 ‘빅젠 벤치’를 개발해 제시했다. 기존 생성형 AI 모델 평가 방식은 유용성, 무해성 같은 추상적인 개념 지표에 의존해 사람이 평가했을 때의 결과와 차이가 있다는 한계가 있었다.

하지만 빅젠 벤치는 다양한 상황과 주관적 요소를 고려하는 사람의 평가 방식을 모방했다. 서 교수는 “빅젠 벤치에서 좋은 결과를 얻는다는 것은 실제로 사용할 때 만족스러운 성능을 보이는 생성형 AI 모델이라는 의미”라고 밝혔다.

Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
close button
많이 본 뉴스
1 / 3
당신은 하루에 SNS와 OTT에 얼마나 시간을 소비하는가
우리 국민의 평균 수면 시간이 관련 통계 작성 이후 처음으로 줄었다. 잠을 이루지 못하는 사람의 비율도 크게 늘었다. 반면 유튜브와 넷플릭스 등의 이용자가 늘면서 미디어 이용 시간은 급증했다. 결국 SNS와 OTT를 때문에 평균수면시간도 줄었다는 분석이다. 당신은 하루에 SNS와 OTT에 얼마나 시간을 소비하는가?
1시간 미만
1시간~2시간
2시간 이상
광고삭제
광고삭제
위로