LG AI연구원, 세계 최고 권위 AI 학회서 ‘최고논문상’ 수상

LG AI연구원, 세계 최고 권위 AI 학회서 ‘최고논문상’ 수상

이범수 기자
이범수 기자
입력 2025-04-30 18:06
수정 2025-04-30 18:06
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    0
이미지 확대
빅젠 벤치마크는 생성형 인공지능(AI) 모델이 갖추어야 할 9가지 핵심 역량을 기준으로 77개의 세부 역할 수행 능력을 객관적이고 종합적으로 평가하도록 설계됐다. LG 제공
빅젠 벤치마크는 생성형 인공지능(AI) 모델이 갖추어야 할 9가지 핵심 역량을 기준으로 77개의 세부 역할 수행 능력을 객관적이고 종합적으로 평가하도록 설계됐다.
LG 제공


LG AI연구원은 최고 권위의 자연어처리(NLP) 학회인 북미전산언어학회(NAACL)에서 가장 혁신적인 논문 1편에 수여하는 ‘최고 논문상’을 수상했다고 30일 밝혔다.

LG AI연구원과 서민준 한국과학기술원(KAIST) 교수 연구팀이 주도한 이번 논문은 생성형 인공지능(AI) 모델의 성능을 평가하는 ‘빅젠 벤치’를 개발해 제시했다. 기존 생성형 AI 모델 평가 방식은 유용성, 무해성 같은 추상적인 개념 지표에 의존해 사람이 평가했을 때의 결과와 차이가 있다는 한계가 있었다.

하지만 빅젠 벤치는 다양한 상황과 주관적 요소를 고려하는 사람의 평가 방식을 모방했다. 서 교수는 “빅젠 벤치에서 좋은 결과를 얻는다는 것은 실제로 사용할 때 만족스러운 성능을 보이는 생성형 AI 모델이라는 의미”라고 밝혔다.

Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
close button
많이 본 뉴스
1 / 3
이번 '카카오톡 업데이트' 여러분은 만족한가요?
15년 만에 단행된 카카오톡 대규모 개편 이후 사용자들의 불만이 폭증하고 있다. 애플리케이션을 내려받을 수 있는 구글 플레이스토어와 애플 앱스토어에는 “역대 최악의 업데이트”라는 혹평과 함께 별점 1점 리뷰가 줄줄이 올라왔고, 일부 이용자들은 업데이트를 강제로 되돌려야 한다며 항의하기도 했다. 여론이 악화되자 카카오는 개선안 카드를 꺼냈다. 이번 개편에 대한 여러분의 생각은?
1. 개편 전 버전이 더 낫다.
2. 개편된 버전이 좋다.
3. 적응되면 괜찮을 것 같다.
광고삭제
광고삭제
위로