트윗 내용 만으로 성별·나이 알아낸다

트윗 내용 만으로 성별·나이 알아낸다

입력 2013-05-14 00:00
수정 2013-05-14 11:55
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    0
트위터에 올라온 글의 내용만으로 작성자의 성별과 나이를 맞추는 온라인 프로그램이 개발됐다.

네덜란드 트웬테대학교 연구팀은 3천 명가량의 트위터 사용자 글에 나타난 단어 및 어구 등을 성별과 나이에 따라 분석해 이같은 프로그램을 개발했다고 13일 밝혔다.

단순히 이름만 입력하면 그 사람이 최근에 게시한 글 200개를 자체 데이터베이스의 단어와 어구와 비교해 작성자의 성별과 나이를 산출해 낼 수 있다는 것이다.

트웬테대에서 컴퓨터과학 박사과정을 밟고 있는 동 응우옌은 “남성과 여성의 차이점은 매우 전형적”이라면서 “남자들은 축구에 대해 이야기하고 여자들은 손톱에 대한 얘기를 많이 한다”고 말했다.

이어 나이를 구분하는 방법에 대해서는 “젊은 사람들은 주로 자신에 대해 이야기하며 이모티콘을 많이 사용하지만 나이 든 사람들은 긴 단어와 문장을 즐겨 사용한다”고 밝혔다.

현재 네덜란드어 트위터 메시지 분석만 지원하는 이 프로그램은 오차범위가 4살이다. 젊은 사용자들의 오차범위는 낮은 반면, 나이 든 사용자로 갈수록 오차 범위가 커지는 경향이 있다.

응우옌은 “35세 이상의 사용자들은 더 정형화된 언어를 사용한다”면서 “15세와 20세의 언어는 불과 다섯살 차이라도 큰 차이가 있지만 45세의 경우는 10년 정도의 격차는 나야 사용하는 언어에 차이가 나타난다”고 밝혔다.

트웬테대 연구진은 메이르텐스 네덜란드언어문화연구소와 함께 다국어 지원 서비스를 제공하고 페이스북 등 다른 소셜네트워크 사이트에도 프로그램을 적용하는 방식을 고려하고 있다.

연합뉴스

Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
close button
많이 본 뉴스
1 / 3
가수 유승준의 한국비자발급 허용에 대한 당신의 생각은?
가수 유승준이 한국 입국비자 발급을 거부한 처분을 취소해 달라며 낸 세 번째 소송에서도 승소했다. 다만 이전처럼 주로스앤젤레스(LA) 총영사관이 법원 판단을 따르지 않고 비자 발급을 거부할 경우 한국 입국은 여전히 어려울 수 있다. 유승준의 한국입국에 대한 당신의 생각은?
1. 허용해선 안된다
2. 이젠 허용해도 된다
3. 관심없다.
광고삭제
광고삭제
위로