
[더구루=정등용 기자] 글로벌 플랫폼 기업 메타(Meta)가 전세계 200개 언어를 번역할 수 있는 최신 인공지능(AI) 번역 모델을 선보였다. 여러 연구원들이 함께 참여하기 위한 오픈 소스도 함께 공개했다.
8일 관련 업계에 따르면 메타는 전세계 대부분의 언어를 고품질 기계로 번역할 수 있는 NLLB(No Language Left Behind)-200을 개발했다.
이번 모델은 기존 번역 기술과 비교해서 평균 44% 높은 점수를 받았다. 일부 아프리카어와 인도어 기반 언어의 경우 NLLB-200의 번역 정확도가 70%이상 정확하다는 게 업체 설명이다.
이와 함께 메타는 NLLB-200의 성능을 평가할 수 있는 데이터 세트인 FLORES-200도 함께 구축했다. FLORES-200을 사용하면 각 언어로 NLLB-200의 성능을 측정해 번역 품질의 정도를 가늠해 볼 수 있다.
메타는 다른 연구원들이 이번 모델의 성능을 개선할 수 있도록 NLLB-200과 FLORES-200의 데이터셋도 공개하고 있다. 더불어 모델 교육 코드와 교육 데이터셋을 다시 만들기 위한 코드도 함께 공유 중이다.
또한 NLLB-200을 사용해 2개 이상의 아프리카 언어를 번역하는 데 관심이 있는 비영리단체나 언어학·기계번역·언어기술 분야 연구원들을 지원하고 있다.
메타 관계자는 “NLLB-200은 종종 감정이나 내용을 잘못 이해하는 중간 언어를 요구하기보다 더 많은 사람들이 선호하는 언어로 읽을 수 있도록 도와줄 것”이라고 말했다.