Meta SeamlessM4T를 만나보세요: 다국어 번역기

Meta는 방금 SeamlessM4T라는 인상적인 새 도구를 출시했습니다. 이 멋진 AI 모델은 거의 100개 언어를 기록하고 번역할 수 있으며, 이는 언어 장벽을 과거의 일로 만드는 큰 진전입니다.

이 회사는 대규모 다중 언어 및 다중 모드 기계 번역인 SeamlessM4T가 거의 100개 언어에 대해 음성을 텍스트로, 텍스트를 음성으로 변환할 수 있다고 주장합니다. 100개의 입력 언어를 식별하고 이를 음성-음성 및 텍스트-음성 기능을 위한 35개의 출력 언어로 변환합니다.

Creative Commons CC BY-NC 4.0 라이선스에 따라 배포되므로 연구자는 자유롭게 개선할 수 있습니다. Meta의 공개 번역 데이터 세트의 일부인 SeamlessAlign에 대한 정보도 SeamlessM4T와 함께 제공되었습니다. Meta에 따르면 번역을 여러 시스템으로 나누는 기존의 대규모 번역 모델과 달리 SeamlessM4T는 단일 작업으로 전체 번역 작업을 완료하여 "중요한 혁신"이라고 합니다.

SeamlessM4T가 의도한 대로 작동한다면 흥미로운 측면 중 하나는 코드 전환이나 단일 문구 내에서 두 개 이상의 언어 간 전환을 감지하는 기능입니다. 예를 들어 Meta는 모델이 어떻게 힌디어, 텔루구어, 영어를 즉시 구별할 수 있는지 동영상을 통해 보여주었습니다.

힌디어, 텔루구어, 영어를 쉽게 구별하는 매혹적인 비디오에서 볼 수 있듯이 화자가 언어를 넘나들 때 즉시 식별할 수 있는 잠재력을 자랑합니다. 이 기능은 문화 간 의사소통에 혁명을 일으켜 언어가 더 이상 장벽이 아닌 세상을 조성할 수 있습니다.

"개방형 과학에 대한 접근 방식을 유지하면서 우리는 연구원과 개발자가 이 작업을 기반으로 구축할 수 있도록 연구 라이센스에 따라 SeamlessM4T를 공개적으로 출시할 예정입니다. 또한 현재까지 가장 큰 개방형 다중 모드 번역 데이터세트인 SeamlessAlign의 메타데이터도 공개할 예정입니다. 총 270,000시간에 달하는 음성 및 텍스트 정렬 작업이 이루어졌습니다."라고 Meta는 말합니다.

라마2란 무엇인가요?: 메타의 AI 설명

더 가벼운 모델을 생성하고 더 많은 정보를 관리하기 위해 Meta는 Fairseq 시퀀스 모델링 도구 상자를 수정하여 SeamlessM4T를 생성했다고 주장했습니다.

Meta에 따르면 SeamlessM4T를 생성할 때 유해하거나 민감한 문구를 인식할 수 있는 시스템을 만들었다고 합니다. 메타가 제시한 정의에 따르면, 유해한 단어는 "번역이 증오, 폭력, 욕설 또는 학대를 조장할 수 있는" 단어입니다. 목표는 출력 번역으로 인해 발생한 독성이 이전에 소스 콘텐츠에 존재하지 않았던 사례를 식별할 수 있는 것입니다.

라마2란 무엇인가요?

블로그

Meta SeamlessM4T를 만나보세요: 다국어 번역기