인공지능이 성경 등 활용해 4천 개 이상 언어 보존

뉴욕=김유진 기자     |  

메타, ‘대규모 다국어 음성’ 프로젝트 계획 발표

ⓒKira-Yan/ iStock

ⓒKira-Yan/ iStock

미국의 페이스북과 인스타그램의 모회사인 메타(Meta)가 성경과 다른 종교 문헌을 활용해 4천 개 이상의 언어를 처리하고 보존하기 위한 프로젝트 계획을 발표했다.

미국 크리스천포스트(CP)에 따르면, 메타 인공지능(AI) 연구팀은 ‘대규모 다국어 음성’(Massively Multilingual Speech, 이하 MMS) 프로젝트의 자료 수집을 위해 성경 및 기타 종교 문헌을 활용했다. 이는 수천 개의 언어에 대한 데이터 수집을 위한 것으로, 기존의 음성 데이터 세트는 100개 이상의 언어를 처리하지 못했다.

연구팀은 세계 각지에서 번역된 성경 및 오디오 녹음본을 활용해 1,100개 이상의 언어로 된 신약 성경 읽기 데이터 세트를 생성했으며, 각 언어마다 약 32시간의 데이터가 포함됐다.

메타는 신약성경 27권과 260장을 처리하기 위해 바이블닷컴(Bible.com)과 고투바이블(GoTo.Bible) 및 페이스컴스바이히어링(FaithComesByHearing)의 데이터를 활용했으며, 여기에는 원문 본문과 오디오 녹음이 수록돼 있다.

메타 AI팀은 이후 “다양한 다른 기독교 종교 서적의 미분류된 녹음을 활용해 이 작업을 발전시켰다”고 밝혔다. 녹음본은 주로 남성 화자에 의해 진행됐지만, 연구팀은 “언어 모델이 남성과 여성 목소리에 동일한 수준으로 잘 작동한다”고 밝혔다.

또 연구팀은 “이는 기독교 윤리학자들과의 협의하에 진행됐다. 그들은 대부분의 기독교인들이 신약성경 및 번역본이 신성해 기계 학습에 사용하기에 무리라고 보지 않을 것이라고 결론지었다”며 “다만 꾸란은 번역이 불가한 것으로 여겨졌다”고 했다.

해당 논문은 2019년 CMU 윌더니스(CMU Wilderness) 프로젝트의 사례를 소개하며, 700여 개 언어에 대한 음성 합성 모델을 생성하는 데 성경이 사용됐음을 강조했다. 아울러 MMS 프로젝트가 “기계 학습 모델을 훈련하고 평가하기 위해 신약을 활용해 온 오랜 연구의 연장선에 있다”고 연구팀은 전했다.

논문은 또 종교 기반 훈련 데이터가 언어 모델에 ‘특정 세계관’에 대한 편향을 생성할 수 있는 가능성에 대해 언급했다. 이에 대해 AI팀은 “이러한 위험성을 낮게 평가한다”며 “해당 모델이 생성하는 언어는 다른 도메인에서 훈련된 모델과 비교해 거의 편향을 보이지 않는다”고 했다.

메타 측은 “세계의 많은 언어가 사라질 위기에 처해 있으며, 현재의 음성 인식 및 생성 기술의 한계는 이러한 추세를 가속화시킬 것”이라며 “우리는 기술이 정반대 효과를 가져오는 세상을 상상하고 있다. 사람들이 선호하는 언어로 말하고 정보에 접근하고 기술을 사용함으로써, 언어를 활발히 사용하여 언어 보존을 장려한다”고 했다.

인공지능에 성경이 활용된 것은 이번이 처음이 아니다. 2020년 6월 기독교 명상 앱인 소울타임(Soultime)의 제작자들은 당시 세계 최초로 인공지능 음성으로 성경 전체를 낭독하는 오디오 버전을 출시했다. 해당 앱에는 100시간 분량의 오디오 성경이 수록돼 있다.

<저작권자 ⓒ '종교 신문 1위' 크리스천투데이, 무단전재 및 재배포 금지>
구독신청

많이 본 뉴스

123 신앙과 삶

CT YouTube

더보기

에디터 추천기사

탈북민 강제북송

“中·北, 유엔 인권이사회 WGAD 결정사항 준수하라”

中, 탈북민 2천여 명 즉시 석방을 강제송환 금지 원칙 준수 촉구해 인권 존중하고 난민 지위 보장도 세계인권선언·자유권 규약 준수 ‘중국정부 탈북난민 강제북송 반대 기자회견’이 11월 25일 오후 서울 명동 중국대사관 입구에서 개최됐다. 탈북민 강제북…

‘성혁명 교육 반대 학부모기도운동연합(이하 성반학연)’

“성오염 교육서 자녀들 구하자”… 기독 학부모들 연대

“성혁명과 (포괄적) 차별금지법 교육을 반대하는 일은 성경을 믿는 학부모 성도들이 우리 자녀세대들을 구하기 위해 마땅히 해야 할 거룩한 사명이다.” 한국 교육계 전반에 이념적인 성혁명 교육이 광범위하게 시도되는 상황에서, 이를 막아서는 일에 앞장서 …

중국, 가톨릭, 상하이 교구,

“中 가톨릭 주교, 박해에 무관심… ‘’종교 중국화”만 집중

중국에서 가톨릭 주교 10명이 구금 또는 실종되거나 직위에서 강제로 물러났음에도 불구하고, 상하이 정부에 의해 임명된 주교는 최근 회의에서 시진핑 주석의 ‘종교 중국화’에 대해서만 언급한 것으로 알려졌다. 인권 매체 ‘비터윈터’는 “2023년 4월 4일 중…

한교총 8차 임원

한교총, 새 대표회장에 김종혁 목사… 차기 임원 인선 완료

한국교회총연합(대표회장 장종현 목사, 이하 한교총)이 제8회기 대표회장에 김종혁 목사(예장 합동 총회장)를 선임하는 등 차기 임원진 인선을 마무리했다. 한교총은 9일 오후 서울 한국교회백주년기념관 소강당에서 제7-6차 상임회장회의·제7-1차 임원회 연석회…

기침 총회 114

이욥 목사, 천신만고 끝에 기침 총회장 당선

소송전 벌였던 이욥 목사 사과해 총회장 복귀 이종성 목사도 사과 1차 투표서 과반, 상대 후보 사퇴 동성애 지지 행사 및 집회에 참석 또는 개최/주관 금지 결의도 통과 정기총회에서 총회장을 선출하지 못한 기독교한국침례회(이하 기침) 총회가 이욥 목사(대…

k-ccm

주찬양·시인과촌장부터 위러브·히스플랜까지 CCM 사역자들 ‘한자리’

공로상 7인과 조현삼 목사 수여 앨범·워십·CCM 부문별 시상도 2년간 발표된 2,396곡에서 엄선 한국기독음악협회(회장 안민·송정미, 이하 K-CCM)에서 주관한 ‘2024 K-CCM 어워즈(AWARDS)’가 처음으로 지난 11월 25일 서울 용산구 삼일교회(담임 송태근 목사)에서 개최됐…

이 기사는 논쟁중

인물 이 사람