
メタは、ユネスコと提携して新しいプログラムを開始し、企業が将来利用可能なAIの開発を支援すると述べています。
このプログラムである「言語技術パートナープログラム」は、10時間以上のスピーチ録音と転記、多量の書き込まれたテキスト、さまざまな言語で翻訳された文章セットを貢献できる協力者を求めています。メタによると、パートナーは会社のAIチームと共にこれらの言語をAIスピーチ認識および翻訳モデルに統合し、完成後はオープンソース化されるとのことです。
これまでのパートナーには、人口の少ないカナダ北部の地域であるヌナブト準州政府も含まれています。ヌナブトの一部の住民は、イヌクティット語として知られるイヌクティット系の言語を話します。
メタは、「UNESCOの取り組みを支援するために、特に未開発言語に焦点を当てて取り組んでいます」と、TechCrunchに提供されたブログ投稿で述べています。「最終的な目標は、言語や文化的バックグラウンドに関係なく、複雑な人間のニーズに理解し応答できる知的システムを作成することです。」
新プログラムに加えて、メタは、言語翻訳モデルの性能を評価するためのオープンソースの機械翻訳ベンチマークをリリースすると述べています。このベンチマークは言語学者によって作成された文章から成り立ち、7つの言語をサポートし、AI開発プラットフォームHugging Faceからアクセスおよび貢献できます。
メタは両プロジェクトを慈善事業として位置づけていますが、向上したスピーチ認識および翻訳モデルには利益があるとのことです。
メタは、AIパワードアシスタントであるMeta AIがサポートする言語の数を引き続き拡大し、クリエイター向けの自動翻訳などのパイロット機能をテストしています。昨年9月には、メタがInstagram Reelsで声を翻訳するツールのテストを開始し、クリエイターがスピーチを吹き替えて自動でリップシンクすることが可能になりました。
メタのプラットフォーム上で英語以外の言語のコンテンツの扱いは、多くの批判の的となっています。1つの報告によると、Facebookは、イタリア語およびスペイン語のCOVIDデマを29%しかフラッグ指定せずに残しましたが、同様の英語のデマは70%がフラグ指定されていないと報告されています。そして、リークされた文書からは、アラビア語の投稿が誤って憎悪表現として頻繁にフラグ指定されていることが明らかにされています。
メタは、翻訳およびモデレーション技術を改善する取り組みを行っていると述べています。