やはり AI 支援 Bing は翻訳の壁を越えられない - 省型旧形国電の残影を求めて

　ちょっと前に書いた記事の中に、Chat GPT 支援を受けた Bing は翻訳の壁を越えられないのではと書きましたが、再度それを確認する経験をしました。

　日本語で、安東から光州までタクシーで行ったらいくらかかるかと尋ねると、いくらかかるかは分からない、と回答してきます。但し、韓国のタクシー利用に関する日本語で書かれた案内サイトは紹介してくれます。

　そこで、韓国語で同様に以下のように尋ねると...

안동에서 광주광역시까지 택시로 가면 요금이 어떻게 됩니까?

　回答は...

안동에서 광주광역시까지 택시로 가면 요금은 약 300,000원 정도입니다. 하지만 이 요금은 2023년 기준이 아니므로 현재 요금과 차이가 있을 수 있습니다.

(安東から光州広域市までタクシーで行くと約30万ウォン程度です。しかしこの料金は、2023年を基準としたものではないので、現在の料金と差があるかもしれません)

とより具体的に回答してきます。

　やはり、それぞれの言語で、Web情報を収集し、質問した言語に合わせて回答してくるようです。

　実はこれを裏付けるような報道もあります。朝日新聞デジタルに下記のような記事があります。

www.asahi.com　これは、2023年6月25日付の報道ですが、日本語で日本語の医師国家試験問題を尋ねると、正答率が 52.8% にとどまり不合格、しかし国家試験問題を英語に翻訳して回答させると、正答率は78.6% で合格ラインを超えるとあります。

　記事には、「チャットGPTの学習データの多くが英語圏のネット情報に由来するとみられるからだという」と書かれていますが、むしろある言語による質問に対する回答は、その言語で書かれたWeb情報に基づくものに限られており、かつ日本語で書かれた情報は不正確なものが英語より多かったため、ではないかと私は思います。

　もちろん、どのようにしてデータ収集を行っているのか公開されていないため、日本語によるデータ収集が不十分な可能性も排除はできません。その一方で、日本人によるWeb上の情報発信量は人口に比べて非常に多いとも言われています。ということは医学情報なども専門家の発信量に比べて、素人の発信量が多く、かなり不正確な情報が横行している可能性も否定できないと思います。あるいは、さらに恐ろしい可能性として、日本人の専門家の専門知識自体、英語圏の専門家に比べて劣っている (例えば、時代遅れの知識を持ち続けている、等) という可能性もあるかもしれません。この辺りは、逆に、日本語コミュニティにおける専門家発信者の多様性が低い、というあたりがその原因になっている可能性もあります。

　このあたりは、私たちネットの情報にどこまで信頼を置いてよいのか、ということとも関連してきます。