デジタル国家ウクライナ デジタル国家ウクライナ

エビデンス検索エンジンの衝撃

~フェイクニュース時代に登場した次世代検索エンジンの可能性~

柏村 祐

目次

1.情報発信元の信頼性に関する問題

ビジネスにおいては、さまざまな局面でインターネットを通じて情報を収集する機会がある。マイクロソフトエッジやグーグルクロームに代表される検索エンジンの利用者は、瞬時に世界中の膨大な情報にアクセスできる。調べたいことを文章や単語で検索エンジンに入力すると、関連するリンク先が複数リスト形式で表示される。検索エンジンの利用者は、通常、検索結果の上位に表示されたものから読むことが多いが、それらが正しい情報なのか、信頼のおける情報発信元によるものなのか判断するのは難しい。

筆者は以前、会話型検索エンジンについてレポートしている(注1)。会話型検索エンジンには、情報発信元を明示する形でAIが文章を生成してくれる機能がある。ただ、その結果に表示される情報発信元にはさまざまな企業や個人が含まれており、情報の正確性については、検索エンジンの利用者が1つ1つ確認する必要がある。

このAIが生成した文章に表示される情報発信元の信頼性に関する問題を解消するテクノロジーとして、エビデンス検索エンジンが登場している。

本稿では、そのエビデンス検索エンジンについて概観し、その可能性について解説する。

2.エビデンス検索エンジンとは

エビデンス検索エンジンとは、調べたいことを単語または文章を入力することにより、研究論文のみから検索結果を表示する検索エンジンである。このエビデンス検索エンジンは、科学的知見に基づいた論文が掲載される何億もの論文から関連する原著論文を探し出し、論文の著者が証拠に基づいて質問に対する所見を述べているときに、AIが文章を生成する。このデータベースは、世界中の500以上の学術雑誌、大学の出版物、学会からのコンテンツを提供している(注2)。

また、検索結果に対してAIが生成する文章には、検索結果に表示された研究論文がいつどこに掲載されたのかが明示される。

エビデンスとは、ある事実を証明するための根拠であり、研究論文の中から根拠となる事実を調査するためには膨大な時間や労力を要する。科学的知見に基づいた研究論文を検索するため、エビデンス検索エンジンの利用者は、情報発信元を1つ1つ確認するプロセスを省略できる。

そこで、実際に具体的なテーマでエビデンス検索エンジンに検索させ、その性能を検証してみよう。まず、筆者の専門分野であるテクノロジーに関連する質問として、「SNSは睡眠に悪い?」という質問をエビデンス検索エンジンに入力してみた。この質問に対して、エビデンス検索エンジンは、インターネット上に公開されている研究論文を探索し、それぞれの概要をリスト形式で文章を生成した(図表1赤枠)。さらに表示された内容の詳細を知りたい場合、原文となる研究論文の本文も閲覧できる。

図表1
図表1

また、「SNSは睡眠に悪い?」という質問に対して、エビデンス検索エンジンは、抽出した研究論文が肯定的なのか否定的なのかについて「はい」、「たぶん」、「いいえ」のいずれかに分類してくれる(図表1青枠)。その結果、利用者は「SNSは睡眠に悪い?」という問いに対して、検索結果として表示されたそれぞれの論文が質問に対して肯定的なのか、否定的なのかを瞬時に把握できる。さらに、検索された研究論文が肯定的なのか、否定的なのかの全体像を把握するためのサマリー機能も搭載されている。「SNSは睡眠に悪い?」という質問については、71%が「はい」、21%が「たぶん」、7%が「いいえ」というサマリーが表示された(図表2)。

図表2
図表2

次に、テクノロジーに関連する質問として「人工知能とは何?」という質問をエビデンス検索エンジンに入力してみた。この質問に対して、インターネット上に公開されている研究論文を探索し、それぞれの概要がリスト形式で生成された(図表3)。今回の「人工知能とは何?」という質問は、良いか悪いかを問う質問ではないため、「はい」や「いいえ」のサインは付かない。

図表3
図表3

3.エビデンス検索エンジンの可能性

以上のように、エビデンス検索エンジンは、自分が知りたい内容を検索エンジンに書き込むと、質問に関連する研究論文を探索し、リスト形式で回答してくれる。さらに、ある事柄・事象について良いか悪いか質問する場合、検索された論文内容を解析し、各論文が質問に対して肯定的なのか否定的なのかを分類表示し、そのサマリー結果を表示するなど、検索者が正しい情報を迅速に把握するための機能を有する。

現在普及している検索エンジンでは、検索結果の情報発信元は、さまざまな国・企業・個人の情報が混在しているのが一般的だ。そのため、根拠がない、あるいは間違った情報の検索結果も混在することから、フェイクニュースとして誤情報が拡散したり、その後の世論形成に悪影響を及ぼしたり、国・企業・個人に対する偏見や差別につながる可能性がある。

大量の情報がインターネット上に氾濫する現在、エビデンス検索エンジンは、研究論文というエビデンスにもとづく知見を得られる世界を実現している。ただ、エビデンスにもとづく研究論文とはいえ、その知見は執筆者自身の価値判断によるものであり、無条件に正しいと判断することはできない。

そのため、エビデンス検索エンジンはフェイクニュースや科学的な根拠がない情報をフィルタリングしたうえで、論文著者自身の行った研究活動を通じて得られた知見のみを検索エンジンの利用者に提供してくれる。また、検索結果として上位に来るから信頼性が高いというような優劣は存在しない。

このことは、従来の検索エンジンでは、さまざまな発信元の情報が混在していることから、1つ1つの情報発信元を確認しなければ信用できない問題を改善しているのではないだろうか。

また、インターネット上に氾濫する情報の世界の中で、エビデンスがついた研究論文から情報を得ることは、その情報を基に展開されるビジネスへの展開・発展や社会課題の解決を行う前提として価値があるだろう。今後、エビデンス検索エンジンは研究論文をいち早く収集する仕組みとして、さらなる発展と普及が期待されるところである。

【注釈】

  1. 会話型検索エンジンの衝撃~生産性向上につながる検索エンジンの可能性~
    https://www.dlri.co.jp/report/ld/232635.html
  2. Semantic Scholarより
    https://www.semanticscholar.org/about/publishers

柏村 祐


本資料は情報提供を目的として作成されたものであり、投資勧誘を目的としたものではありません。作成時点で、第一生命経済研究所が信ずるに足ると判断した情報に基づき作成していますが、その正確性、完全性に対する責任は負いません。見通しは予告なく変更されることがあります。また、記載された内容は、第一生命保険ないしはその関連会社の投資方針と常に整合的であるとは限りません。

柏村 祐

かしわむら たすく

ライフデザイン研究部 主席研究員 テクノロジーリサーチャー
専⾨分野: AI、テクノロジー、DX、イノベーション

執筆者の最新レポート

関連レポート

関連テーマ