Anthropic Citation API で実現する高精度な引用付き生成AI


はじめに
「生成AIは便利だが、業務・法律的に本当に正しいこと言ってるのか。」
これは生成AI活用を進めるビジネスの現場で、非常によく聞く声のひとつです。
2025年8月現在、生成AIでRAGの技術を使用し、社内のデータから適切な情報を参照するという用途が広く使われています。
一方でビジネスにおいては、契約や法律関係の文書、製品仕様書など、一部のドキュメントでざっくりとした引用を提示するだけでは十分とはいえない用途があるのも事実です。
今回は Anthropic が2025年1月にリリースした Citation API に注目し、RAGによる詳細な根拠の出力・引用についてご紹介します。
RAG とは何か?
引用の詳しい話に入るまでに、社内ドキュメント等を検索できる RAG(Retrieval-Augmented Generation)の仕組みについて簡単に説明します。
RAG とは、「検索付き生成」とも呼ばれる、生成AIの性能と正確性を高めるための仕組みです。名前の通り、以下の2つの処理を組み合わせて動作します。
Retrieval(検索)
ユーザーの質問に対して、あらかじめ用意された社内文書やナレッジベース、Web情報などから関連するテキストを検索・取得します。
Generation(生成)
検索で得た情報を元に、GPTなどの生成AIが自然な文章で回答を生成します。
なぜ RAG が重要なのか?
従来の生成AI(例:ChatGPT)は、あくまで訓練時の情報を元に回答するため、「社内特有の文書」「最新の製品仕様」「業界固有の用語」などに対しては、不正確な回答をしてしまうことがありました。
そこで RAG によって適切な背景情報を与えることで、ビジネスでの利用に役立つレベルまで精度を上げることができることから、 RAG の技術が重要視されてます。
ChatGPT, Gemini, NotebookLM における引用
ChatGPT や Gemini がWeb検索の結果を元に回答をする場合、多くのケースで段落などの単位で適切に引用を付与してくれます。

上記のケースでは、弊社の資本金について、カイシャリサーチというサイトの情報を元に回答してくれていることが分かります。
また、 ChatGPT の Projects の機能であれば、アップロードしたファイルなどからファイル名を引用して回答してくれますし、DeepResearchなどの機能でも同様にWebのソースを表示しながら回答してくれます。
Google が提供する NotebookLM では、アップロードしたファイルを元に、ファイル名だけでなく、ファイルの中身のどの文章を参考にしたのかを、文単位で引用してくれます。
以下は NotebookLM で弊社のWebサイトの会社情報ページのソース文書を与え、所在地を質問した例です。根拠は1文毎に出力してくれますが、引用している文章がソース文書内のどの箇所かまでは詳しく表示してくれないことが分かります。

なぜビジネスにおけるRAGに引用が必須なのか
生成AIを業務活用する際の最大の障壁は、「出力の根拠が分からない」ことです。
先述の ChatGPT や Gemini などの引用機能は物にもよりますが、あくまでどのWebサイトか、どのファイルか、というレベルでしか引用をしてくれず、Webサイトやファイルのどの文章を引用したのかのレベルまでは詳しく分からないケースもあります。
根拠が分からないのでAIの回答が正しいかをソースをあたって確認するというある種二度手間のようなことが発生するケースも珍しくありません。
そこで、Webサイトやファイルより細かい単位で引用をしてくれる Citations を使うと、AIが回答するのに参照した文・段落の出所と位置を把握できるため、監査・説明責任・ナレッジ管理の観点で非常に有効です。
特に法務・品質保証・経営レポートのような「誤りが高コスト」な領域では、引用の明示が必須といえるレベルで重要となります。さらに、「なぜその判断・結論なのか」を自分ですぐに辿れることで、AI活用への信頼と継続利用率が高まります。
このことから高品質で粒度の細かい引用は、ビジネスにおいて必須であるといえることが分かります。
引用機能が業務にもたらす3つのメリット
- 誤った情報を業務に反映してしまうリスクを回避できる
- 根拠をすぐに確認できて、書類作成が迅速になる
- 監査・レビュー時の説明責任が果たせる
Anthropic Citation API による詳細な引用の実現
そんな中、 Anthropic が 2025年1月に Citation API をリリースしました。
この機能はソース文書を提供すると、AIの出力に細かくどの文書からの引用による回答かを示してくれる機能であり、独自に実装した多くの引用機能よりも精度良く引用を作成してくれるものでした。
サンプルとして公開されているAPIを実行すると、下記のような結果が得られます。
{
"id": "msg_01LCi47kcZWxqVisL5Xy2hm2",
"content": [
{
"citations": null,
"text": "ドキュメントによると、",
"type": "text"
},
{
"citations": [
{
"cited_text": "草は緑色です。空は青色です。",
"document_index": 0,
"document_title": "私のドキュメント",
"end_char_index": 14,
"start_char_index": 0,
"type": "char_location"
}
],
"text": "草は緑色です。空は青色です。",
"type": "text"
}
],
"model": "claude-opus-4-20250514",
"role": "assistant",
"stop_reason": "end_turn",
"stop_sequence": null,
"type": "message",
"usage": {
"cache_creation_input_tokens": 0,
"cache_read_input_tokens": 0,
"input_tokens": 612,
"output_tokens": 42,
"server_tool_use": null,
"service_tier": "standard"
}
}
少し小難しいフォーマットになっていますが、文章に起こすと下記のような形で引用が実施されています。「私のドキュメント」はアップロードしたファイル名や、参照したドキュメントの名称が入る部分です。
ドキュメントによると、草は緑色です。空は青色です。["私のドキュメント"の「草は緑色です。空は青色です。」から引用]
この機能を用いることで、複雑な業務であってもどの文を参照してAIが回答したかという情報を、さらに細かい粒度で参照することが可能です。
この情報をアプリケーションに組み込めば、この根拠となる情報を詳細に参照しながら業務を進めることができるため、社内ドキュメント検索を業務で活用する上では、非常に重要な機能となります。
まとめ
生成AIを業務に活用する際、単に回答が得られるだけでは不十分であり、「その回答の根拠がどこにあるのか」が明確であることが信頼性を支える鍵となります。特に、法務・品質管理・経営判断といった高精度が求められる業務においては、引用情報の粒度や正確性がAI活用の成否を左右します。
そのような適切な根拠の提示を実現する手段として、 Anthropic の Citation API のような文単位・文字位置単位での引用情報の提供が今後ますます重要になると考えられます。
このような高度な引用機能を活用することで、AIの出力を信頼性の高い情報資源として業務に組み込むことが可能となり、説明責任や監査対応も含めて、生成AIの真価を最大限に引き出すことができます。
株式会社Digeon は法人向けに ChatGPT をセキュアに使えるサービスである「ENSOUチャットボット」を提供しています。
ご相談、無料トライアルは、以下からお問い合わせください👇
サービス紹介資料をこちらからダウンロードいただけます👇