AI システムカード - "Ask Red Hat" AI アシスタント

AI システム名 Ask Red Hat AI アシスタント
バージョン 1.0.0
AI システム開発元 Red Hat, Inc.
セキュリティーに関する連絡先 security@redhat.com
システムカード作成日 2025 年 7 月 15 日
公開日 2025 年 8 月 29 日

ライセンス: Creative Commons Attribution 4.0 International (CC BY 4.0)

目的

"Ask Red Hat" AI アシスタントは、Red Hat カスタマーポータル に統合された AI 搭載のアシスタントです。自然言語クエリーを通じて、お客様が適切な Red Hat のナレッジ、製品ドキュメント、 サポートリソースをすぐに見つけられるようにすることを目的としています。また、問題解決を効率化し、 セルフサービスを向上させ、 Red Hat ユーザーの全体的なサポートエクスペリエンスの強化を目指しています。

技術情報

AI モデル IBM Granite-3.2-8B-Instruct
ホスティングプラットフォーム Red Hat OpenShift Container Platform 4
開発スタック Llama Stack、MongoDB、Python
推論メカニズム Red Hat AI Inference Server
言語 アラビア語、中国語、チェコ語、オランダ語、英語、フランス語、ドイツ語、イタリア語、 日本語、韓国語、ポルトガル語、スペイン語。
ガードレール IBM granite-guardian-3.2-5b

データの来歴と系譜

AI システムに使用されるベースモデルは、IBM Granite-3.2-8B-Instruct です。モデル カードは、 ibm-granite/granite-3.2-8b-instruct · Hugging Face で入手できます。これらのモデルの データ来歴に関する詳細は、 https://arxiv.org/pdf/2405.04324 を参照してください。

ガードレールは、IBM granite-guardian-3.2-5b で構成されています。モデル カードは、 ibm-granite/granite-guardian-3.2-5b · Hugging Face で入手できます。これらのモデルのデータ来歴 に関する詳細は、 https://arxiv.org/pdf/2412.07724 を参照してください。

上記のリンクには、 特定の当該モデルのトレーニングデータに関する情報が記載されています。

「ナレッジベースの記事、ドキュメント、 および https://access.redhat.com/https://docs.redhat.com/https://console.redhat.com/ からのコンテンツ」である Red Hat のコンテンツが、知識の補完のために使用されます。

AI システムのセキュリティーと安全性

目的と用途:

Ask Red Hat は、Red Hat 製品ユーザー向けに設計された AI 搭載のアシスタントです。 ユーザーは、自然言語クエリーを使用して、 一般提供されている Red Hat のナレッジ、製品ドキュメント、セキュリティーデータ、サポートコンテンツ、 およびその他の役立つ情報を検索および取得できます。想定されるユーザーには、 既存の承認済み情報への、より迅速かつ直感的なアクセスを求める Red Hat のお客様、 パートナー、およびその他の製品ユーザーが含まれます。この AI システムは、 すでにお客様向けに公開されている情報を使用して質問に回答するよう、特別に設計されています。 これにより、回答は文書化された Red Hat のガイダンスと一致し、 業務での使用において安全なものとなります。このシステムは、 エクスプロイトや専有コンテンツの生成には使用できません。 これは、情報に基づいた効率的なトラブルシューティングとラーニングエクスペリエンスを支援することを目的としています。

対象範囲:

Ask Red Hat の対象範囲は、 社内限定または機密情報の開示を必要とする質問への回答を明示的に除外しています。プロンプトインジェクションによるシステムレベルの指示の変更は サポートしておらず、 そのような試みは拒否または無効化されます。クロスサイトスクリプティング (XSS) のようなセキュリティートピック全般について議論することはできますが、 その回答は、段階的なエクスプロイトの手順ではなく、 公開されている予防的または教育的な情報のみに限定されます。Red Hat とは無関係のトピックから外れた質問に回答することもありますが、 そのようなやり取りはサポート対象外です。AI が意図せず無害なロールプレイングに応じたり、 トピックから外れた回答をしたりすることがあっても、 それらは許容範囲内とみなされ、特に修正の対象とはなりません。この AI システムで使用されているモデルは、 複数の生成 AI タスクに適していますが、 安全性に関するアライメントは実施されていません。 そのため、特定の巧妙に作成されたプロンプトで使用された場合、問題のある出力を生成する可能性があります。

セキュリティーに関する考慮事項:

システムの悪用を避けるために Granite Guardian のような保護措置やレート制限といった対策が導入されていますが、 この種のシステムは、 特定の固有のセキュリティーおよび安全上のリスクの影響を受けやすい可能性があります。さらに、 このシステムは、セキュリティーに関する質問に対して安全な方法で回答するように設計されています。

セキュリティー上の欠陥と安全上の問題:

このセクションでは、AI システムで修正されたセキュリティー上の欠陥と 安全上の問題 について記載しています。

問題 ID 説明
RHSECAI-2025-0001 有害または悪意のあるクエリーの検出および拒否メカニズムを実装します。 (2025 年 4 月に修正)
基盤となるコンポーネントに影響を与える、公開済みのさまざまなCVE既知のセキュリティー上の欠陥を軽減するため、 Llama Stack およびその他のコンポーネントを更新します。`UnsupportedInputDetector` のロジックを実装します。 (2025 年 5 月に修正)
RHSECAI-2025-0002 パイプラインのすべての箇所で、入力が確実にサニタイズされるようにします。 安全性関連の統合テストをより詳細に行います。 (2025 年 7 月に修正)
RHSECAI-2025-0003 カスタムのリスク定義を使用して、 ガードレールセキュリティーの強化を実装します。Granite Guardian を 3.2 モデルにアップグレードします。セキュリティー向上のため、 ユーザー入力ロギングのサニタイゼーションを強化します。 (2025 年 8 月に修正)

ガバナンス

AI システム に関するセキュリティーまたは安全性に関する問題は、 security@redhat.com までご報告ください。

参照