AI 시스템 카드 - "Ask Red Hat" AI 어시스턴트

AI 시스템 이름 Ask Red Hat AI 어시스턴트
버전 1.0.0
AI 시스템 개발 Red Hat, Inc.
보안 관련 문의 security@redhat.com
시스템 카드 작성일 2025년 7월 15일
공개일 2025년 8월 29일

라이선스: Creative Commons Attribution 4.0 International (CC BY 4.0)

목적

"Ask Red Hat" AI 어시스턴트는 Red Hat 고객 포털에 통합된 AI 기반 어시스턴트입니다. 이 도구는 사용자가 자연어 질의를 통해 관련된 Red Hat 지식, 제품 문서 및 지원 리소스를 빠르게 찾을 수 있도록 합니다. 이는 문제 해결을 간소화하고 셀프 서비스 기능을 개선하며 Red Hat 사용자들의 전반적인 지원 경험을 향상시키는 것을 목표로 합니다.

기술 정보

AI 모델 IBM Granite-3.2-8B-Instruct
호스팅 플랫폼 Red Hat OpenShift Container Platform 4
개발 스택 Llama Stack, MongoDB, Python
추론 메커니즘 Red Hat Inference Server
지원 언어 아랍어, 중국어, 체코어, 네덜란드어, 영어, 프랑스어, 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어, 스페인어.
가드레일 IBM granite-guardian-3.2-5b

데이터 출처 및 구성

AI 시스템에 사용된 기본 모델은 IBM Granite-3.2-8B-Instruct입니다. 또한 모델 카드는 다음에서 사용 가능합니다. ibm-granite/granite-3.2-8b-instruct · Hugging Face. 이러한 모델의 데이터 출처에 대한 자세한 내용은 다음에서 확인할 수 있습니다: https://arxiv.org/pdf/2405.04324

가드레일은 IBM granite-guardian-3.2-5b로 구성되어 있습니다. 모델 카드는 다음에서 사용 가능합니다: ibm-granite/granite-guardian-3.2-5b · Hugging Face. 이러한 모델의 데이터 출처에 대한 자세한 내용은 다음에서 확인할 수 있습니다: https://arxiv.org/pdf/2412.07724

위 링크는 특정 모델의 교육 데이터에 대한 정보를 제공합니다.

https://access.redhat.com/https://docs.redhat.com/,https://console.redhat.com/ 에 있는 지식베이스 문서,문서 및 Red Hat 콘텐츠는 기타 지식을 보완하는 데 사용됩니다.

AI 시스템의 보안 및 안전

목적 및 용도:

Ask Red Hat은 Red Hat 제품 사용자들이 자연어 질의를 통해 공개된 Red Hat 지식, 제품 설명서, 보안 데이터, 지원 콘텐츠 및 기타 유용한 정보를 검색하고 찾아볼 수 있도록 설계된 AI 기반 어시스턴트입니다. 이시스템의 주요 사용자에는 Red 고객, 파트너 및 기타 제품 사용자들로 기존의 승인된 정보에 더 빠르고 직관적으로 접근할 수 있습니다. 이 AI 시스템은 이미 고객에게 공개된 정보를 사용하여 질문에 답하도록 특별히 설계되었으며 이를 통해 응답이 문서화된 Red Hat 가이드라인과 일치하고 전문적인 환경에서 안전하게 사용할 수 있도록 보장합니다. 이 시스템은 익스플로잇이나 독점 콘텐츠를 생성하는 데 사용할 수 없으며 사용자들이 충분한 정보를 기반으로 하여 효율적으로 문제를 해결하고 학습할 수 있도록 지원하는 데 목적이 있습니다.

적용 범위:

Ask Red Hat의 범위는 내부적으로만 공개되거나 기밀 정보 공개가 필요한 질문에 대한 답변을 명시적으로 제외합니다. 이 시스템은 프롬프트 인젝션을 통한 시스템 수준 명령어 변경을 지원하지 않으며, 그러한 시도는 거부하거나 무력화합니다. 이 시스템은 일반적으로 XSS(Cross-Site Scripting)와 같은 보안 주제를 논의할 수는 있으나, 일반적인 예방 또는 교육 목적의 공개된 정보만을 다루며 단계별 공격 지침은 제공하지 않습니다. Red Hat과 관련 없는 주제의 질문에 때로는 답변할 수도 있지만, 이러한 상호작용은 지원되지 않습니다. 잔여적으로 발생하는 무해한 롤플레잉이나 주제에서 벗어난 응답을 하는 경우 이는 수용 가능하나 해결 대상 범위에 포함되지 않습니다. 이 AI 시스템에 사용된 모델은 여러 생성 AI 작업에 적합하지만, 별도의 안전성 정렬 과정은 거치지 않았습니다. 따라서 특정하게 조작된 프롬프트가 사용될 경우 문제가 있는 출력을 생성할 가능성이 있습니다.

보안 고려 사항:

Granite Guardian과 같은 보호 장치 및 레이트 리미팅(rate-limiting)과 같은 조치들이 시스템 오용을 방지하기 위해 적용되어 있지만, 이러한 종류의 시스템은 본질적으로 특정 보안 및 안전 위험에 노출될 수 있습니다. 뿐만 아니라, 이 시스템은 보안 관련 질문에 안전한 방식으로 응답하도록 설계되어 있습니다.

보안 결함 및 안전 위험:

이 섹션에서는 AI 시스템에서 수정된 보안 결함 및 안전 위험 요소 를 나열합니다:

문제 ID 설명
RHSECAI-2025-0001 유해하거나 악의적인 쿼리 감지 및 거부하는 메커니즘을 구현합니다. (2025년 4월 수정)
기본 구성 요소에 영향을 미치는 다양한 공개 CVE 알려진 보안 문제를 완화하기 위해 Llama 스택 및 기타 구성 요소를 업데이트합니다. `UnsupportedInputDetector`에 대한 로직을 구현합니다. (2025년 5월 수정)
RHSECAI-2025-0002 파이프라인의 모든 단계에서 입력값이 정화되도록 보장하고 안전 관련 통합 테스트의 범위를 확대합니다. (2025년 7월 수정)
RHSECAI-2025-0003 사용자 정의 위험 정의를 적용하여 가드레일 보안을 강화합니다. Granite Guardian을 3.2 모델로 업그레이드합니다. 보안을 강화하기 위해 사용자 입력 로그의 정화를 개선합니다. (2025년 8월 수정)

거버넌스

AI 시스템과 관련된 모든 보안 또는 안전 문제는 security@redhat.com으로 보고하십시오.

참고 자료