asgeirtj/system_prompts_leaks

⭐ 17,520 🍴 2,845 JavaScript📄 No license GitHubで見る →

主な特徴

主要AIサービス7社以上のシステムプロンプトを網羅的に収集
プロンプトの最新版と履歴版を両方保持
各AIモデルの特定バージョン（GPT-4o、Claude Sonnet 4、Grok 4など）のプロンプトを詳細に分析
コミュニティからのプルリクエストによる継続的な更新
JSONエスケープ、Unicode文字の説明付きドキュメント化
APIシステムプロンプトとWeb版システムプロンプトの区別

リポジトリ解析: asgeirtj/system_prompts_leaks

基本情報

リポジトリ名: asgeirtj/system_prompts_leaks
主要言語: JavaScript
スター数: 17,520
フォーク数: 2,845
最終更新: 2025年8月（27f10d1 Rename luma-2025-8-26.md to lumo-2025-8-26.md）
ライセンス: No license
トピックス: AI system prompts, chatbots, prompt engineering, AI research

概要

一言で言うと

世界中の主要なAIチャットボット（ChatGPT、Claude、Geminiなど）のシステムプロンプトを収集・公開している研究用リポジトリ。

詳細説明

このリポジトリは、OpenAI（ChatGPT）、Anthropic（Claude）、Google（Gemini）、xAI（Grok）、Perplexity、その他のAIサービスで使用されているシステムプロンプト（システムメッセージ）を収集したコレクションです。これらのプロンプトは通常、AIモデルの動作を制御する内部指示として使用されており、一般には公開されていない情報です。研究者、開発者、AI愛好家がAIモデルの動作原理を理解するための貴重なリソースとして機能しています。

主な特徴

主要AIサービス7社以上のシステムプロンプトを網羅的に収集
プロンプトの最新版と履歴版を両方保持
各AIモデルの特定バージョン（GPT-4o、Claude Sonnet 4、Grok 4など）のプロンプトを詳細に分析
コミュニティからのプルリクエストによる継続的な更新
JSONエスケープ、Unicode文字の説明付きドキュメント化
APIシステムプロンプトとWeb版システムプロンプトの区別

使用方法

インストール

前提条件

Git（リポジトリをクローンする場合）
ウェブブラウザ（GitHub上で閲覧する場合）
テキストエディタ（プロンプトを分析・編集する場合）

インストール手順

# 方法1: GitHubリポジトリを直接閲覧
# https://github.com/asgeirtj/system_prompts_leaks

# 方法2: リポジトリをローカルにクローン
git clone https://github.com/asgeirtj/system_prompts_leaks.git
cd system_prompts_leaks

基本的な使い方

研究・分析目的での閲覧

# 特定のAIモデルのプロンプトを閲覧
cat OpenAI/GPT-4o.md
cat Anthropic/claude-sonnet-4.md
cat xAI/grok-4.md

実践的な使用例

<!-- プロンプトエンジニアリング研究での活用例 -->
1. ClaudeとChatGPTのシステムプロンプトを比較
2. 各モデルの安全性ガイドラインを分析
3. ツール利用方法の指示を研究
4. 独自AIシステム開発時の参考資料として活用

高度な使い方

# 複数モデルのプロンプト比較分析
grep -r "safety" OpenAI/ Anthropic/ Google/
# JSONエスケープ文字の処理
python -c "import json; print(json.loads(open('claude.txt').read()))"
# プロンプトの進化を時系列で分析
git log --oneline --follow OpenAI/GPT-4o.md

ドキュメント・リソース

公式ドキュメント

readme.md: プロジェクト概要とStar Historyチャート
Anthropic/readme.md: Claudeシステムプロンプトの詳細解説（文字エンコーディング、ツール定義等）
OpenAI/API/readme.md: OpenAI API版プロンプトの説明
個別プロンプトファイル: 各AIモデルの具体的なシステムプロンプト

サンプル・デモ

OpenAI/GPT-4o.md: ChatGPTの基本システムプロンプト例
Anthropic/claude-sonnet-4.md: Claudeの引用指示、アーティファクト作成指示等
xAI/grok-4.md: Grokの個性的なシステムプロンプト
各社API版プロンプト: Web版とAPI版の違いを示すサンプル

チュートリアル・ガイド

GitHubリポジトリ内でのプルリクエスト作成ガイド
各社プロンプトの読み方・解釈方法
JSONエスケープ文字の処理方法説明

技術的詳細

アーキテクチャ

全体構造

シンプルな静的ドキュメントコレクション形式。各AI企業・サービスごとにディレクトリを分け、Markdownファイル形式でシステムプロンプトを保存する階層構造を採用。バージョン管理はGitで行い、履歴追跡と継続的更新を可能にしている。

ディレクトリ構成

system_prompts_leaks/
├── readme.md                    # プロジェクト概要
├── claude.txt                   # Claude基本プロンプト
├── Anthropic/                   # Claude関連プロンプト
│   ├── readme.md               # Claude詳細解説
│   ├── claude-sonnet-4.md      # Claude Sonnet 4プロンプト
│   ├── claude-code.md          # Claude Codeプロンプト
│   └── claude.ai-injections.md # 注入攻撃例
├── OpenAI/                      # ChatGPT関連プロンプト
│   ├── API/                    # API版プロンプト
│   ├── GPT-4o.md              # GPT-4o基本プロンプト
│   ├── gpt-5-thinking.md      # GPT-5思考プロンプト
│   └── tool-*.md              # 各種ツール定義
├── Google/                      # Gemini関連プロンプト
├── xAI/                        # Grok関連プロンプト
├── Perplexity/                 # Perplexity関連プロンプト
├── Proton/                     # Proton AI関連プロンプト
└── Misc/                       # その他AIサービス

主要コンポーネント

企業別ディレクトリ: 各AI企業のプロンプトを体系的に整理
- 場所: OpenAI/, Anthropic/, Google/, xAI/ など
- 依存: Git履歴管理
- インターフェース: Markdown形式の静的ファイル
プロンプトファイル: 個別モデルのシステムプロンプト
- 場所: 各企業ディレクトリ内の.mdファイル
- 依存: 特定のAIモデルバージョン
- インターフェース: プレーンテキスト形式のプロンプト内容

技術スタック

コア技術

言語: Markdown（ドキュメント）、一部JavaScript（GitHub Pages用）
フレームワーク: 使用なし（静的サイト）
主要ライブラリ:
- Git: バージョン管理とコラボレーション
- GitHub: ホスティング、イシュー管理、PR機能
- Star History API: スター数推移の可視化

開発・運用ツール

ビルドツール: 不要（静的ファイル）
テスト: 手動検証（プロンプト精度確認）
CI/CD: GitHubの基本機能のみ
デプロイ: GitHub Pages自動デプロイ

設計パターン・手法

ドキュメント駆動開発: コードではなくドキュメント（プロンプト）が主要成果物
階層型分類: AI企業→モデル→バージョンの3層構造で整理
コミュニティ駆動メンテナンス: プルリクエストによる分散型更新
履歴保持: Gitによる変更履歴の完全追跡

データフロー・処理フロー

収集: AI研究者・ユーザーがシステムプロンプトを発見・抽出
投稿: GitHub PRまたはIssueとして新しいプロンプトを投稿
検証: メンテナーが内容を確認・レビュー
統合: 適切なディレクトリ構造でマージ
公開: GitHub上で即座に公開・閲覧可能
活用: 研究者・開発者が参照・分析・学習に利用

API・インターフェース

公開API

GitHub API経由のアクセス

目的: プログラム的なプロンプトデータ取得
使用例:

# GitHub APIで特定プロンプトを取得
curl -H "Accept: application/vnd.github.v3.raw" \
  "https://api.github.com/repos/asgeirtj/system_prompts_leaks/contents/OpenAI/GPT-4o.md"

# リポジトリ全体をクローン
git clone https://github.com/asgeirtj/system_prompts_leaks.git

設定・カスタマイズ

設定ファイル

# 特別な設定ファイルは不要
# 全てMarkdownファイルとして直接閲覧可能

拡張・プラグイン開発

コミュニティ貢献方法:

新しいプロンプト発見: AIサービスの新しいシステムプロンプトを発見・抽出
PR作成: 適切なディレクトリにファイルを追加
フォーマット統一: Markdown形式でプロンプトを整形
メタデータ追加: モデル名、バージョン、取得日などを明記

パフォーマンス・スケーラビリティ

パフォーマンス特性

ベンチマーク結果: 高速なファイルアクセス（静的ファイルのため）
最適化手法: GitにLFS不要、全ファイルがテキストベース

スケーラビリティ

コンテンツ数: 現在100+ファイル、理論上無制限に拡張可能
コミュニティ規模: 17,520スター、数千人の積極的貢献者
アクセス負荷: GitHubのインフラに依存、高い可用性を保持

制限事項

法的リスク: 企業の内部情報漏洩の可能性
更新頻度: AIモデルの更新より遅れることがある
精度保証: コミュニティ依存のため、情報精度にバラツキあり

評価・所感

技術的評価

強み

希少情報の集積: 通常非公開のAIシステムプロンプトを一元化
網羅的なカバレッジ: 主要AIサービス7社以上を網羅
継続的更新: コミュニティ駆動で新しいプロンプトを追加
アクセシビリティ: GitHubで誰でも無料アクセス可能

改善の余地

法的リスク管理: 知的財産権や企業情報の取り扱い
検証システム: プロンプトの真正性・正确性の保証
構造化: 検索機能やメタデータ管理の強化

向いている用途

AI研究・学術研究: プロンプトエンジニアリングの理論研究
AIシステム開発: 独自のAIアシスタント開発時の参考
プロンプト最適化: 既存AIサービスの使い方学習
AI安全性研究: バイアスや制限の分析

向いていない用途

商用利用: ライセンスなしで法的リスクあり
悪用・詐欺: AIシステムの脆弱性悪用は非倫理的
精度重視の業務: コミュニティ依存で精度保証が困難

総評

AI研究・教育分野にとって極めて貴重なリソース。主要AIサービスのシステムプロンプトを一元的に収集・公開している点で、技術的な貴重性は非常に高い。一方で、法的・倫理的なリスクも伴うため、研究・教育目的での慣用が推奨される。GitHubでの17,520スターはコミュニティの高い関心と価値を物語っている。