asgeirtj/system_prompts_leaks
主な特徴
- 主要AIサービス7社以上のシステムプロンプトを網羅的に収集
- プロンプトの最新版と履歴版を両方保持
- 各AIモデルの特定バージョン(GPT-4o、Claude Sonnet 4、Grok 4など)のプロンプトを詳細に分析
- コミュニティからのプルリクエストによる継続的な更新
- JSONエスケープ、Unicode文字の説明付きドキュメント化
- APIシステムプロンプトとWeb版システムプロンプトの区別
リポジトリ解析: asgeirtj/system_prompts_leaks
基本情報
- リポジトリ名: asgeirtj/system_prompts_leaks
- 主要言語: JavaScript
- スター数: 17,520
- フォーク数: 2,845
- 最終更新: 2025年8月(27f10d1 Rename luma-2025-8-26.md to lumo-2025-8-26.md)
- ライセンス: No license
- トピックス: AI system prompts, chatbots, prompt engineering, AI research
概要
一言で言うと
世界中の主要なAIチャットボット(ChatGPT、Claude、Geminiなど)のシステムプロンプトを収集・公開している研究用リポジトリ。
詳細説明
このリポジトリは、OpenAI(ChatGPT)、Anthropic(Claude)、Google(Gemini)、xAI(Grok)、Perplexity、その他のAIサービスで使用されているシステムプロンプト(システムメッセージ)を収集したコレクションです。これらのプロンプトは通常、AIモデルの動作を制御する内部指示として使用されており、一般には公開されていない情報です。研究者、開発者、AI愛好家がAIモデルの動作原理を理解するための貴重なリソースとして機能しています。
主な特徴
- 主要AIサービス7社以上のシステムプロンプトを網羅的に収集
- プロンプトの最新版と履歴版を両方保持
- 各AIモデルの特定バージョン(GPT-4o、Claude Sonnet 4、Grok 4など)のプロンプトを詳細に分析
- コミュニティからのプルリクエストによる継続的な更新
- JSONエスケープ、Unicode文字の説明付きドキュメント化
- APIシステムプロンプトとWeb版システムプロンプトの区別
使用方法
インストール
前提条件
- Git(リポジトリをクローンする場合)
- ウェブブラウザ(GitHub上で閲覧する場合)
- テキストエディタ(プロンプトを分析・編集する場合)
インストール手順
# 方法1: GitHubリポジトリを直接閲覧
# https://github.com/asgeirtj/system_prompts_leaks
# 方法2: リポジトリをローカルにクローン
git clone https://github.com/asgeirtj/system_prompts_leaks.git
cd system_prompts_leaks
基本的な使い方
研究・分析目的での閲覧
# 特定のAIモデルのプロンプトを閲覧
cat OpenAI/GPT-4o.md
cat Anthropic/claude-sonnet-4.md
cat xAI/grok-4.md
実践的な使用例
<!-- プロンプトエンジニアリング研究での活用例 -->
1. ClaudeとChatGPTのシステムプロンプトを比較
2. 各モデルの安全性ガイドラインを分析
3. ツール利用方法の指示を研究
4. 独自AIシステム開発時の参考資料として活用
高度な使い方
# 複数モデルのプロンプト比較分析
grep -r "safety" OpenAI/ Anthropic/ Google/
# JSONエスケープ文字の処理
python -c "import json; print(json.loads(open('claude.txt').read()))"
# プロンプトの進化を時系列で分析
git log --oneline --follow OpenAI/GPT-4o.md
ドキュメント・リソース
公式ドキュメント
- readme.md: プロジェクト概要とStar Historyチャート
- Anthropic/readme.md: Claudeシステムプロンプトの詳細解説(文字エンコーディング、ツール定義等)
- OpenAI/API/readme.md: OpenAI API版プロンプトの説明
- 個別プロンプトファイル: 各AIモデルの具体的なシステムプロンプト
サンプル・デモ
- OpenAI/GPT-4o.md: ChatGPTの基本システムプロンプト例
- Anthropic/claude-sonnet-4.md: Claudeの引用指示、アーティファクト作成指示等
- xAI/grok-4.md: Grokの個性的なシステムプロンプト
- 各社API版プロンプト: Web版とAPI版の違いを示すサンプル
チュートリアル・ガイド
- GitHubリポジトリ内でのプルリクエスト作成ガイド
- 各社プロンプトの読み方・解釈方法
- JSONエスケープ文字の処理方法説明
技術的詳細
アーキテクチャ
全体構造
シンプルな静的ドキュメントコレクション形式。各AI企業・サービスごとにディレクトリを分け、Markdownファイル形式でシステムプロンプトを保存する階層構造を採用。バージョン管理はGitで行い、履歴追跡と継続的更新を可能にしている。
ディレクトリ構成
system_prompts_leaks/
├── readme.md # プロジェクト概要
├── claude.txt # Claude基本プロンプト
├── Anthropic/ # Claude関連プロンプト
│ ├── readme.md # Claude詳細解説
│ ├── claude-sonnet-4.md # Claude Sonnet 4プロンプト
│ ├── claude-code.md # Claude Codeプロンプト
│ └── claude.ai-injections.md # 注入攻撃例
├── OpenAI/ # ChatGPT関連プロンプト
│ ├── API/ # API版プロンプト
│ ├── GPT-4o.md # GPT-4o基本プロンプト
│ ├── gpt-5-thinking.md # GPT-5思考プロンプト
│ └── tool-*.md # 各種ツール定義
├── Google/ # Gemini関連プロンプト
├── xAI/ # Grok関連プロンプト
├── Perplexity/ # Perplexity関連プロンプト
├── Proton/ # Proton AI関連プロンプト
└── Misc/ # その他AIサービス
主要コンポーネント
- 企業別ディレクトリ: 各AI企業のプロンプトを体系的に整理
- 場所:
OpenAI/,Anthropic/,Google/,xAI/など - 依存: Git履歴管理
- インターフェース: Markdown形式の静的ファイル
- 場所:
- プロンプトファイル: 個別モデルのシステムプロンプト
- 場所: 各企業ディレクトリ内の
.mdファイル - 依存: 特定のAIモデルバージョン
- インターフェース: プレーンテキスト形式のプロンプト内容
- 場所: 各企業ディレクトリ内の
技術スタック
コア技術
- 言語: Markdown(ドキュメント)、一部JavaScript(GitHub Pages用)
- フレームワーク: 使用なし(静的サイト)
- 主要ライブラリ:
- Git: バージョン管理とコラボレーション
- GitHub: ホスティング、イシュー管理、PR機能
- Star History API: スター数推移の可視化
開発・運用ツール
- ビルドツール: 不要(静的ファイル)
- テスト: 手動検証(プロンプト精度確認)
- CI/CD: GitHubの基本機能のみ
- デプロイ: GitHub Pages自動デプロイ
設計パターン・手法
- ドキュメント駆動開発: コードではなくドキュメント(プロンプト)が主要成果物
- 階層型分類: AI企業→モデル→バージョンの3層構造で整理
- コミュニティ駆動メンテナンス: プルリクエストによる分散型更新
- 履歴保持: Gitによる変更履歴の完全追跡
データフロー・処理フロー
- 収集: AI研究者・ユーザーがシステムプロンプトを発見・抽出
- 投稿: GitHub PRまたはIssueとして新しいプロンプトを投稿
- 検証: メンテナーが内容を確認・レビュー
- 統合: 適切なディレクトリ構造でマージ
- 公開: GitHub上で即座に公開・閲覧可能
- 活用: 研究者・開発者が参照・分析・学習に利用
API・インターフェース
公開API
GitHub API経由のアクセス
- 目的: プログラム的なプロンプトデータ取得
- 使用例:
# GitHub APIで特定プロンプトを取得
curl -H "Accept: application/vnd.github.v3.raw" \
"https://api.github.com/repos/asgeirtj/system_prompts_leaks/contents/OpenAI/GPT-4o.md"
# リポジトリ全体をクローン
git clone https://github.com/asgeirtj/system_prompts_leaks.git
設定・カスタマイズ
設定ファイル
# 特別な設定ファイルは不要
# 全てMarkdownファイルとして直接閲覧可能
拡張・プラグイン開発
コミュニティ貢献方法:
- 新しいプロンプト発見: AIサービスの新しいシステムプロンプトを発見・抽出
- PR作成: 適切なディレクトリにファイルを追加
- フォーマット統一: Markdown形式でプロンプトを整形
- メタデータ追加: モデル名、バージョン、取得日などを明記
パフォーマンス・スケーラビリティ
パフォーマンス特性
- ベンチマーク結果: 高速なファイルアクセス(静的ファイルのため)
- 最適化手法: GitにLFS不要、全ファイルがテキストベース
スケーラビリティ
- コンテンツ数: 現在100+ファイル、理論上無制限に拡張可能
- コミュニティ規模: 17,520スター、数千人の積極的貢献者
- アクセス負荷: GitHubのインフラに依存、高い可用性を保持
制限事項
- 法的リスク: 企業の内部情報漏洩の可能性
- 更新頻度: AIモデルの更新より遅れることがある
- 精度保証: コミュニティ依存のため、情報精度にバラツキあり
評価・所感
技術的評価
強み
- 希少情報の集積: 通常非公開のAIシステムプロンプトを一元化
- 網羅的なカバレッジ: 主要AIサービス7社以上を網羅
- 継続的更新: コミュニティ駆動で新しいプロンプトを追加
- アクセシビリティ: GitHubで誰でも無料アクセス可能
改善の余地
- 法的リスク管理: 知的財産権や企業情報の取り扱い
- 検証システム: プロンプトの真正性・正确性の保証
- 構造化: 検索機能やメタデータ管理の強化
向いている用途
- AI研究・学術研究: プロンプトエンジニアリングの理論研究
- AIシステム開発: 独自のAIアシスタント開発時の参考
- プロンプト最適化: 既存AIサービスの使い方学習
- AI安全性研究: バイアスや制限の分析
向いていない用途
- 商用利用: ライセンスなしで法的リスクあり
- 悪用・詐欺: AIシステムの脆弱性悪用は非倫理的
- 精度重視の業務: コミュニティ依存で精度保証が困難
総評
AI研究・教育分野にとって極めて貴重なリソース。主要AIサービスのシステムプロンプトを一元的に収集・公開している点で、技術的な貴重性は非常に高い。一方で、法的・倫理的なリスクも伴うため、研究・教育目的での慣用が推奨される。GitHubでの17,520スターはコミュニティの高い関心と価値を物語っている。