asgeirtj/system_prompts_leaks

⭐ 17,520 🍴 2,845 JavaScript📄 No license GitHubで見る →

主な特徴

  • 主要AIサービス7社以上のシステムプロンプトを網羅的に収集
  • プロンプトの最新版と履歴版を両方保持
  • 各AIモデルの特定バージョン(GPT-4o、Claude Sonnet 4、Grok 4など)のプロンプトを詳細に分析
  • コミュニティからのプルリクエストによる継続的な更新
  • JSONエスケープ、Unicode文字の説明付きドキュメント化
  • APIシステムプロンプトとWeb版システムプロンプトの区別

リポジトリ解析: asgeirtj/system_prompts_leaks

基本情報

  • リポジトリ名: asgeirtj/system_prompts_leaks
  • 主要言語: JavaScript
  • スター数: 17,520
  • フォーク数: 2,845
  • 最終更新: 2025年8月(27f10d1 Rename luma-2025-8-26.md to lumo-2025-8-26.md
  • ライセンス: No license
  • トピックス: AI system prompts, chatbots, prompt engineering, AI research

概要

一言で言うと

世界中の主要なAIチャットボット(ChatGPT、Claude、Geminiなど)のシステムプロンプトを収集・公開している研究用リポジトリ。

詳細説明

このリポジトリは、OpenAI(ChatGPT)、Anthropic(Claude)、Google(Gemini)、xAI(Grok)、Perplexity、その他のAIサービスで使用されているシステムプロンプト(システムメッセージ)を収集したコレクションです。これらのプロンプトは通常、AIモデルの動作を制御する内部指示として使用されており、一般には公開されていない情報です。研究者、開発者、AI愛好家がAIモデルの動作原理を理解するための貴重なリソースとして機能しています。

主な特徴

  • 主要AIサービス7社以上のシステムプロンプトを網羅的に収集
  • プロンプトの最新版と履歴版を両方保持
  • 各AIモデルの特定バージョン(GPT-4o、Claude Sonnet 4、Grok 4など)のプロンプトを詳細に分析
  • コミュニティからのプルリクエストによる継続的な更新
  • JSONエスケープ、Unicode文字の説明付きドキュメント化
  • APIシステムプロンプトとWeb版システムプロンプトの区別

使用方法

インストール

前提条件

  • Git(リポジトリをクローンする場合)
  • ウェブブラウザ(GitHub上で閲覧する場合)
  • テキストエディタ(プロンプトを分析・編集する場合)

インストール手順

# 方法1: GitHubリポジトリを直接閲覧
# https://github.com/asgeirtj/system_prompts_leaks

# 方法2: リポジトリをローカルにクローン
git clone https://github.com/asgeirtj/system_prompts_leaks.git
cd system_prompts_leaks

基本的な使い方

研究・分析目的での閲覧

# 特定のAIモデルのプロンプトを閲覧
cat OpenAI/GPT-4o.md
cat Anthropic/claude-sonnet-4.md
cat xAI/grok-4.md

実践的な使用例

<!-- プロンプトエンジニアリング研究での活用例 -->
1. ClaudeとChatGPTのシステムプロンプトを比較
2. 各モデルの安全性ガイドラインを分析
3. ツール利用方法の指示を研究
4. 独自AIシステム開発時の参考資料として活用

高度な使い方

# 複数モデルのプロンプト比較分析
grep -r "safety" OpenAI/ Anthropic/ Google/
# JSONエスケープ文字の処理
python -c "import json; print(json.loads(open('claude.txt').read()))"
# プロンプトの進化を時系列で分析
git log --oneline --follow OpenAI/GPT-4o.md

ドキュメント・リソース

公式ドキュメント

  • readme.md: プロジェクト概要とStar Historyチャート
  • Anthropic/readme.md: Claudeシステムプロンプトの詳細解説(文字エンコーディング、ツール定義等)
  • OpenAI/API/readme.md: OpenAI API版プロンプトの説明
  • 個別プロンプトファイル: 各AIモデルの具体的なシステムプロンプト

サンプル・デモ

  • OpenAI/GPT-4o.md: ChatGPTの基本システムプロンプト例
  • Anthropic/claude-sonnet-4.md: Claudeの引用指示、アーティファクト作成指示等
  • xAI/grok-4.md: Grokの個性的なシステムプロンプト
  • 各社API版プロンプト: Web版とAPI版の違いを示すサンプル

チュートリアル・ガイド

  • GitHubリポジトリ内でのプルリクエスト作成ガイド
  • 各社プロンプトの読み方・解釈方法
  • JSONエスケープ文字の処理方法説明

技術的詳細

アーキテクチャ

全体構造

シンプルな静的ドキュメントコレクション形式。各AI企業・サービスごとにディレクトリを分け、Markdownファイル形式でシステムプロンプトを保存する階層構造を採用。バージョン管理はGitで行い、履歴追跡と継続的更新を可能にしている。

ディレクトリ構成

system_prompts_leaks/
├── readme.md                    # プロジェクト概要
├── claude.txt                   # Claude基本プロンプト
├── Anthropic/                   # Claude関連プロンプト
│   ├── readme.md               # Claude詳細解説
│   ├── claude-sonnet-4.md      # Claude Sonnet 4プロンプト
│   ├── claude-code.md          # Claude Codeプロンプト
│   └── claude.ai-injections.md # 注入攻撃例
├── OpenAI/                      # ChatGPT関連プロンプト
│   ├── API/                    # API版プロンプト
│   ├── GPT-4o.md              # GPT-4o基本プロンプト
│   ├── gpt-5-thinking.md      # GPT-5思考プロンプト
│   └── tool-*.md              # 各種ツール定義
├── Google/                      # Gemini関連プロンプト
├── xAI/                        # Grok関連プロンプト
├── Perplexity/                 # Perplexity関連プロンプト
├── Proton/                     # Proton AI関連プロンプト
└── Misc/                       # その他AIサービス

主要コンポーネント

  • 企業別ディレクトリ: 各AI企業のプロンプトを体系的に整理
    • 場所: OpenAI/, Anthropic/, Google/, xAI/ など
    • 依存: Git履歴管理
    • インターフェース: Markdown形式の静的ファイル
  • プロンプトファイル: 個別モデルのシステムプロンプト
    • 場所: 各企業ディレクトリ内の.mdファイル
    • 依存: 特定のAIモデルバージョン
    • インターフェース: プレーンテキスト形式のプロンプト内容

技術スタック

コア技術

  • 言語: Markdown(ドキュメント)、一部JavaScript(GitHub Pages用)
  • フレームワーク: 使用なし(静的サイト)
  • 主要ライブラリ:
    • Git: バージョン管理とコラボレーション
    • GitHub: ホスティング、イシュー管理、PR機能
    • Star History API: スター数推移の可視化

開発・運用ツール

  • ビルドツール: 不要(静的ファイル)
  • テスト: 手動検証(プロンプト精度確認)
  • CI/CD: GitHubの基本機能のみ
  • デプロイ: GitHub Pages自動デプロイ

設計パターン・手法

  • ドキュメント駆動開発: コードではなくドキュメント(プロンプト)が主要成果物
  • 階層型分類: AI企業→モデル→バージョンの3層構造で整理
  • コミュニティ駆動メンテナンス: プルリクエストによる分散型更新
  • 履歴保持: Gitによる変更履歴の完全追跡

データフロー・処理フロー

  1. 収集: AI研究者・ユーザーがシステムプロンプトを発見・抽出
  2. 投稿: GitHub PRまたはIssueとして新しいプロンプトを投稿
  3. 検証: メンテナーが内容を確認・レビュー
  4. 統合: 適切なディレクトリ構造でマージ
  5. 公開: GitHub上で即座に公開・閲覧可能
  6. 活用: 研究者・開発者が参照・分析・学習に利用

API・インターフェース

公開API

GitHub API経由のアクセス

  • 目的: プログラム的なプロンプトデータ取得
  • 使用例:
# GitHub APIで特定プロンプトを取得
curl -H "Accept: application/vnd.github.v3.raw" \
  "https://api.github.com/repos/asgeirtj/system_prompts_leaks/contents/OpenAI/GPT-4o.md"

# リポジトリ全体をクローン
git clone https://github.com/asgeirtj/system_prompts_leaks.git

設定・カスタマイズ

設定ファイル

# 特別な設定ファイルは不要
# 全てMarkdownファイルとして直接閲覧可能

拡張・プラグイン開発

コミュニティ貢献方法:

  1. 新しいプロンプト発見: AIサービスの新しいシステムプロンプトを発見・抽出
  2. PR作成: 適切なディレクトリにファイルを追加
  3. フォーマット統一: Markdown形式でプロンプトを整形
  4. メタデータ追加: モデル名、バージョン、取得日などを明記

パフォーマンス・スケーラビリティ

パフォーマンス特性

  • ベンチマーク結果: 高速なファイルアクセス(静的ファイルのため)
  • 最適化手法: GitにLFS不要、全ファイルがテキストベース

スケーラビリティ

  • コンテンツ数: 現在100+ファイル、理論上無制限に拡張可能
  • コミュニティ規模: 17,520スター、数千人の積極的貢献者
  • アクセス負荷: GitHubのインフラに依存、高い可用性を保持

制限事項

  • 法的リスク: 企業の内部情報漏洩の可能性
  • 更新頻度: AIモデルの更新より遅れることがある
  • 精度保証: コミュニティ依存のため、情報精度にバラツキあり

評価・所感

技術的評価

強み

  • 希少情報の集積: 通常非公開のAIシステムプロンプトを一元化
  • 網羅的なカバレッジ: 主要AIサービス7社以上を網羅
  • 継続的更新: コミュニティ駆動で新しいプロンプトを追加
  • アクセシビリティ: GitHubで誰でも無料アクセス可能

改善の余地

  • 法的リスク管理: 知的財産権や企業情報の取り扱い
  • 検証システム: プロンプトの真正性・正确性の保証
  • 構造化: 検索機能やメタデータ管理の強化

向いている用途

  • AI研究・学術研究: プロンプトエンジニアリングの理論研究
  • AIシステム開発: 独自のAIアシスタント開発時の参考
  • プロンプト最適化: 既存AIサービスの使い方学習
  • AI安全性研究: バイアスや制限の分析

向いていない用途

  • 商用利用: ライセンスなしで法的リスクあり
  • 悪用・詐欺: AIシステムの脆弱性悪用は非倫理的
  • 精度重視の業務: コミュニティ依存で精度保証が困難

総評

AI研究・教育分野にとって極めて貴重なリソース。主要AIサービスのシステムプロンプトを一元的に収集・公開している点で、技術的な貴重性は非常に高い。一方で、法的・倫理的なリスクも伴うため、研究・教育目的での慣用が推奨される。GitHubでの17,520スターはコミュニティの高い関心と価値を物語っている。