2026年6月8日 – AIに仕事を任せたい人のためのPython塾 ― Manage AI ―

はじめに：つまずきに寄り添う一言

プロンプトを「作って終わり」にしていませんか。現場では、ちょっとした文言の差で出力が変わり、いつの間にか品質が低下することがあります。本記事では、プロンプトをコードやドキュメントと同じように扱い、再利用・テスト・段階的ロールアウトできる実務手順を、Pythonのサンプルとチェックリストで示します。

ある社内ツールで要約テンプレートを更新したところ、特定の問い合わせで要約が長くなり、コストと業務負荷が増えた事例があります。修正履歴が残っていなかったため原因特定に時間を要しました。プロンプトを資産化すると、こうした問題を未然に防げます。

テンプレートは変数化し、ローカルでレンダリングしてからAPIに渡す。推奨フォルダ構成は次のとおりですp。

パス	用途
prompts/	テンプレート格納ルート
prompts/customer_summary/v1.j2	要約テンプレート（Jinja2）
prompts/customer_summary/metadata.yaml	id, version, owner, intent, tags
tests/smoke_sets/	代表入力セット（JSONl）

Jinja2の最小例（説明のため表内に示します）

ファイル: prompts/customer_summary/v1.j2
顧客: {{ customer_name }}\n目的: {{ purpose }}\n要約: あなたはプロの要約者として、200文字以内で箇条書きにしてください。

テンプレート本体はGitで管理し、実行時に参照するメタデータは軽量DB（例：SQLite、Postgres）に格納します。メタデータには下記項目を含めます。

フィールド	説明
prompt_id	ユニークID（例: cust_summary）
version	セマンティック風: vYYYYMMDD-1 など（例: v20260609-1）
git_ref	Git SHA またはタグ
owner	担当者
status	draft / staged / active / deprecated

バージョン命名規則（例）

規則名	フォーマット例
日付ベース	v20260609-1（YYYYMMDD-インクリメント）
意味付けあり	cust_summary@v1.2.0（major.minor.patch）

テストはCIに組み込み、下流影響を防ぐ品質ゲートとして動かします。テスト種類と想定指標の例を示します。

テスト種別	目的	指標（例）
スモーク	テンプレートがレンダリングでき、API呼び出しが成功するか	成功率 100%
品質（ゴールデン）	代表入力に対して期待出力と大きく乖離しないか	正解率 >= 90%
ベンチマーク	平均トークン・レイテンシが許容範囲か	レイテンシ < 800ms、トークン < 400

pytestジョブの流れ（概要）

pytest での擬似ワークフロー
tests/test_prompt_quality.py で smoke_set を読み、テンプレートをレンダリングして model_client.call(rendered) を呼び、正解率とトークンを検証する

段階的ロールアウトは第83回のA/Bカナリー設計と接続します。基本手順：

モニタリングすべき主要メトリクス（例）

自動ロールバックのルール例：カナリー期間内に正解率が基準未満または誤情報率が閾値超過なら即時ロールバックし、差分分析ジョブをトリガー。

小さなチームでも承認は重要です。推奨ワークフロー：

すぐに試せるチェックリストと、1週間でできるミニ演習を提示します。

チェックリスト	完了/備考
テンプレートを Git 管理下に置いた
metadata を DB に登録する CLI を用意した
smoke set を用意して pytest を CI に組み込んだ
カナリー用のトラフィック分割を設定した
監視ダッシュボードと自動ロールバックを設定した

1週間で試せるミニ演習（例）

目的	コード（擬似）
Jinja2でのレンダリング	from jinja2 import Environment, FileSystemLoader env = Environment(loader=FileSystemLoader(‘prompts/customer_summary’)) tpl = env.get_template(‘v1.j2’) rendered = tpl.render(customer_name=’ACME’, purpose=’請求要約’)
簡易CLI: register	# pseudo CLI: register template → insert metadata to DB register_prompt(prompt_id=’cust_summary’, version=’v20260609-1′, git_ref=’sha…’)
pytestでのスモーク例	def test_smoke_model_call(): rendered = render_template(… ) resp = model_client.call(rendered) assert resp.status == 200

プロンプトは「資産」です。テンプレート化、Git管理、メタデータ格納、自動テスト、段階的ロールアウトの一連を実務フローとして組み込むことで、品質低下やコスト増を抑えながら安全に改善を進められます。本記事のチェックリストと1週間演習を使い、まずは1つのテンプレートから運用を始めてください。

次の一歩：第83回のA/Bカナリーフローと接続し、CIのテストジョブを拡張して自動ロールバックを有効にしましょう。公開予定日は 2026-06-09 です。