日本語の無駄を削って出力トークンを節約してみる

前回の記事で書いた通り、6月から GitHub Copilot がトークン課金に切り替わります

プレミアムリクエスト感覚で使ってるとトークンがんがん消費していまいそうなので節約方法を調べていました
そのさいに以下の記事を見つけました

Claudeトークン消費を抑えて５倍使う：「原始人」口調が80%削減

ざっくりいうと「敬語・クッション言葉・前置きみたいな日本語的に冗長な部分を省くようプロンプトで指示すれば、出力トークンが減らせる」というアプローチです
話し方を原始人化させるというのがおもしろそうだと思ったので試してみました

■ 検証条件

ツール: Claude Code
モデル: Opus 4.7
お題: 生成AIにおけるトークンについて教えてください

このお題で以下3パターンを比較

パターン1: 素のまま（返答方法に関して指示なし）
パターン2: genshijin スキルを発動（通常レベル）
パターン3: genshijin よりゆるめ指示を CLAUDE.md に追加

genshijin スキルは上記記事の作者が公開しているもので、敬語・クッション・形式名詞・冗長助詞などを徹底的に削るルールが書かれています
強度レベルは「丁寧 / 通常 / 極限」の3段階ありましたがひとまずデフォルトの通常レベルで試しました

■ パターン1: 素のまま

まず返答方法に関しては何の指示もせずに聞いた結果

素のままの回答

出力トークン: 816 tokens

定義 → 基本概念 → 分割の目安（テーブル付き）→ 重要な性質 → トークナイザーの種類 → 実用的な観点、と章立てされた丁寧で網羅的な回答です
「〜です」「〜しがちです」みたいな丁寧表現や、最後の「深掘りしたい場合はお知らせください」みたいな締めも含まれます

内容は濃くて読みやすい感じですけど出力トークンはそれなりかかりそうです

■ パターン2: genshijin スキル発動（通常）

次に /genshijin で原始人モードを発動して同じ質問をします

genshijin スキル発動時の回答

出力トークン: 325 tokens（素のまま比 40%、約60%削減）

回答が「トークン = テキスト分割単位。モデル処理の最小単位。」といった感じで一気に圧縮されています

文字数ベースで見ても明らかに短くて、たしかにトークンは大幅削減できてます
ただ、もろもろ削ぎ落とされすぎていて個人的には理解するのがむずかしい感じがします

場合によっては内容理解のために余計にやり取りが増えてしまいそう

■ パターン3: ゆるめの指示を CLAUDE.md に追加

なので genshijin の指示を削って CLAUDE.md に追加してみました

# 返答ルール
 
簡潔に返答せよ。無駄だけ消す。日本語前提。
 
- 以下のような日本語、文法的に無駄な表現は禁止する
  - 敬語・丁寧語（です/ます）、クッション（えーと/まあ/基本的に）、前置き（ご質問ありがとう）、ぼかし（〜かもしれません/おそらく）
- 技術的な内容は残すこと。コード例も同様。
- 聞かれたことにのみ答える、余計な情報を付け加えないこと

「技術的な内容は残すこと」を明示して基本的には日本語的な無駄だけを省いてもらうようにします

ゆるめ指示時の回答

出力トークン: 483 tokens（素のまま比 59%、約40%削減）

定義 → 分割例 → 目安 → なぜ重要か → 入力/出力の区別 → トークナイザ、と章立ては残しつつ、各セクションの文章が引き締まっています
unhappiness → un + happi + ness のような具体例や、入出力トークンの単価差みたいな実用情報も残ってます

genshijin スキル使用時よりは長いものの読みやすさはあると思います

■ まとめ

素のまま: 読みやすいがトークン消費は多め
genshijin スキル: トークンは最小、ただし削りすぎで理解しづらい場面も
ゆるめの CLAUDE.md 指示: 4割削れて理解しやすさも維持、バランス良し

今回の内容で出力トークン削減効果だけみるとスキル発動時が強いです
ただ、返答のわかりやすさも含めるとゆるめ指示の方がちょうどいい感じがします

まずはゆるめ指示で使ってみて、効果と使い心地を見ていこうかと思います