前回の記事 で書いた通り、6月から GitHub Copilot がトークン課金に切り替わります
プレミアムリクエスト感覚で使ってるとトークンがんがん消費していまいそうなので節約方法を調べていました
そのさいに以下の記事を見つけました
ざっくりいうと「敬語・クッション言葉・前置きみたいな日本語的に冗長な部分を省くようプロンプトで指示すれば、出力トークンが減らせる」というアプローチです
話し方を原始人化させるというのがおもしろそうだと思ったので試してみました
生成AIにおけるトークンについて教えてくださいこのお題で以下3パターンを比較
genshijin スキルを発動(通常レベル)genshijin よりゆるめ指示を CLAUDE.md に追加genshijin スキルは上記記事の作者が公開しているもので、敬語・クッション・形式名詞・冗長助詞などを徹底的に削るルールが書かれています
強度レベルは「丁寧 / 通常 / 極限」の3段階ありましたがひとまずデフォルトの通常レベルで試しました
まず返答方法に関しては何の指示もせずに聞いた結果

出力トークン: 816 tokens
定義 → 基本概念 → 分割の目安(テーブル付き)→ 重要な性質 → トークナイザーの種類 → 実用的な観点、と章立てされた丁寧で網羅的な回答です
「〜です」「〜しがちです」みたいな丁寧表現や、最後の「深掘りしたい場合はお知らせください」みたいな締めも含まれます
内容は濃くて読みやすい感じですけど出力トークンはそれなりかかりそうです
次に /genshijin で原始人モードを発動して同じ質問をします

出力トークン: 325 tokens(素のまま比 40%、約60%削減)
回答が「トークン = テキスト分割単位。モデル処理の最小単位。」といった感じで一気に圧縮されています
文字数ベースで見ても明らかに短くて、たしかにトークンは大幅削減できてます
ただ、もろもろ削ぎ落とされすぎていて個人的には理解するのがむずかしい感じがします
場合によっては内容理解のために余計にやり取りが増えてしまいそう
なので genshijin の指示を削って CLAUDE.md に追加してみました
# 返答ルール
簡潔に返答せよ。無駄だけ消す。日本語前提。
- 以下のような日本語、文法的に無駄な表現は禁止する
- 敬語・丁寧語(です/ます)、クッション(えーと/まあ/基本的に)、前置き(ご質問ありがとう)、ぼかし(〜かもしれません/おそらく)
- 技術的な内容は残すこと。コード例も同様。
- 聞かれたことにのみ答える、余計な情報を付け加えないこと「技術的な内容は残すこと」を明示して基本的には日本語的な無駄だけを省いてもらうようにします

出力トークン: 483 tokens(素のまま比 59%、約40%削減)
定義 → 分割例 → 目安 → なぜ重要か → 入力/出力の区別 → トークナイザ、と章立ては残しつつ、各セクションの文章が引き締まっています
unhappiness → un + happi + ness のような具体例や、入出力トークンの単価差みたいな実用情報も残ってます
genshijin スキル使用時よりは長いものの読みやすさはあると思います
今回の内容で出力トークン削減効果だけみるとスキル発動時が強いです
ただ、返答のわかりやすさも含めるとゆるめ指示の方がちょうどいい感じがします
まずはゆるめ指示で使ってみて、効果と使い心地を見ていこうかと思います