ClaudeCodeで翻訳業務を自動化する方法【高品質な日英翻訳ワークフロー】
翻訳業務を抱えている方なら、「機械翻訳に通したら専門用語が崩れた」「文体が一貫しない」「大量のファイルを一気にさばきたい」と感じたことが一度はあるはずです。Google翻訳やDeepLは便利ですが、企業の公式資料、契約書、製品マニュアル、マーケティングコピーといった「文脈と用語が命の翻訳」では精度に限界があります。一方ClaudeCodeなら、用語集や過去訳を参照させながら翻訳を自走させることができ、品質を保ったまま大量処理が可能です。本記事では、日英翻訳を主軸に、ClaudeCodeで翻訳業務を自動化するための実践ワークフローと、すぐに使えるプロンプト・コードサンプルを完全解説します。
結論:翻訳自動化の鍵は「用語集+文体ガイド+3パス翻訳」
最初に結論をお伝えします。ClaudeCodeを翻訳業務に使う場合、単純に「これを英訳して」と投げるだけでは品質が安定しません。プロが満足するレベルの自動化を実現するには、次の3つを前提として揃える必要があります。
1つ目は用語集(glossary)です。業界用語、製品名、社内独自表現を辞書として渡しておくと、訳ブレが激減します。2つ目は文体ガイド(style guide)です。フォーマル度、敬称、句読点ルール、見出しのキャピタライズ方針などをファイルにまとめておきます。3つ目は3パス翻訳と呼ぶ運用です。第1パスでドラフト翻訳、第2パスで用語チェックと整合性確認、第3パスでネイティブらしい自然な表現への磨き込みを行います。この3パスをClaudeCodeに自動で回させることで、人間のレビュー作業が「全文書き直し」から「最終確認だけ」に変わります。本記事ではこの3つの仕組みを順番に解説し、最後に業界別の使い分けまでカバーします。
翻訳プロジェクトのディレクトリ設計
翻訳業務でClaudeCodeを使う場合、最初に整えるべきはプロジェクト構成です。以下のような構造が扱いやすく、後の自動化スクリプトも書きやすくなります。
translation-project/
├── source/ # 原文(日本語)
│ ├── doc-001.md
│ └── doc-002.md
├── target/ # 翻訳後(英語)
├── glossary/
│ ├── general.csv # 一般用語
│ └── product.csv # 製品名・固有名詞
├── style/
│ ├── style-guide.md # 文体ガイド
│ └── samples.md # 良い翻訳サンプル
├── memory/
│ └── tm.csv # 翻訳メモリ(過去訳)
└── CLAUDE.md
glossary/general.csvは「日本語,英語,品詞,備考」の4列にすると後の検索が楽です。たとえば次のような形になります。
日本語,英語,品詞,備考
顧客,customer,noun,一般顧客
取引先,client,noun,B2B
契約,agreement,noun,正式契約
契約,contract,noun,雇用契約・売買契約
「契約」のように文脈で訳語が変わる用語は複数行に分けて備考欄で使い分けを示します。ClaudeCodeはCSVを直接読めるので、翻訳時に毎回参照させることができます。
style/style-guide.mdには、たとえば「Oxford commaを使う」「製品名はTitle Case」「we/youの使い分け」「箇条書き末尾はピリオドを付けない」など、訳文のルールを箇条書きで30行程度書いておくと一貫性が保てます。
memory/tm.csvは過去訳の蓄積で、似た文が来たときに同じ訳語を再利用させる仕組みです。これがあるかないかで翻訳の一貫性は天と地ほど変わります。
翻訳プロンプト集:第1パスのドラフト翻訳
ここから具体的なプロンプトを紹介していきます。まずは第1パスのドラフト翻訳用プロンプトです。
プロンプト1:基本翻訳プロンプト
あなたはプロの日英翻訳者です。
以下の文書を英訳してください。
# 翻訳ルール
- glossary/general.csv と glossary/product.csv を必ず参照
- style/style-guide.md のルールに従う
- 不明な固有名詞はそのままローマ字で残し、[CHECK]タグを付ける
- 直訳ではなく、英語ネイティブが自然に読める表現を優先
- 日本語の主語省略は文脈から補う
# 原文
{原文}
# 出力形式
原文の段落構成を維持。Markdown記法はそのまま。
プロンプト2:契約書専用プロンプト
以下は契約書の一部です。
リーガル翻訳の慣例に従って英訳してください。
- 「甲」「乙」は Party A / Party B
- 「本契約」は this Agreement
- 「〜するものとする」は shall を使用
- 数値・日付は原文どおり、半角数字+月日表記に変換
- 訳しにくい条文は [TRANSLATOR NOTE: ...] を付ける
{原文}
プロンプト3:マーケティングコピー翻訳プロンプト
以下のマーケティングコピーを英訳してください。
直訳ではなく、英語圏のユーザーに響くトランスクリエーション(意訳)を行ってください。
- ブランドトーン: friendly, energetic
- ターゲット: US, 25-40歳
- CTAは命令形を使ってよい
- 文化的に通じない比喩は置き換える
訳文を3案提示し、各案のニュアンスの違いを1行で説明してください。
{原文}
プロンプト4:技術ドキュメント翻訳プロンプト
以下は製品の技術マニュアルです。
正確性を最優先で英訳してください。
- 数値・単位は原文どおり
- コード・コマンドは翻訳しない
- 手順は番号付きリストを維持
- 専門用語は glossary/product.csv に従う
- 1文ずつ短く区切ることを優先
{原文}
これらのプロンプトに共通する重要なポイントは、用語集と文体ガイドを必ず参照させること、そして不確実な箇所には[CHECK]タグを付けさせることです。これによりレビュー時に確認すべき箇所が一目でわかります。
翻訳プロンプト集:第2パスの整合性チェック
第1パスのドラフトができたら、第2パスで品質をチェックします。
プロンプト5:用語整合性チェック
以下の訳文を読み、glossary/general.csv および glossary/product.csv と
照合してください。
- 用語集に登録されている日本語が、登録されている英訳と一致しているか
- 同じ用語が異なる訳になっていないか
- 用語集に存在しない重要な用語が独自訳になっていないか
不整合があれば「行番号 | 原文 | 現訳 | 正しい訳 | 理由」の表形式で出力してください。
プロンプト6:訳抜けチェック
以下の原文と訳文を照合し、訳抜けがないか確認してください。
- 原文の各段落が訳文の段落に対応しているか
- 数値・固有名詞・箇条書きの項目数が一致しているか
- 抜けがあれば該当箇所を引用して指摘してください
プロンプト7:文体一貫性チェック
以下の訳文を style/style-guide.md と照合し、
ルール違反を一覧で出力してください。
- Oxford comma
- Title Case のミス
- 単数複数の揺れ
- 時制の不統一
第2パスを通すことで、機械翻訳ではほぼ不可能だった「全文を通した一貫性」が担保されます。特にプロンプト5の用語整合性チェックは、長文翻訳になればなるほど効果を発揮します。
翻訳プロンプト集:第3パスのネイティブ磨き
最後の第3パスで、英語ネイティブが読んで自然な文章に仕上げます。
プロンプト8:ネイティブチェックプロンプト
あなたは米国出身のプロエディターです。
以下の英文を、米国ビジネス英語として自然な表現に磨き上げてください。
- 意味は絶対に変えない
- 冗長な前置詞句を削減
- 受動態の過剰使用を能動態に
- 不自然なコロケーションを修正
- 修正前と修正後を対比表で出力
プロンプト9:レジスター調整プロンプト
以下の英文のフォーマル度を「{formal/neutral/casual}」に調整してください。
- 専門用語の置き換え
- 縮約形(don't, it's など)の使用可否
- 呼びかけ表現の変更
プロンプト10:最終QAプロンプト
納品前の最終QAを行ってください。チェック項目:
1. スペル・文法エラー
2. 数値・日付の転記ミス
3. 固有名詞のスペル
4. リンク・参照の整合性
5. Markdown構文の崩れ
問題があれば修正案を提示し、なければ「QA PASSED」と回答してください。
このように3パス構成にすることで、ドラフトから納品までの品質が体系的に保証されます。
バッチ翻訳:複数ファイルを一気に処理する
翻訳業務の本当の価値は「量をさばけること」です。ClaudeCodeをバッチ処理に組み込めば、数十〜数百ファイルを一晩で処理することも可能です。
以下は、source/配下の全Markdownファイルを翻訳してtarget/に保存するシェルスクリプトの例です。
#!/bin/bash
# batch-translate.sh
SOURCE_DIR="./source"
TARGET_DIR="./target"
mkdir -p "$TARGET_DIR"
for file in "$SOURCE_DIR"/*.md; do
filename=$(basename "$file")
echo "翻訳中: $filename"
claude "以下の手順を実行してください:
1. $file を読み込む
2. プロンプト1のルールで英訳する
3. プロンプト5で用語整合性をチェック
4. プロンプト8でネイティブ磨きを行う
5. 結果を $TARGET_DIR/$filename に保存
6. [CHECK]タグが残っていれば一覧をログに出力"
echo "完了: $filename"
done
このスクリプトを実行すると、各ファイルが3パス翻訳されたうえでtarget/に保存され、人間が確認すべき箇所だけが[CHECK]タグで残ります。
Pythonでより細かい制御をする場合は次のような書き方になります。
import subprocess
from pathlib import Path
SOURCE = Path("./source")
TARGET = Path("./target")
TARGET.mkdir(exist_ok=True)
PROMPT_TEMPLATE = """
以下のファイルを3パス翻訳してください。
入力: {src}
出力: {dst}
ルール: glossary/*.csv と style/style-guide.md を必ず参照
"""
for src in SOURCE.glob("*.md"):
dst = TARGET / src.name
prompt = PROMPT_TEMPLATE.format(src=src, dst=dst)
subprocess.run(["claude", prompt], check=True)
print(f"完了: {src.name}")
100ファイルでも、夜間に流しておけば翌朝にはレビュー待ちの状態で揃っているという運用が可能になります。
業界別の使い分けポイント
翻訳は業界によって「正解」が大きく異なります。代表的な4業界での使い分けを整理しておきます。
医療・製薬分野では、誤訳が人命に関わるため、用語集の整備が最重要です。MedDRA、ICH、PMDA関連の標準用語を必ず登録し、自由訳を許さない設定にします。プロンプトでは「不確かな用語は[CHECK]を付けて翻訳しない」と明示しましょう。
法務・契約分野では、定型表現の厳密さが命です。「shall」「may」「will」の使い分け、定義語のキャピタライズ、条項番号の維持などをstyle-guide.mdに細かく書いておきます。
ITソフトウェア分野では、コード・コマンド・UI文字列の扱いが鍵です。コードブロックやタグ内は翻訳しない、UI文字列は別途用語集で管理する、APIリファレンスはコードコメントだけ訳す、といったルール化が重要です。
マーケティング分野では、トランスクリエーション(意訳)が前提です。プロンプト3のように「直訳禁止」「複数案提示」「ニュアンス差の説明」を明示すると、コピーライターのレビュー負荷が下がります。
翻訳品質を継続的に高める仕組み
最後に、翻訳業務を続けるうえで品質を継続的に伸ばす仕組みを紹介します。
1つは「フィードバックループ」です。人間のレビュアーが修正した訳文を、修正前と修正後で対比表にしてmemory/tm.csvに追記していきます。次の翻訳時にClaudeCodeへ「過去の修正履歴を参照して同じミスを繰り返さないように」と指示することで、翻訳精度が継続的に向上します。
memory/tm.csv の修正履歴を読み、
過去に修正された訳語パターンを今回の翻訳に反映してください。
特に修正回数の多い表現は優先的に適用してください。
もう1つは「用語集の自動拡充」です。新規ファイルを翻訳した際、用語集に未登録の専門用語が出てきたらClaudeCodeに抽出させ、訳語候補とともに用語集へ追加案を出させます。
翻訳が完了したら、用語集に未登録の専門用語を10個まで抽出し、
glossary/draft-additions.csv に追記してください。
人間が確認したのちに本登録します。
この2つのループを回すことで、プロジェクトが進むほど品質が上がり、レビュー時間が減っていく好循環が生まれます。
FAQ
Q1. DeepLとClaudeCode、どちらが翻訳精度は高いですか? A1. 短文ではDeepLが速く、長文・専門文書ではClaudeCodeのほうが文脈と用語の整合性で優れます。両者を併用し、DeepLの出力をClaudeCodeで磨くハイブリッド運用もおすすめです。
Q2. 翻訳対象が機密文書の場合、ClaudeCodeを使っても大丈夫ですか? A2. クラウドにデータが送信される点を必ず確認してください。機密度の高い情報は、社内ポリシーに従って判断が必要です。判断に迷う場合はエンジニアに相談を。
Q3. 用語集はどれくらいの規模が理想ですか? A3. 業界やプロジェクト次第ですが、一般用語500語+固有名詞100〜300語が運用しやすいラインです。大きすぎるとコンテキスト消費が増えるため、案件単位で絞ることも検討してください。
Q4. 100ページのPDFを翻訳できますか? A4. 可能ですが、まずテキスト抽出してMarkdown化し、章ごとに分割して翻訳するのが効率的です。PDF抽出にもClaudeCodeを使えます。
Q5. ネイティブチェックの精度はどこまで信頼できますか? A5. 一般文書では十分実用的ですが、広告コピーや文学的表現は最終的にネイティブの人間レビューを推奨します。プロンプト8で「自信度」を併記させると判断しやすくなります。
Q6. 翻訳メモリは何件くらい貯まると効果が出ますか? A6. 200〜500件貯まると体感的な再利用率が上がります。1,000件を超えるとプロジェクト単位の一貫性が高水準で保たれます。
Q7. 英日翻訳でも同じワークフローで通用しますか? A7. はい、ほぼ同じ枠組みで通用します。日本語側の文体ガイド(敬語レベル、句読点ルール)をより細かく整備すると品質が上がります。
まとめ
ClaudeCodeを翻訳業務に活用する鍵は、用語集・文体ガイド・3パス翻訳の3点セットを整えることです。これさえあれば、品質を保ったまま大量のファイルを自動処理でき、フィードバックループを回すほど精度が向上します。まずは小さな案件から、glossaryとstyle-guideを書き出すところから始めてみてください。1ヶ月運用すれば、翻訳業務のスピードと安定感は別物になります。