CSVが文字化けする原因
CSVの文字化けは、ファイルを保存したときの文字コードと、開くソフトが想定している文字コードが食い違うことで起こります。日本語環境で特に多いのは次の2パターンです。
- UTF-8のCSVをExcelで開いて文字化け — 日本語版Excelは、BOM(ファイル先頭の目印)が無いUTF-8をShift-JISとして解釈するため、「縺ゅj縺後→縺」のような表示になります。
- Shift-JISのCSVをWebサービスやクラウドツールに取り込んで文字化け — 海外製ツールや最近のシステムはUTF-8前提のものが多く、Shift-JISのまま渡すと「������」や「?????」になります。
つまりファイル自体が壊れているわけではなく、正しい文字コードで読み直して、相手に合わせた文字コードで保存し直せば直ります。このページのツールはそれをブラウザ内で行います。
どの文字コードを選べばよいか
| 用途 | おすすめの出力 |
|---|---|
| Excelで開く・経理担当者に渡す | UTF-8(BOM付き)または Shift-JIS |
| 会計ソフト(freee・マネーフォワード・弥生など)に取り込む | 取込仕様に従う(Shift-JIS指定のことが多い) |
| Webシステム・データベース・プログラムで読む | UTF-8(BOM無し) |
| Googleスプレッドシートに取り込む | UTF-8(どちらでも可) |
迷ったらUTF-8(BOM付き)を選んでください。Excelでもプログラムでもほぼ問題なく扱えます。
このツールの特徴
- 文字コードの自動判定 — Shift-JIS(CP932)・UTF-8・UTF-16・EUC-JPを自動で見分け、判定結果を表示します。
- 変換前にプレビュー — 文字化けが直った状態を表で確認してからダウンロードできます。
- サーバー送信なし — 変換はすべてブラウザ内のJavaScriptで完結します。売上データや顧客リストなど、外部にアップロードしたくないファイルでも安心です。
- 改行コードの変換 — CRLF(Windows)とLF(Mac/Linux)の変換にも対応しています。
よくある質問
変換しても「?」や「□」が残るのですが
一度間違った文字コードで保存し直されたファイルは、元の情報が失われているため復元できません(例:UTF-8の文字を「?」に置き換えてShift-JISで保存した場合)。その場合は元データを再出力してください。エクスポート時の文字コード指定を見直すのが根本対策です。
Shift_JISとCP932の違いは?
CP932はWindowsで使われるShift-JISの拡張版で、「①」「㈱」「﨑」などの機種依存文字を含みます。このツールはCP932相当として処理するため、一般的な業務データはそのまま変換できます。
ファイルサイズの上限は?
ブラウザのメモリで処理するため、数十MB程度までを推奨します。それを超える場合や、毎日・毎月の定期変換を自動化したい場合は、下記までご相談ください。