より新しいバージョンが公開されました。→こちら←を御覧ください

現状のファイルサーバには一体何十万のファイルがあるのか?

意外なことに、ファイル容量は何ギガバイトかすぐにわかりますが、ファイル数を即答できる管理者さんは少ないようです。

Windowsではドライブを右クリックすれば容量は瞬時にわかりますが、ファイル数は数えないとわからないからで、しかもエクスプローラでフォルダアイコンを右クリックして、ファイル数やフォルダサイズを表示するのに、多数のファイルのあるフォルダの場合には何分もかかってしまうかもしれません。

鉄飛テクノロジーでは、文書管理・検索システムFileBlogの導入を検討されるお客様が、簡単にファイルの数を数えられるように、フォルダ階層を一括スキャンして、主なファイル種類別に主要フォルダのファイル数・ファイルサイズを数え上げて一覧出力するツール「FbFileScanner」を公開します。

2008/7/17更新

ファイル一覧をユニコード出力するようにしました。また、長いファイル名・ShiftJIS範囲外ファイルを例外一覧に書き出すようになっております。(FileBlog本体組み込み処理と同じになっています)

機能

  1. 選択したルートフォルダ以下の全フォルダの全ファイルをスキャンします
  2. 主なファイル種類について、ファイル数とファイルサイズを集計します
  3. ファイル数・ファイルサイズの基準を設けて、一定以上の数量が見つかったフォルダを、フォルダ一覧に出力しますので、ファイル数・容量の少ないフォルダを無視した出力を得ることが出来ます
  4. フォルダ一覧だけでなく、ファイル一覧も出力することができます
  5. ファイル数が数百万件を越えて、ファイル一覧ファイルが巨大になることを想定しており、メモリ消費量とディスクI/Oを抑えて、始終高速に動作します
  6. なお、今のところファイル名はShiftJISで有効なものに限り、日本語以外のUnicodeファイル名は文字化けして出力されます

FbFileScannerのダウンロードは→こちら←からどうぞ

使い方

FbFileScanner.exe を管理者権限で実行してください。デスクトップ上に作業フォルダが作成されます。スキャン実行ボタンを押して、ルートフォルダを選択すると、スキャンが開始されます。スキャン実行のログが画面に表示されるとともに、作業フォルダ内のログファイルに書き出されます。

作業フォルダ内に下記のファイルが出力されます。

  • フォルダ一覧ファイル: J010_DIRLST_00.txt
  • ファイル一覧ファイル: J010_FILLST_00.txt (チェックボックスでファイル一覧作成を指定した場合)
  • ファイル一覧インデックスファイル: J010_FILLST_00.idx
  • 例外ファイル一覧: J010_ERRLST_00.txt

例外ファイル一覧には、512文字以上ある長いファイル名と、ShiftJIS範囲外のファイル名が出力されます。例外ファイル一覧にフォルダが出力される場合、そのフォルダのサブフォルダ以下はスキャン対象外となっており、集計結果からも漏れてしまっています。ご了承下さい。

処理中は、ログファイルを読むことはできますが、フォルダ一覧およびファイル一覧にはアクセスできません。処理を中断するときは、画面左下の中断ボタンを押してください。

結果ファイルの見方

主なフォルダと、フォルダ内のファイル数・ファイルサイズが表示されます(ファイル数を数えるため、フォルダ数はカウントされません)。また、主要ファイル形式別のファイル数・ファイルサイズも集計されます。

集計対象のファイル形式(ファイル拡張子に基づきます)は以下の通り

結果表示カテゴリ 対応拡張子
doc .doc
xls .xls
ppt .ppt
pdf .pdf
xdw .xdw
dwg .dwg
dxf .dxf
txt .txt
htm .htm, .html
img .bmp, .gif, .jpg, .jpeg, .tif, .tiff, .png
exe .exe, .com, .dll
zip .zip, .lzh, .cab, .msi

上記ファイル種類定義は、完全なものではありませんが、私の一存で作成し、プログラムにコンパイルされて埋め込まれていますので、カスタマイズは出来ません。ご容赦ください。
数十万ファイルが存在するフォルダ階層の全容を把握するには十分だろうと思います。

結果例

結果ファイル J010_DIRLST_00.txt は、タブ区切りテキストなので、エクセルやテキストエディタで開いてください。