ディレクトリを再帰的に読み込んでファイルパス一覧を取得する
目的のファイルやディレクトリを再帰的に辿って、ファイルのパス一覧を取得するシンプルなnode.jsを書いてみました。
glob
とかgulp
でもファイルを読み込みできるのですが、少し勉強のために作ってみました。今回はファイルパス以外にファイルの最終変更日時や最終アクセス時刻などのファイル・システム情報を列挙できるようにしました。
node-filelist
github
npm
環境はnode.js v0.10.xやnode.js v4.xで確認しました。Pull Requestやissueも歓迎しておりますので、ご指摘などございましたらよろしくお願いします。
photo by Mr. Alex Garcia - Double Cliche on flickr
使い方
まずはnpmインストールします。
1 | $ npm install node-filelist --save |
使い方は以下のようになります。files
に目的のファイルパスを指定します。またoption
に読み込みたいファイルの拡張子を指定すると、その拡張子だけ限定して読み込むことができます。
1 | var fl = require('node-filelist'); |
結果はこのような感じになります。
1 | $ node index.js |
fs.statsで取得できるもの
出力に含まれるstats
はfs.stats
の返り値をそのまま渡しています。statsの中身はあまり馴染みが無かったのですが、ファイルの更新日時などの情報が入っています。そのほか、node.jsのドキュメントを見ると以下の様なものがあります。
Documentation - node.js
fs.stats
ドキュメントを見てもいまちちピンとこなかったので、以下を参考にしました。
kazmax Linuxで自宅サーバー
stat - システムコールの説明 - Linux コマンド集 一覧表
上記を読むと以下のように対応してる事が分かりました。
fs.statsの返り値 | 説明 |
---|---|
dev | ファイルがあるデバイスの ID |
ino | inode 番号 |
mode | アクセス保護 |
nlink | ハードリンクの数 |
uid | 所有者のユーザ ID |
gid | 所有者のグループ ID |
rdev | デバイス ID (特殊ファイルの場合) |
size | 全体のサイズ (バイト単位) |
blksize | ファイルシステム I/O でのブロックサイズ |
blocks | 割り当てられたブロック数 |
atime | 最終アクセス時刻 |
mtime | 最終修正時刻 |
ctime | 最終状態変更時刻 |
birthtime | ファイル作成時刻(おそらく) |
ということで、ファイルシステムの情報を調べたい時に有益なメソッドのようです。
参考にさせて頂いた記事
ディレクトリを辿る方法は以下が参考になりました。ディレクトリなら再帰、ファイルならコールバックを呼ぶというのがとても勉強になりました。
Experiments Never Fail
ディレクトリを再帰的にたどってファイル一覧を出力する
試しに、ネストしまくっているnode_mouduleを含むプロジェクトを読ませてみましたが、2万ファイル辺りでスタックオーバーフローしてしまいました。エラーメッセージはこんな感じです。
1 | RangeError: Maximum call stack size exceeded |
スタックオーバーフローに関しては、こちらの記事が大変参考になりました(^^;)非同期処理は難しい…
Nao Minami’s Blog
JavaScriptでスタックオーバーフローを起こさない方法
statsの情報はfs.watch()
やfs.watchFile()
のような更新ファイルを探す処理を自前で実装するためにも使える情報だと思いました。この2つのメソッドは非常にややこしい動作をしているので、過去にうまくファイル監視が動作しなかったりと悩まされた事がありました。しかし、ファイル全てのstatsの情報を突き合わせれば確実にファイル監視が行えるので、とても助かっています。