1. 概要
URL="https://bookshelf.jp/cgi-bin/goto.cgi?file=wget-ja&node=Overview"
"wget/概要"へのコメント(無し)
GNU Wgetは,Webから対話的ではないファイルのダウンロードを行なうための フリーのユーティリティです.HTTP,HTTPS,そしてFTPをサ ポートしていて,HTTPプロキシからの回収も同様にサポートしています.
この章は,Wgetの機能の部分的な概要となっています.
- Wgetは対話的ではなく,つまりそれはユーザがログオンしていない間にバック グラウンドで動作可能なことを意味しています.このため,Wgetに仕事を完了 させるため,回収を開始し,システムとの接続を終了する(システムと離れて いる)ことが可能になっています.それと比較して,ほとんどのウェブブラウ ザは常にユーザの存在を要求し,それは大量のデータを転送しているときは, 大きな障害となります.
- Wgetは,HTMLページとXHTMLページのリンクをたどり,遠隔地のウェ ブサイトのローカルバージョンを作成し,それはオリジナルサイトのディレク トリ構造を完全に再生成します.これは"再帰的なダウンロード"と言われる こともあります.こうしている間,WgetはRobot Exclusion Standard (`/robots.txt')を考慮します.オフラインで閲覧するために,ダウンロー ドされたHTMLファイルのリンクをローカルのファイルに変換するよう, Wgetに指示することが可能です.
- ファイル名のワイルドカードへの一致と,ディレクトリの再帰的なミラーは, FTPで回収するときに利用可能です.Wgetは,HTTPサーバと FTPサーバの両方でタイムスタンプ情報を読み込み,それをローカルに保 存することが可能です.それにより,Wgetはリモートファイルが前回の回収か ら変化しているかどうかを理解し,変化がある場合は新しいバージョンを自動 的に回収することが可能になっています.これで,Wgetがホームページと同様 にFTPサイトのミラーに適するようになっています.
- Wgetは,遅く不安定なネットワークの接続越しでも耐性があるように設計され ました.ネットワークの問題でダウンロードに失敗した場合,ファイル全体が 回収されるまで再試行を続けます.サーバがリゲットをサポートしている場合, 残っている場所からダウンロードを続けるようサーバに伝えます.
- Wgetはプロキシサーバをサポートし,それはネットワークの負荷を軽くし,回 収の速度を上げ,そしてファイアーウォールの裏からのアクセスを提供するこ とを可能にします.しかし,socks形式のゲートウェイの使用が必要なファイ アーウォールの裏にいる場合,socksライブラリを入手しsocksサポートを用い てWgetをビルドすることが可能です.Wgetは,受動的なFTPダウンロード もオプションとしてサポートしています.
- 組込みの機能は,希望するリンクをたどることを調整するメカニズムを提供し ます(see 節 4. リンクの追跡).
- 回収は通常,ドットを出力しながら追跡し,それぞれのドットは受信したデー タの固定量(デフォルトで1KB)を表現しています.これらの表現は好みにより カスタマイズ可能です.
- ほとんどの機能は完全に構成を変更することができ,それらは,コマンドライ ンオプションや初期化ファイル`.wgetrc'(see 節 6. スタートアップファイル)を通じ て行います.Wgetでは,サイト設定に対してグローバルなスタートアッ プファイル(デフォルトで`/usr/local/etc/wgetrc')で定義可能になって います.
- 最後になりますが,GNU Wgetはフリーソフトウェアです.このことは,Free Software Foundationが出版しているGNU一般公有使用許諾書 (see 節 10. コピーについて)の用語の下で,誰もが,使用し,再配布し,そして/または 修正が可能だということを意味します.