HTTPサーバからHTMLを取り込む

ファイルはzipフォルダに納められています。
解凍ソフト(Aladdin Expander等)を使って解凍して下さい。

URLを扱うクラス

インターネット上のアドレス「URL」を扱う為に、URLクラスが用意されています。
URLクラスを用いると、ファイルから入力と同様の手順でWeb上のHTMLファイルを読み込めます。
URLクラスのオブジェクトは、インターネットのアドレスを引数としてインスタンス化します。

例: URL url = new URL(http://members14.tsukaeru.net/jorx30//);

ストリームの確立

URLクラスには、InputStream(入力ストリーム)を確立するメソッドが用意されています。
HTMLはテキストですから、1行ずつ読み込める様にBufferedReaderクラスでラップします。

例: InputStream fin = url.openStream();
BufferedReader in = new BufferedReader(new InputStreamReader(fin));

URLConnectionクラス

URLConnectionクラスを使うと、HTTPから送信されたヘッダを調べられます。
URLConnectionクラスは、URLクラスのオブジェクトをターゲットに、openConnectionメソッドを呼び出す事でインスタンス化します。

例: URL url = new URL(URLアドレス);
URLConnection con = url.openConnection();

HTTPのヘッダ

HTTPサーバは、データと一緒にヘッダと呼ばれる「荷札」の様な情報を送信して来ます。
ヘッダには、幾つかの種類の情報が含まれていますが、其の項目はサーバによって異なる事が有ります。
項目名と其れに対応する情報が1対になっています。

con.getHeaderFieldKey(i); ・・・i番目の項目名を得るメソッド
con.getHeaderField(i); ・・・対応する値を得るメソッド
ソース ダウンロード
GetHtml.java Get02.zip
GetHTTPHeader.java

戻る