情報処理Ia 第2回

はじめに

今日はファイルやインターネットについて理解を深め、インターネットから情報を効率よく得る方法について学びましょう。また、得た情報が正しいかをどう検証するかも考えてみましょう。
具体的には、以下のことができるようになるといいです。
  1. ファイルとは何かを理解する。
  2. インターネットの仕組みを理解する。
  3. 閲覧しているウェブページのURI(URL)をコピペできる。
  4. 論文や本を探すのに大学図書館やCiNii(さいにぃ)のサイトを利用できる。
  5. 情報の信頼性について考え検証できる。
それから、ウェブページ内の検索方法も覚えて下さい。ウェブページの形で公開している講義資料で使えます。ChromeではWindowsOSなら[Control]キー+[f]キー、MacOSなら[Command]キー+[f]キーで検索用の小さい窓が開くので、そこに知りたい単語を入力すると該当箇所を教えてもらえます。

ということで、本日の内容は以下の通りです。

情報量の単位(デジタルデータの単位)

二進数、十六進数

コンピュータで扱う情報(データ)は、画像でも音楽でも動画でもテキストでも、すべて 0と1の組み合わせで構成されています。また、コンピュータの内部では、2進法で演算することでデータを処理します。(ハードウェアの一つに、CPUと呼ばれる中央演算処理装置があってそこで処理します。)

つまり、単純化してしまえば、コンピュータというのは、01001000‥という感じのデータを入力として受け取って、演算を実行し、11000101‥というようなデータを出力する装置です。

ただし、コンピュータ自身は入力データを数字だとか数値だとかで認識して処理できるわけではなく、電源のON(電気が通っている)とOFF(電気が通っていない)として認識して処理しています。それを、私たち人間は便宜上1と0として表現しています。

対応表
10進数 2進数 16進数
0 0 0
1 1 1
2 10 2
3 11 3
4 100 4
5 101 5
6 110 6
7 111 7
8 1000 8
9 1001 9
10 1010 A
11 1011 B
12 1100 C
13 1101 D
14 1110 E
15 1111 F
16 10000 10
17 10001 11
... ... ...
このため、コンピュータが扱うデータに関する話をするときには、十進数でなく二進数を使う方が都合がよい場合が多くあります。また二進数だと冗長になる場合には、二進数の4桁を1桁として表現できる十六進数を使うこともあります。十六進数の場合、(十進での)10,11,12,13,14,15にあたる数値を表す1文字の数字はないので、代わりにアルファベットを用いて、10をa,11をb,12をc,13をd,14をe,15をfと表記(普通は大文字小文字を区別しない)します。

十六進表記は、皆さんの場合は例えば「色」を指定する必要がある場合などに使用します。情報処理Ibでウェブページを作成しますが、ウェブページで使用する色は名前で指定する他、十六進表記でも指定できます。


ビットとバイト

前述の通り、コンピュータで扱うデータは0と1の組み合わせで表現されるわけですが、この0か1かを表す1桁分の最小単位をbit(ビット)といいます。1bitで、0か1かの2パターンの情報(データ)を表現できるわけです。

2bitなら、2×2=4、つまり、00、01、10、11の4通りの情報を表現できます。

8bitなら、8桁なので、2の8乗、つまり256通りの情報を表現できます。

こんな感じに文字でも画像でも、すべてbitの塊で表現されているのですが、実際にコンピュータが処理するときには1ビット単位ではなく、いくつかのビットをまとめたものを1単位として処理することになります。この最小単位が1byte(バイト)で、これは8ビットに相当します。つまり、8桁の2進数を1単位にするのがバイトです。1バイトは00~FFの16進数2桁で表すのが一般的ですが、10進数なら、0〜255までの数値になります。

この先は、1000倍ごとに以下のような接頭辞をつけます。

1000Byte = 1 KB(キロバイト)
1000KB = 1 MB(メガバイト)
1000MB = 1 GB(ギガバイト)
1000GB = 1 TB(テラバイト)

これらの単位は、記憶装置における記憶領域のサイズや、データのサイズなどを表すために使われています。
Tera(テラ)の先も続いて、次はPeta(ペタ)ですが、現在よく見かけるのはTeraまでです。

ファイル(file)

ファイルとは

ハードディスクなどの記憶装置には、様々な情報(データ)が保存されています。この情報は、前述の通り0と1の組み合わせで構成されていますが、すべてファイル(file)と呼ばれるまとまりで保存されています。 つまり、アプリケーションプログラムも写真も音声もメールも意味のあるデータのまとまりはすべてファイルとして保存して使います。

ファイル名

ファイルには名前を付けます。これをファイル名と呼びます。

ユーザがアプリケーションソフト等を使って作成したデータは、「ファイル名」を決めて「保存」することで「ファイル」になります。 そして、ファイルとして保存したデータを利用したい場合には、ファイル名を指定してデータを取り出します。 また、ファイルからデータを取り出すことを、「ファイルを開く」という言い方をします。一般に、ファイルに保存されたデータがアプリケーションの場合、「ファイルを開く」というのは、そのアプリを起動することであり、ファイルに保存されたデータが写真の場合、「ファイルを開く」というのは、その写真をユーザに表示して見せることです。
ファイル名の例
memo.txt
.signature
mikatype.exe
work.docx
picture.jpg

ファイル名の制約

ファイル名として使えない文字があります。どの文字が使えないかはファイルシステムによって違います。全角文字をファイル名として使えるシステムもありますし、使えないシステムもあります。使用を許可されない文字を使ってファイルに名前をつけようとしても、できません。 半角のアスタリスク「*」は、大抵の場合、使用できないので覚えておく必要があります。
ファイル名の長さにも制限がありますが、皆さんが普通に使っている範囲では制限を超えるようなファイル名にはならないでしょう。つまり長さの制限は、気にしなくて大丈夫です。

ファイルの拡張子

ファイル名には、その種類を示す拡張子がつけられていることが多いです。(拡張子がないファイルもあります。) 拡張子は、ファイル名の一番最後の「.」(半角ピリオド)に続く3〜4文字の文字列です。

コンピュータの扱うデータはすでに述べたようにbitの塊ですからファイルの中身は種類によらず0か1の数値の列です。ですから中身を直接見ても何のデータか判別できないので、拡張子によって種類がわかるようにしています。つまり拡張子はファイルの種類を表すので、例えば、.pdfという拡張子がついた名前のファイルをpdf(ピーディーエフ)ファイル、.jpgという拡張子がついた名前のファイルをjpg(ジェイペグ)ファイルというように呼ぶことがあります。

WindowsやMacなどのOS、またユーザも、基本的には、ファイル名の拡張子を見て種類を識別して、そのファイルを操作するアプリを決めます。 ただし、拡張子はあくまで名前で自由につけられるので、実際には、pdfファイルであっても、.pdfでなく.jpgという拡張子をつけてしまうことも可能です。ただこうすると、そのファイルの中身が本当は何だったのか、元の拡張子を知っている人以外にはわからなくなってデータが取り出せなくなることはよくあります。したがって、自分でファイルの拡張子も含めてファイル名を決める場合には、中身に応じて拡張子を選ぶようにしないといけません。

【参考】拡張子の例(眺めるだけで覚える必要はありません。)
種類拡張子
音声ファイル.wav .mp3 .cda .wma .ogg
画像ファイル .bmp .gif .jpg .png
動画ファイル .wmv .avi .mpg .ogm .mov
テキストファイル、ハイパーテキストファイル.txt .pdf .csv .html .css .xml
Wordファイル.doc .docx .docm
Excelファイル.xls .xlsm .xlsx
プログラムファイル、実行ファイル.exe .com .bat .dll
圧縮ファイル .zip .lzh

インターネットの基礎知識

コンピュータネットワーク(Computer Network)

コンピュータネットワークとは、複数のコンピュータ端末と周辺機器などを相互に接続して、接続されている端末同士で通信をして、データをやり取りしたり、共有したり(ファイル転送、共有)、片方の端末から片方の端末への命令を発して遠隔操作したり、といったことを可能にしたものです。単にネットワークと呼ぶこともあります。たとえ2台しかコンピュータがなくても上記の要件を満たせば1つのネットワークである、と言えます。

LAN (Local Area Network)

限定されたエリアにおけるネットワークのこと。つまり物理的に近くにあるコンピュータ端末同士をつないだ(比較的小規模の)ネットワーク。家庭、企業、学校等で構築するネットワークで、イメージとしては同一敷地内のネットワークです。一番身近なのは、やはり家庭内LANでしょう。
端末をLANケーブルで繋いで構築したLANが有線LAN、無線の親機にワイヤレスで子機として繋いで構築したLANが無線LAN。無線接続と有線接続を混在させてLANを構築することも可能です。
LANには、ネットワーク管理者と呼ばれる管理者が存在します。管理者がLANを構築し、利用ルールを決めたり、不正アクセス等の監視をします。 LANは誰もが自由に利用できるわけではなく利用者が限定されます。家庭内LANに見知らぬ他人のパソコンが接続していたら普通は困りますよね。

WAN (Wide Area Network)

LANより広い範囲のネットワーク。専用線などの通信回線を使って、物理的に遠くにある複数のコンピュータネットワークを相互に接続したネットワーク。例えば、小平キャンパスと千駄ヶ谷キャンパスのコンピュータ間をつなぐネットワーク、とか。同じ津田塾大学のネットワークですが、敷地が離れていますね。小平キャンパスで一つのネットワーク、千駄ヶ谷キャンパスで一つのネットワークを構築していて、その双方を繋いで、2つで1つの津田塾大学のネットワークを構築して、外部からは自由に接続できない、そういうイメージがWANです。

インターネット

インターネットは、世界中の無数のネットワーク同士を相互に接続した、世界最大の巨大なネットワークの集合体であり、データが流れるための「道」の役割を担っています。LAN同士を繋いでWANになって、さらにこちらのWANとあちらのWANとそちらのWANをつないで‥というように、どんどん相互に接続していくイメージです。

「接続する」いうのは最初に述べたように「コンピュータがネットワークを介してデータをやりとりする」ことを意味します。自分の意図を相手に理解してもらい相手の意図を自分が理解できなければデータをやりとりできません。そのために通信に関する「取り決め」が必要になります。この取り決めを「通信規約(プロトコル)」と呼びます。レベル(より正確にはネットワークレイヤー、ネットワークの階層)ごとに様々なプロトコルが存在します。インターネットに接続するための規格やデータを交換する手順、エラーが発生したときの対処の仕方などが取り決められています。この取り決めがあるために、インターネット自体があたかも一つのネットワークのように機能して、ユーザはネットワークの違いを意識せずに利用できます。

また、インターネットという「道」は、物理的には「光ファイバー」でできています。日本と海外との間には、海底ケーブルが何本も敷かれ、そこをデータが通っています。 データの通る道を整備しているのが、「回線事業者」です。日本の場合、NTT東、NTT西、KDDI、その他に電力会社やケーブルテレビ会社などが回線を提供しています。

インターネットは「インターネットサービスプロバイダ(ISP)」と呼ばれる「接続代行業者」と契約することにより、誰でも利用できます。ISPは単にプロバイダと呼ばれています。プロバイダは、回線業者が提供してくれる回線(一般的には光ファイバー)を使ってユーザがインターネットに接続できるようにしてくれます。日本では、OCN、So-net、@niftyなどを始め、非常に多くのプロバイダを選ぶことができるようになっています。

このように、インターネットに接続されたコンピューターは、「回線」を使って「プロトコル」に従うことでデータをやりとりできます。具体的には、ファイルの転送や共有、コンピュータ端末の遠隔操作などを遥か遠く離れた地にある別のWANに繋がれている端末間でも行えるようになります。もちろんどのコンピューターでも遠隔操作できたら困りますので、勝手に侵入できないように設定するのが普通です。

WWW (World Wide Web)とサーバクライアントシステム

WWW

「WWW」は、インターネット上に点在する様々な情報を発信したり受け取ったりするための「仕組み」のことです。 以下のような特徴があります。 Web(ウェブ)は蜘蛛の巣という意味があります。つまりWWWは「世界規模の蜘蛛の巣」という意味で、リンクによって世界中の情報がつながっていることを表現しています。もともとは、欧州原子核研究機構(CERN)で論文閲覧システムとして開発されたものが元になっています。

サーバクライアントシステム

情報システムは、サーバ・クライアント型と呼ばれるシステムで構成されることがよくあります。 このシステムにおいて、サーバとクライアントは、コンピュータネットワークを利用して情報を交換します。サーバは、サービスを提供するアプリケーションプログラムですが、サーバプログラムが動いているコンピュータ端末をサーバと呼ぶこともあります。クライアントは、サーバに対してサービスを要求するソフトです。通常、サーバはクライアントからの要求を待っていて、クライアントから要求があったときに、適切な応答を返します。

WWWもサーバクライアントシステムによって実現されています。

WWWサーバ
(ウェブサーバ)
情報を発信(提供)するためのアプリケーションプログラム。あるいはそのプログラムが動いているコンピュータ端末。インターネット上に無数に存在している。クライアントの要求に応じて、適切なサービスをクライアント側に提供する。例えば、自分が保存しているデータの公開など。
WWWクライアント
(ウェブブラウザ、単にブラウザとも)
サーバに接続して、情報を受け取る(取り出す)ためのアプリケーションプログラム。ブラウザの最も基本的な機能は、ウェブサーバから送られてくる情報を、人が見てわかるページ(ウェブページ)として表示することである。
Google Chrome,Safari,Microsoft Edge,Internet Explorer,Firefoxなどが最近はよく利用されています。

IPアドレス

インターネットは、コンピューター端末の相互接続のためにIP(アイピー、インターネットプロトコル)というプロトコルを利用しています。TCP/IP(TCPから分かれてできたのがIPなので)と呼ぶこともあります。 IPでは、ネットワークに接続している端末はIPアドレスという数値で識別します。 IPv4(アイピーヴィフォー、インターネットプロトコルバージョンフォー)のIPアドレスは、32桁の2進数です。表記する場合には、32bitを8bitずつに区切り、さらに10進数に変換して表記します。 例えば、133.99.161.13のように表記します。

インターネットに接続する機器すべてに重複しないIPアドレス(これをグローバルIPアドレスと呼びます)を割り当てる必要があります。同じIPアドレスの機器が2つあったら、通信でデータを送信すべき相手が2つのうちのどちらの機器かわからなくなります。IPv4では、8bit×4の数値、つまり256の4乗=約40億個のアドレスが表現できますが、現在は全ての機器に割り当てるには足りなくなっています。IPv4に替わる新しいIP規格としてIPv6が決められています。IPv6でのIPアドレスはIPv4の4倍の128bitになります。IPv6でのアドレス表記は、128bitを16bitずつ区切り、16bitを16進数で表記します。区切りの記号は、IPv4では、「.」ピリオドでしたが、IPv6では「:」コロンになります。 ただ現在のところIPv4とIPv6の互換性がないために、スムーズに移行が進んでいません。

そこで今はIPアドレスを節約しながら使っている状態です。その節約に寄与しているのが、ローカルIPアドレス(プライベートIPアドレス)です。以下のIPアドレスは、ローカルIPアドレスとして使うことが決まっていて、個人が家庭内や組織内で自由に利用できます。

これ以外のIPアドレスはグローバルIPアドレスと呼ばれます。グローバルIPアドレスは、インターネットの中で重複しないように管理されています。個人ユーザーは、プロバイダーと契約して、プロバイダーからIPアドレスを割り当ててもらいます。一般にIPアドレスだけでは個人の特定はできませんが、どのプロバイダーが割り当てたIPアドレスかはわかりますし、プロバイダーは、IPアドレスと利用された時刻などから利用者を特定することができます。従って訴訟などの際はプロバイダーに開示請求して個人を特定します。

ローカルIPアドレスの使い方は次のような感じになります。家庭内LANを例にして図にしてみます。 プロバイダから支給されたモデムが家の中にあって、そこに無線LAN親機を繋いで、さらに無線で個人のスマホ、パソコン、iPadを繋いでいるのを図にしました。無線LAN親機とモデムは1台で済むようになっていることもありますね。
一般にローカルIPアドレスの使い方としては、LAN内の端末にローカルIPアドレスを割り当て、LANとインターネットの2つのネットワークの間に、プロキシサーバを置いたり、ブロードバンドルータと呼ばれる機器を置きます。 図の場合、モデムとあるのがブロードバンドルータの役割をしていて、スマホ、パソコン、iPad、そしてWifi親機にローカルIPアドレスを割り当てます。ローカルIPアドレスは重複せず家庭内LAN内での識別が可能なように、それぞれ別々のものを割り当てます。 そうして、LAN内の端末は、プロキシサーバやブロードバンドルータを介してインターネットにアクセスします。
具体的にはブロードバンドルータはインターネットに接続して、LAN内の端末、例えば図のパソコンの要求を聞いて、パソコンの代わりに情報を送受信して、受信した情報をパソコンに渡します。
ブロードバンドルータは、ローカルIPアドレスをグローバルIPアドレスに変換する機能を備えていて、ローカルIPアドレスを持つ端末がインターネットを通じて情報をやりとりする際に、ルータ自身のグローバルIPに置き換えて中継します。
こうするとグローバルIPアドレスは、プロキシサーバかブロードバンドルータだけに割り当てればよくなります。

また、ローカルIPアドレスはインターネット上の一つの端末を特定することができないアドレスなので、内部からは(図ではスマホやパソコンやiPadからは)インターネットにアクセスできるけれど、外部の悪意あるユーザからのハッキング等のアクセスは避けられるという利点も生じます。

右図のようなネットワークがあって、LAN1とLAN2に接続されている端末1~6がローカルIPアドレスを割り当てられていて、モデム1とモデム2はグローバルIPアドレスが割り当てられているとします。このとき、以下の問題を考えてみてください。いままでの話が理解できていればわかります。
  1. モデム1とモデム2のグローバルIPアドレスが同じということはありえるでしょうか?あるいは同じだったときに混乱は起きないでしょうか?
  2. 端末2と端末6のローカルIPアドレスが同じということはありえるでしょうか?あるいは同じだったときに混乱は起きないでしょうか?
  3. 端末2と端末3のローカルIPアドレスが同じということはありえるでしょうか?あるいは同じだったときに混乱は起きないでしょうか?

【参考】ちなみにスマホは、上図のようにWifi親機やモデムを経由してインターネットにつなげることができますが、スマホ単独でも4Gとか5Gとかの通信回線で直接インターネットにつながることができますね。このとき「テザリング」と呼ばれる機能を使えるように携帯会社と契約していると、スマホ自身をWifi親機にできます。そうすると、パソコンをスマホに無線接続することで、そのパソコンからインターネットが利用できるようになります。このときのパソコンにも、スマホによってローカルIPが割り当てられるのが一般的です。

グローバルIPアドレスを確認する

例えばクレジットカードを使ってネット通販を利用していったりするときの認証(今カードがなくても、後々カードを持つようになって承認か否認か選ぶこともあるでしょう)でメッセージ内に自分の使用端末のIPアドレスが記述されていたりします。

自分が使用しているグローバルIPアドレスは、https://www.cman.jp/network/support/go_access.cgi(外部ページ、クリックで別タブで開きます)などで確認できます。

ドメインとDNS

ドメイン

コンピューターはIPアドレスを使いますが、人間は一般にわかりやすく「www.tsuda.ac.jp」のような名前を使います。「www.tsuda.ac.jp」のような名前をホスト名、「tsuda.ac.jp」の部分をドメイン名といいます。

ドメイン名は、企業、団体、教育機関、個人などに割り当てられる固有のもので、重複しないように管理され割り当てられます。例えば、tsuda.ac.jpというドメイン名は津田塾大学だけが使うことができます。

ドメイン名は半角文字で大文字小文字を区別しません。

ドメイン名の最後の方をみるとどんな組織かわかることもあって、例えば最後が「.gov」ならアメリカの政府関係、「.edu」ならアメリカの大学です。また「.jp」は日本、「.ca」はカナダ、「.uk」はイギリスといった意味を持っています。また最後が「.jp」の場合は、「.ac.jp」は大学などの教育機関、「.go.jp」は政府機関、「ed.jp」は小学校中学校高校などの18歳未満を対象とした教育機関、「.co.jp」は一般企業、「.ne.jp」はネットワークサービス会社です。

DNS

ホスト名とIPアドレスを対応させる仕組みがDNSです。 ホスト名とIPアドレスを対応させたデータベースは巨大になるので、ドメインに応じてデータベースを分散させて管理するようになっています。データベースを管理する「DNSサーバー」が世界中にあります。ブラウザに対し人間が「www.tsuda.ac.jp」のようにホスト名で通信相手のウェブサーバを指定したとしましょう。ブラウザは、まず基幹サーバにjpを担当するDNSサーバを教えてもらって、次にjp担当のDNSサーバからac.jpを担当するDNSサーバからtsuda.ac.jpを担当する津田塾大学のDNSサーバを教えてもらって、そこからwww.tsuda.ac.jpのIPアドレスを教えてもらいます。そして、ブラウザは、www.tsuda.ac.jpのIPアドレスを知って、津田塾大学のウェブサーバと通信できるようになります。

URI と URL

ブラウザで閲覧することのできるページをウェブページといいます。 このウェブページが保存されている場所を特定するための方法をURI(またはURL)といいます。 URIは、「Uniform Resource Identifier」の略で、URLは「Uniform Resource Locator」の略です。 URLはインターネット上の「場所」を示す表記方式ですが、URIは、すべての情報資源を識別するための表記方式で「場所」の他に「名前」を表すこともあります。このようにURIはURLを含むもので、ウェブページを指定するURIはURLでもあります。両者は同じです。
ウェブページがどんなものかはわかりますね?この講義資料もウェブページです。ホームページという言い方もありますが、ホームページはサイトのトップページのことを指す場合が多いので、講義ではウェブページという言い方をします。

【参考:興味のある人向け】 URIとかURLとかなぜこんな風に紛らわしいことになったかを簡単に説明します。

Web上にある資源(*1)を指し示すために、最初にURLという識別子(*2)が規定(*3)されました。その後、URNという識別子が規定されました。URLにしろURIにしろ「スキーム」と呼ばれる文字列が先頭にきます。スキームには、https:の他、ftp:、file:、mailto:など様々なものがあって、国際標準のものもそうでないものもあり、よく使用するものしか私も知りませんが、今後も確実に今後も増え続けることでしょう。そうなると、URLとかURNとかの区別がきっちりできるとは限らないし、URLでもURNでもないというのがでてくるかもしれません。とりあえずどうなってもいいように(という言い方も変ですが)、URLやURNを含む包括的な概念としてURIという識別子を規定した、という歴史的な流れがあります。

(*1) Web上にある「資源」という言葉は、URIやURLのR、つまりResource(リソース)の訳で、Webで提供される情報やサービスなどを示します。ウェブページのようなファイルは「情報」に含まれますが、何が情報で何がサービスかといった個別の分類をせず、まとめて「資源」という言葉で言い表しています。
(*2) 「識別子」という言葉は、情報の正解では、書式が規則で決まっていて、曖昧さがなく一意に何かを指定して機械的に処理できるような符号や数字を含む文字列を示すのに使わます。
(*3)「規定された」というのは、例えばIETF(Internet Engineering Task Force)というような組織によって、RFCなんとかという形で仕様が文書化されて公開されるということを示します。IETFというのは、インターネットに関連する技術等の標準化を行う団体です。
さて、それでURN(Uniform Resource Identifier)という識別子ですが、urn:スキームから始まる識別子として規定されています。例えば、先ほど出てきたIETFという団体が定めたRFC2396という文書を示すURNは、
urn:ietf:rfc:2396
と記述できます。ちなみにrfc2396にアクセスするためのURLは例えば、
https://tools.ietf.org/html/rfc2396
です。このURLに含まれる「html/rfc2396」はtools.ietf.orgというサーバ内に保存された情報のありかを示すパス名ですが、フォルダ名は変更するかもしれませんし、保存場所を別の場所に移動させればこのURLは将来変わるかもしれません。これに対し、urn:ietf:rfc:2396によって示される文書そのものは変わることがありません。つまり、URLで示す「位置」は変わるかもしれないので、将来にわたって変わらない「名前」で特定の資源を一意に識別しようとして考えられたのがURNというものです。(では、それをどう使うかというとまだあまり実用的ではないかな、という気がします。気がするだけですけど。)
他には、特定の本を示すURNもあって、これにはISBNコードを用います。
URN:ISBN:978-4-915512-37-7
(大文字小文字を区別しません)

URLを用いたウェブページの閲覧

ブラウザに目的のウェブページのURLを入力することで、そのページが閲覧できます。
URLにはファイル名とそのファイルを保持するウェブサーバのホスト名を含んでいます。それで、ブラウザは、URLで指定されたウェブサーバとこんな感じの通信をして、データをもらってウェブページを表示します。

このデータ通信はHTTP(HyperText Transfer Protocol)というプロトコル(通信規約)に従って行われます

http://で始まるURLは、このHTTPプロトコルで通信するという意味です。 もう一つHTTPSというプロトコルがあります。これは、HTTPを拡張したHTTP over TLSというプロトコルです。HTTPSプロトコルでは認証局が発行するデジタル証明書(サーバ証明書)によってサーバの身元が保証され、データのやりとりはSSL/TLSで暗号化されます。認証局は複数存在します。またSSL/TLSというのは暗号化の方式の一つです。HTTPSプロトコルを使用するウェブページのURLはhttps://で始まります。 ブラウザ上でクレジットカード番号を入力してもらったり、IDやパスワードなどを入力してもらったりする際の秘密漏洩対策、また他のフィッシングサイトなどの偽サーバのなりすましでないことを保証するために、最近ではHTTPSプロトコルを利用するサイトが主流になりました。

この講義資料のウェブページを閲覧するためのURLは次のような形をしています。

https://edu.tsuda.ac.jp/~sirakura/2023t1/lec2.html

これは次のように構成されています。
https://edu.tsuda.ac.jp/~sirakura/2023t1/lec2.html
URIスキーム://サーバ名.ドメイン名/ファイル名(パス名)

ファイルの「パス名」については、別の回で説明します。index.htmlなどのいくつか特殊なファイル名は省略されることがあります。「https://www.tsuda.ac.jp/」などがそうです。また一般に.htmlという拡張子のファイルをHTMLファイルと呼びます。

URIスキームには、httpやhttps以外にも、ファイル送受信に関するプロトコル名のftpや、ブラウザが動いている端末上のファイルにアクセスするためのfile、メールの送信先を指定するmailtoなどがあります。

ブラウザ

ブラウザにはSafari、MicrosoftEdgeなど複数のアプリがありますが、ここではGoogle Chromeを例に、ブラウザに関する基本的な操作を説明します。

起動方法いろいろ

南校舎の端末

【Windows】ログインすると最初からGoogle Chromeが起動しています。 一旦終了して、再度、起動したいときには、デスクトップ左下のウィンドウズボタンをクリック→をクリックします。

アプリケーション一覧から探して起動する。

【Windows】 ウィンドウズキー→ (Windows 11は、さらに右上の[すべてのアプリ >]をクリック→)一覧表示からGの項目にGoogle Chrome があると思うので、それをクリックします。

【Mac】 DockにあるFingerアイコンをクリック→ Finderウィンドウのサイドバーの「アプリケーション」をクリック→ 一覧からGoogle Chrome(右図参照)をダブルクリックします。

アプリケーション名(の一部)で検索して起動する。

WindowsにしろMacにしろ、起動したいアプリのアイコンが見つからないときは、以下のように検索して、結果として表示されたアプリ(アイコンと名称が一緒に表示される)をクリックしても起動できます。
【 Windows】タスクバーにある虫眼鏡アイコンや検索ボックスをクリックして「chrome」と入力します。
虫眼鏡アイコンや検索ボックスが表示されていない場合、Windows10なら、タスクバー上で右クリック→ [検索]→[検索ボックスを表示]で、表示できます。Windows11なら、タスクバー上で右クリック→ [タスクバーの設定]→[タスクバー項目]の[検索]をオンにすると表示できます。
【 Mac】 ステータスメニューのSpotlightアイコンをクリックして、「chrome」と入力します。

終了

【Windows】右側の縦に3つ点が並んだアイコンをクリック→「終了」で終了します。 アイコンについては、Windows:すぐ下の「基本操作」の説明にある図を参考にしてください。
【Mac】デスクトップ左上の「Chrome」メニューから「Chromeを終了する」を選んで終了します。

基本操作

下図は大学のWS教室の端末でWindowsを選択してログインしたときに起動しているGoogle Chromeを例にしています。Mac版も似たような外見です。ただWindows版はブラウザの右端のメニューに「終了」があって、Mac版はないので、Mac版ではデスクトップ左上の「Chrome」メニューから「Chromeを終了する」を選んで終了します。

アドレスバー

ブラウザの上部にアドレスバーがあります。ここに見ているページのURI(URL)が表示されます。 (一見するとURIスキームの部分は隠されて表示されていなかったりします。) またアドレスバー内をクリックしてから直接URI(URL)を入力してreturn(enter)キーを押すことで、そのページを表示させることもできます。
URLのコピペ: URLをコピペできるようになってください。 キー操作する場合、WindowsOSは[Ctrl]キーでMacOSは[Command]キーを使います。 手順は以下の通りです。
【コピーの操作】
Chromeの場合
  1. ブラウザのアドレスバー右側にある(Windows)/(Mac)アイコンをクリック
  2. メニューが表示されたら「リンクのコピー」をクリック
Chrome以外のブラウザ
  1. ブラウザのアドレスバーをクリック(どこでもよい)。
  2. URL全体を選択する。
    [Ctrl]/[Command]キーを押しながら[a]キー
  3. コピーする。
    [Ctrl]/[Command]キーを押しながら[c]キー、あるいは右クリックして「コピー」を選ぶ
【ペースト(貼り付け)の操作】
ペーストしたい箇所で[Ctrl]/[Command]キーを押しながら[v]キー、あるいは右クリックして「ペースト」とか「貼り付け」を選ぶ。
コピペしたURLに先頭にURIスキームがあることを確認しましょう。アドレスバーにURIスキームが表示されていない場合でもコピペしたときに表示されるはずです。表示されてないとURLとして不完全です。アドレスバーに全角文字が表示されていても、サーバとクライアントとの実際のやりとりでは半角英数字や記号に変換して処理されるため、コピペすると「%」を含む英数字になります。例えば「天」という文字は、「%E5%A4%A9%0D%0A」と変換されて表示されます。

ページ内を進む/戻る

どういうやり方でも構いません。さすがにできない人はいないと思います。 例えば、ページ内をクリックしてから、タッチパッドでスクロールすればページ内を進んだり戻ったりできますね。

ページの再読み込み

ニュースサイトなどは、表示してから時間が経つと内容が更新されていたりします。最新の内容にしたい場合に、再読み込みボタンをクリックします。大抵の場合、アドレスバーの右とか左にあると思います。

リンク先へ飛ぶ

ウェブページの場合、クリックすると別のページ(あるいはページ内の別の場所)が表示される箇所(文字列とかアイコンとか)がありますよね。このような箇所は「リンクが張られている」という言い方をします。そして、クリックして別ページを表示させることを「リンク先に飛ぶ」という言い方をします。

前のページに戻る/次のページに進む

これも知っていると思います。矢印ボタン(矢印アイコン)が上部か下部の左端の方にあって、色が薄くなっているときはそれ以上戻ったり進んだりできませんが、色が濃くなっているときには、今まで閲覧した履歴にしたがって、ページを戻ったり進んだりすることができます。この矢印ボタンを右クリックすることで、それまでに閲覧したページの一覧が表示されて、それを選ぶことで、何ページも前に戻ったり、ずっと後へ進んだりできる場合も多いです。

タブ

Google ChromeもSafariもMicrosoftEdgeにも、タブという機能があって、複数のページを同時に見られるようになっているはずです。 一つのタブでこの講義資料を閲覧しながら、別のタブでGoogle Classroomを見る、ということができると何かと便利です。

こんな感じに「タブ」はページの上の方にあります。

ブックマーク(お気に入り)

「ブックマーク」とか「お気に入り」などの名称で、頻繁に見るページを登録しておく機能がついていると思います。登録したり、登録内容を整理できるようになっておくと便利です。 ブックマークに関する操作の説明は、外部ページのGoogle Chromeヘルプ ブックマークを作成、表示、編集する(クリックで別タブで開く) を参考にしてください。

情報検索

ウェブコンテンツを探す

GoogleYahoo! JapanMicrosoft Bingなどのサイトで検索サービスを利用したことがあると思います。

検索サービスは、Yahoo!のディレクトリと呼ばれるリンク集を人手で作成したところから始まりました。その後、ウェブページの数が増えるに従って、クローラと呼ばれるロボット(自動でデータを収集するソフト)が世界中のウェブページにアクセスして情報を集め、検索可能にする検索エンジン(search engine)が現れました。その代表がGoogleですが、現在は、Yahoo!もクローラを使って情報を集めています。そして、Microsoft BingがOpenAIのGPTと呼ばれるLLM(大規模言語モデル)を組み込んで、検索+AIでチャット形式で検索できるようにするという取り組みを始めたのが今年です。

パソコンやスマホの操作手順などがわからなくても、検索すれば大抵見つけることができます。例えば、ブラウザのブックマーク機能に関する手順を知りたいときには、「Chrome ブックマーク」のように2つのキーワードを半角スペース(半角空白)で区切って検索することで見つけることができます。

また、検索時に、キーワードを列挙するだけでなく目的に応じた演算子やコマンドを組み合わせて探すこともできます。演算子やコマンドは半角文字で入力する必要があります。

さらに、Microsoft Bingのチャットは「会話のスタイル」を「正確に(厳密に)」に設定して例えば「Chromeのブックマークの操作方法を教えて」と文章で入力すると、手順を教えてくれて、さらに、その手順が示されているウェブページを提示してくれます。

演算子

検索サイトは複数ありますが、その多くのサイトで共通するようなものをいくつか挙げておきます。ただ検索サイトによっては使えない演算子やコマンドもあるかもしれません。また特定の検索サイト独自のものが他にもあったりします。
演算子用例意味と注意点
スペース A B C A B Cのすべてを含むページを検索する。スペース区切りで、キーワードを列挙するとand検索となります。
OR A OR B AまたはBを含むページを検索する。ORは大文字で入力し、前後に半角スペースを入力してください。AとBの両方が含まれるページも検索結果に含まれます。
( ) (A OR B) C AまたはBを含み、かつCを含むページを検索する。半角の括弧記号で、一つのまとまりを指示します。AとBとCが含まれるページも検索結果に含まれます。
- A -B Aを含むがBを含まないページを検索する。「―」はマイナス記号で、直前に半角スペースを入力する必要があります。
""A" Aをワンフレーズとして検索します。["」はダブルクォーテーション記号です。表記ゆれを無視したい場合や、文節、文章などをそのままのまとまりで検索したい場合にダブルクォーテーションで文字列を囲って検索します。通常は「送り仮名」と入力しても「送りがな」が含まれるページも検索結果として表示されたり、文章を入力してもそこに含まれる単語のand検索として検索結果が表示されたりします。
"A∗B" 「∗」はアスタリスク記号で、任意の文字列に置換されます。AとBの間に任意の文字列が入るフレーズで検索します。例えば、"今日の∗はいい感じ"と入力して検索すると、今日の写真はいい感じ、今日の夜景はいい感じ、今日の仕事はいい感じといったフレーズを含むページが検索できます。

コマンド

検索範囲を特定ドメインに区切ったり、特定の拡張子を持つファイルのみを検索したりといったことがコマンドを使用することで可能になります。複数のコマンドを組み合わせたり、先ほどの演算子と組み合わせたりすることが可能です。 また、コマンドの前には半角スペースを入力します。
コマンド用例意味と注意点
site: キーワード site:URL 指定したサイト内でキーワードを含むページを検索します。例えば、「粗大ごみ site:www.city.kodaira.tokyo.jp」とすると、小平市公式ホームページ内で粗大ごみという語を含むページを検索します。 質の高い情報を得るために、「site:ac.jp」(大学機関)や「site:go.jp」(政府機関)を付けて検索するのもよくあります。
filetype: filetype:拡張子 拡張子を指定して検索します。「filetype:pdf 委任状」とすると委任状を含むpdfファイルを検索します。小平市役所に提出するpdf形式の委任状で印鑑登録に関するものを探したいときには例えば「委任状 印鑑登録 filetype:pdf site:www.city.kodaira.tokyo.jp」と検索することができます。
related: related:URL 指定したURLと関連性の高いサイトを検索する
cache: cache:URL Google検索でのみ使えるコマンドかもしれません。閲覧したいサイトやページが削除されてしまって確認できないとき、一定期間のうちなら、Googleが保存しているデータが残っているので、そこから検索して探すことができます。
link: link:URL URLで指定したwebページにリンクしているページ、つまり被リンク先を検索します。 自分のブログなどに他の人がリンクを張っているかどうかを確認したいときなどに使用します。

本や論文を探す

以下は、文献検索、論文検索、記事検索などを行いたい場合に、よく使用すると思われるサイトです。 クリックでそのサイトに飛びます。
津田塾大学図書館・AVライブラリー
http://lib.tsuda.ac.jp/
書籍だけでなく、オンライン資料として、ジャーナル(電子版の学術雑誌や論文誌)、新聞記事、辞典や辞書など、大学が契約している有料で高品質な情報源にアクセスできます。 詳しくは、オンライン資料ガイドを見て下さい。
国立国会図書館
https://www.ndl.go.jp/
オンラインサービス一覧
国立情報学研究所 CiNii
https://ci.nii.ac.jp/
論文や研究データを探すときにとても便利なサイトです。オンラインジャーナルのような学術情報は高額ですが、大学などに所属していなくても利用できるようにしようという動きがあって、大学の研究成果に自由にアクセスできる機関リポジトリというサイトを公開している大学があります。
有用な学術情報(の一次情報)は、基本的には英語で発表されています。Google翻訳やDeepLなどの翻訳サービスも利用すると効率よく情報を探せるかもしれません。また、ChatPDFのような機能を使うとPDFファイルを読み込ませて、チャット形式で中身を要約してもらうこともできます。

データを探す

レポートなどで何かを主張するときには、個人的な主観やエピソードではなく、客観的な事実やデータに基づいてその主張の妥当性を示さなければいけないことがあるでしょう。

様々なデータがネット上で公開されています。 それらの中には、誰でも無償で利用・再配布・加工できるような形式で入手できるデータもあり、「オープンデータ」と呼ばれています。オープンデータの中には、国や自治体が収集・集計して公開しているものもあります。

データのファイル形式はCSV,Excel,PDFなどです。統計データがCSV形式で公開されている場合には、データをダウンロードして、ExcelやGoogleスプレッドシートなどのソフトで開けば、データの分析やグラフの作成ができます。

e-GOV
https://data.e-gov.go.jp/
データカタログサイト。 日本のオープンデータを集約している公式ポータルサイトです。 気象庁の気象データなどの各省庁が公開しているデータや、地方公共団体などが公開しているデータを検索できるようになっています。
e-Stat
https://www.e-stat.go.jp/
日本の統計が閲覧できる政府統計ポータルサイトです。各府省庁が公表する統計データを集約して、分野やキーワードで絞り込んだり検索したりできます。
RESAS
https://resas.go.jp/
地域経済分析システム。政府統計データが集約されているサイトで、都道府県や市町村の単位でデータを簡単に可視化できるようになっているのがe-Statと違います。一部民間企業が提供するデータも利用できます。

検索で気を付けること:情報の検証

情報には間違いがあるということを常に忘れないようにしないといけません。 ネットで得られる情報にしても、本で得られる情報にしても、信頼できるものもあれば信頼できないものもあります。情報を鵜呑みにせず、疑問をもって検証し評価することが重要です。

例えば医療や健康に関する情報は学術的に正しい情報と間違った情報が混在しているので注意が必要です。本として出版されていても内容の正しさが保証されているわけではありません。

情報の信頼性を見極めるためには以下のポイントを考慮してください。

  1. 情報源:信頼できる団体や機関が発信している情報かどうか確認してください。専門家や専門家による組織、公的機関、大学などのサイトは信頼性が高いでしょう。公開までに複数人が内容をチェックしている情報だとより信頼性が高まります。
  2. 誰(どういう組織)が書いたものか:筆者がその分野の専門家であるかどうか調べてください。複数の専門家によって内容がチェックされている情報であればより信頼性が高まります。学会の公式見解やジャーナル論文などがそうです。また、分野も医療系なら公衆衛生、感染症、アレルギーとか、情報系ならセキュリティ、自然言語処理とか、より細かい分野の専門家であるかを気にする必要があります。情報系の専門家でも、セキュリティに詳しいからといって、自然言語処理に詳しいわけではありません。
  3. 参考資料や引用:情報がどのような根拠に基づいているのか、参考文献や参考資料、引用されている情報源を確認しましょう。信頼性の高い情報源が根拠として多く提示されている場合、その情報も信頼性が高いと言えます。また、それらの資料が一次資料かを確認しましょう。引用の引用で間違った情報がそのまま引用されつづける例もあります。
  4. 客観性: 情報が事実に基づいているか、個人の意見や感情に基づいているかを判断してください。客観的なデータや証拠に基づく情報は、信頼性が高いとされています。特定の立場や見解を強く主張している場合、その情報にはバイアスが含まれている可能性があり、信頼性に疑問が生じます。
  5. 日付:情報が古くないか確認し、最新の情報であることを確認してください。例えば学術的な見解は、新しい研究結果や科学的根拠、事態の推移などによって、更新されていく可能性が高いものです。
  6. 誤り・矛盾: 内容に誤りや矛盾がないか確認してください。事実に基づいた情報であれば、誤りや矛盾はほとんど存在しないはずです。
  7. 他の情報源との照らし合わせ: 同じ情報が他の信頼性の高い情報源でも報じられているかどうか調べてください。多様な情報源を照らし合わせて総合的に評価することが重要です。
例をみてみましょう。例えば、新型コロナワクチンについては、様々な情報があります。それらについては、科学的に誤謬があるかないかを検証します。例えば、「新型コロナワクチンQ&A」(クリックで別タブで開きます)というサイトがあります。ページには「厚生労働省」とあります。次に内容を見てみましょう。このQ&Aの中の例えばこのページ(クリックで別タブで開きます)を見て下さい。そうするとページの下部に「参考資料」が緑の字で記述されていて、CDCの報告や論文へのリンクになっています。論文の掲載されている学術雑誌名は、「N Engl J Med」とか「Lancet」。「N Engl J Med」はNEJMと表記され、「Lancet」もランセットと表記されニュースサイトなどで目にしたことがあるのでは?国際的に信頼されている学術雑誌です。

では、上記のサイトの情報が信頼できるか考えてみます。

  1. 情報源:ページには「厚生労働省 」とありますが、これだけでは偽サイトかもしれません。そこでブラウザのアドレスバーにあるURLを見ます。httpsプロトコルによる通信であり、ドメインは「mhlw.go.jp」とあるので、確かに厚生労働省が公開しているウェブページのようです。
  2. 誰が書いたか: 厚生労働省はワクチンの承認を行う機関であり、有効性や安全性について検証できる複数の専門家を抱えていると推測できます。したがって、厚生労働省の公開する情報であれば、そういった複数の専門家の見解と一致していると考えるのは自然でしょう。
  3. 参考資料や引用、客観性、他の情報源: CDCの報告や論文が根拠として提示されています。論文にもいろいろあって、信頼性の高い研究とそれほどでもない研究があります。国際的に信頼されている学術雑誌に掲載されたかどうかが一つの指標になります。国際的に信頼されている学術雑誌に掲載されている論文なら研究データに客観性がありそのデータから導かれた見解も信頼性が高いです。またCDCも専門家の集団なので、他の信頼性の高い情報源といえます。
以上の理由からこの情報の信頼性は高いと評価できます。

さて、論文の信頼性についてもう少し考えてみます。国際的に信頼されている学術雑誌に掲載されている論文なら信頼できますが、そうでないのはどうでしょう?個人で専門外の論文の内容を一次資料として確認しきちんと把握するのは難しいものです。簡単な問題でなく新型コロナのように複雑で研究論文も数多くあるとなおさらです。このときには、そのような論文を参考資料として挙げて解説してくれている専門家の意見が参考になります。ただし、専門家の意見も、「1人の専門家」の意見であれば信頼性が低いです。「多くの専門家が合意する意見」であれば信頼性が高いです。このため、学会や、上述の厚生労働省やCDCなどの公的機関の発信している情報で複数の公的機関で同じような情報が発信されていれば信頼性が高いといえます。

また論争があって、もし特定の学会の情報を疑う場合には、参考になるのは他国の学会の意見です。例えば日本の感染症学会の情報を疑うなら、他国の感染症学会の情報が根拠として必要になります。

それから、ウィキペディア(wikipedia)はよく間違いがあります。誰でも編集できるので信頼できるとは言えません。ウィキペディアで調べたことは、他のサイト(最終的には一次資料)で確認する必要があります。また、有名サイトのページでもレビューのように誰でも書き込んで編集できるサイトの情報は、個人の見解という受け止め方をする必要があります。

提出課題

期限

来週火曜日までです。

提出課題

以下の問いに答えて下さい。回答は、Google Classroomの「第2回 提出課題」とあるGoogleフォームに記述して下さい。回答を入力して送信することで課題提出となります。
回答を送信した後、右図のように「課題が添付されていません」というメッセージが表示されても「提出済み」と表示されていれば問題ありません。

採点基準

再提出について

期限後の提出や再提出は減点対象になりますが、期限内であれば編集しなおして提出し直しても減点されません。

再提出は、Google Classroomの「授業」→「第2回 提出課題」→「課題を表示」→「提出を取り消し」→確認されたらさらに「提出を取り消し」→「第2回 提出課題」のGoogleフォームをクリック→「既に回答済みです」という文言の下の方にある「回答を編集」をクリック。そして、回答後に「送信」をクリックすれば再提出できます。

期限後に返却しますが、満点でなくても、再提出した方がよいと言われなければ再提出する必要はありません。

次回は


上へ戻る