事例172

データ分析の実践 ~生徒の反応から教科横断の可能性を探る~

清教学園高校 勝田浩次先生

「学習」の根底にある考え方の確認

ご本人提供
ご本人提供

今回、データ分析の実践について話すにあたり、まず「学習」や「学び」という言葉の捉え方について整理しておきたいと思います。

 

これまでの「学習」は、知識の量に重きが置かれていて、興味関心が置き去りにされていた側面があると思います。つまり、「学びの意味」と「学習の内容」が切り離されていました。

 

これに対して私が考えるのは、知識の量と同時に興味関心も向上するというように、二つが双方向に絡み合って進むのが良い学習だと考えています。

 

つまり、学ぶきっかけを作りながら「知識の橋渡し」をするということが学習だと考えています。お互いを行ったり来たりすることが重要で、このことこそが「探究する」ということだと考えます。

 

 

そして、このベン図の重なっている部分が、学校でしかできない部分であり、そこをいかに広げていくかという点が、これからの私たちの課題です。

 

この考え方に基づいて、今回はお話をしたいと思います。

 

 

情報科としての「学習」とは

まず、どんな学力に橋渡しをするのかという点です。今回の実践では、情報Ⅰの「(4)情報通信ネットワークとデータの活用」を意識しながら実践を行いました。

 

詳しい内容については、後ほど生徒たちの感想やレポートの内容とともに紹介し、どのような力が身に付いたのかを紹介します。

 


また、どのように興味を持たせるのかという点ですが、データ分析の活動を通して行います。具体的には、自分たちでアンケートを取り、そのデータをもとに相関関係を求める分析を行います。自分たちの言いたいことを、データを使って検証するというものです。この実践は、神奈川の三井先生の実践(※)を参考にしながら作りました。

 

 ※三井先生の実践はこちら

 

また、他に工夫している点としては、データを分析していくにあたり、要所要所で「やりこめる要素」を盛り込んだ課題を設けています。「やりこめる要素」を盛り込むことで生徒たちの興味関心を引き出すというねらいがあります。

 

今回の発表で、子どもたちが探究的に学んでいくためのきっかけの一つとして、データ分析の授業が位置づけられるのではないかということ、また、学習指導要領にある数学科との連携にとどまらず、他教科に関しても教科横断の可能性があるのではないかということをお伝えできたらと考えております。

 


 

10回の「データの分析」の授業を通してデータリテラシーを育む

今回の授業は、2学期の10回分の時間を使って行いました。「データの分析」というテーマで、目的はデータリテラシーを育むこと、つまり仮説を立て、自分の主張を支えるためにデータを活用できる力を付けられるようにしたいということです。

 

※クリックすると拡大します。

 

そして、どうなればデータリテラシーが育成されたといえるのかですが、まずは、「仮説を立てることができるようになる」こと。そして「その仮説を検証するための根拠としてデータを活用できる」というところに目標を設定しました。

 


使用したツールは、Googleスプレッドシートです。OSに依存せず扱えることや、休校になった際にも各自が持っている端末で続きから行えることが理由です。授業をすすめる上で必要な「データ分析ツール」が備わっているという点も考慮しました。

 


 

ファーストステップとしてスプレッドシートの基本操作と関数の使い方を学ぶ

 

10回分の授業の流れはこの通りです。それぞれの内容を簡単にご紹介します。

 

スプレッドシートをいきなり使うのは難しいため、カレンダー作りを通して、スプレッドシートの基本操作を学んでもらいました。何かを表現したいという目的があり、そのためにソフトウエアのスキルを学ぶという考え方をしてもらいたかったため、必要以上にこちらから教え込むことはしませんでした。

 

※クリックすると拡大します。

 

この画面は「関数を使いこなそう1」という課題の一部分です。自分たちで考えていく第一歩として、「データを見てどんなことが言えるか」を考えてほしいと思い、この課題を設定しました。

 

具体的には、1990年7月と2020年7月の大阪の最高気温・最低気温のデータを用意し、平均値や最頻値などの代表値を求め、比較してもらいました。複雑な計算などもスプレッドシートを使うと簡単にできるということや、定量的に比較することで見えることがあるということがねらいです。他にも、考察を深めるために、他にどんなデータがあると30年前との違いがより詳しくわかるかを問いかけ、考えさせながら授業を進めました。

 

※クリックすると拡大します。

 

実はこのデータを分析すると、面白いことが起こります。大阪の気温は実は30年前よりも2020年7月の平均最高気温が3度ほど低いということがわかるのです。生徒たちは驚き「地球温暖化は嘘なのか」というような話で盛り上がりました。このように、予想外の結果が出る点もデータ分析の面白さだと思います(これをお読みの方も、なぜ30年前よりも大阪の気温が3度低いのか、考えてみてください)。

 

仮説→結果→考察の段階を押さえる

 

操作方法や、データを見て考えることに慣れてきた頃に、これまでの学習で身につけたスキルや考え方を応用し、より本格的に「分析する」ための課題を出しました。

 

この課題では、「分析する」ということを3つの段階にわけて取り組んでもらいました。1つめは「仮説を立てる」、2つめは「結果を出す(可視化する)」、そして「結果を基に考察をする」という、「仮説」「結果」「考察」の三段階です。

 

具体的には、「1年生の特徴を探る」ということで、1年生約400人から回答してもらったアンケートデータを用いて分析を行ってもらいました。

 

ほとんど生データの状態で生徒には課題を配布したため、データセットのなかには入力を間違ったり、変な値が入力されたりしているものも混じっています。そのような値をどう扱うかという、「外れ値・異常値の除去」について考えさせたり、データの形式がそろっていないと分析がしにくいということも、ここで体感してもらいました。

 

※クリックすると拡大します。

 

また、データの形式は二種類あるということも話します。例えば「クラブ活動の所属」についてたずねた項目のデータは日本語で回答されており、質的なデータであるとか、「学校までの通学時間」のように、数値化されているものは量的なデータであるといった感じです。このように、実際のデータに触れさせ、「もっと詳しく調べてみたい」という意欲をかき立てた上で、分析の方法(質的データや量的データの分析方法)は話すようにしました。

 

データをもとにレポートを作成する

 

こうして大まかに「どのような方法で分析をするのか」について理解した後は、それぞれが仮説を立て、検証していきます。それぞれが立てた仮説を簡単なレポートにまとめます。どんな結果が出て、それを受け何を考えたのか、結果と考察をまとめていきます。

 

※クリックすると拡大します。

 

ここで面白かったレポートの事例を一つご紹介します。

 

これは「起床時間が早い人ほど勉強時間が長い」という仮説を立てた生徒が作った表です。

 

表を見る限りでは、起床時間が早いほど勉強時間が長いとは言えなさそうなことがわかります。この生徒は「この表では、仮説が正しいかどうかがわからない」ということを教えてくれました。詳しく中身を見てみると、それぞれの区分ごとのデータ数が一定ではなく、7時31分以降に起きた生徒のデータ件数は5件しかありません。他の区分のデータと100件近く違うのに、この表だけで仮説を検証していいのか。というわけです。

 

この生徒の気付きを紹介し、「何かと何かの関係性」を求めたい場合、相関係数を求めるといいという話をして、「相関関係の分析」に進みました。

 

 

「相関関係の分析」では、国連が提供するデータを基に、関係性をどのように求めるのかということを取り上げました。

 

こちらが用意したものは、国ごとの平均寿命、アルコール消費量、喫煙率などのデータセットです。このデータセットを使って、どの項目が関係していそうかを分析してもらいました。

 

※クリックすると拡大します。

 

これも先ほどと同様に、レポート形式にまとめました。後ほどご説明しますが、最終的に作成するレポートに向け、自分の考えを「仮説」「結果」「考察」というデータ分析の流れに基づいて整理する練習も兼ねています。

 

※クリックすると拡大します。

 

分析結果から「第三の要因」の存在に気付く

 

この画像は、生徒の書いてくれたレポートです。

 

「GDPが低い国の人ほど15歳以上の喫煙機会や1人あたりのアルコール消費が少ない」という仮説をもとに、喫煙率とGDPの散布図、アルコール消費量とGDPの散布図を作ってくれています。

 

このように、生徒たちは自分の興味のあることや自分の気になったことを仮説として立て、実際にそれが本当にそうだと言えるのかをデータを用い、いろいろな角度から検討して検証を進めていきます。

 

※クリックすると拡大します。

 

ここでも意外な結果が出てきました。

 

「女性は喫煙率が高いほど平均寿命が長い」というものです。相関係数は約0.6というやや強い相関が出ました。

 

もちろん、タバコを吸う女性ほど平均寿命が長い。ということはありません。実はこの結果には、第三の要因が絡んでいるのです。つまり、疑似相関です。

 

※クリックすると拡大します。

 

このデータセットには世界中の国の情報が入っています。その中には比較的裕福な国も開発途上国のように比較的貧しい国も入っていることを考慮に入れないといけません。裕福な国であれば、女性がタバコを吸う余裕があるかもしれませんが、開発途上国では女性がタバコを吸えるほど稼ぎがないかもしれません。15歳以上の喫煙率が高いと平均寿命が高くなるというふうに純粋にこの散布図を見るのではなく、何か別の要因が絡んでいるのではないか?と思って見ることが大事なのです。

 

この場合の第3の要因は、GDPだと思います。裕福な国は貧しい国と比較して医療にお金をかけることができます。その結果、寿命が長くなるということです。金銭的なゆとりがあるので女性がタバコを吸うこともできます。

 

別の要因があるかもしれないということを考えると、出てきた結果を深掘りすることにもつながります。例えば、先ほどの例を深掘りするならば、 GDPが高い国と低い国で分類をして相関係数を算出すると、裕福な国では、喫煙率と平均寿命の間に正の相関がでますが、貧しい国では同じように相関係数を求めても全く相関がないことがわかり、「 GDPが第三の要因である。」ということを検証することができます。

 

自分が調べたい仮説を立て、それを検証する相関関係を求める

 

このような疑似相関に気を付けながら、最終レポートを作っていきます。

 

まず自分が明らかにしたいことを仮説として立て、それを検証することができる質問項目を2つ作ってもらいました。今回は相関係数を用いて最終レポートを作ってもらいたかったため、量的データで回答できる質問に限定しました。例えば「寝る子は育つ」が本当かを検証するために「何時間睡眠時間を取っていますか」「あなたの身長は何センチですか」という具合です。

 

 

これは生徒が考えたアンケート項目の一覧です。

 「他の人の質問項目も利用したい」という生徒が出てくることを見越して、他の人が取ったアンケート結果も利用できるようにしました。

 すると、他の人の質問項目を参考に、仮説を立て直す生徒もいました。

 

※クリックすると拡大します。

 

生徒が作ってきた最終レポートを紹介します。

 

例えばこの生徒は「りんごを食べている人ほど体調を崩しにくい」という仮説をもとにアンケートをとり、検証しましたが、結果はそのように出なかったということが書かれています。

 

※クリックすると拡大します。

 

この生徒は、「好きな先生の数が多いほど寝ている授業が少ない」という仮説を立てています。このように、生徒たちが日頃から感じていることや考えていることを表現してもらいました。

 

以上のように、「データの分析」というテーマで10回分の授業時間を使い、最後にはレポートを書かせるという活動を行いました。

 

※クリックすると拡大します。

 

身に付いたデータリテラシーは

 

では、この活動を通して実際にデータリテラシーを養えたのかというところを、生徒の気付きや最終レポートの文章の中から拾い上げて説明していきたいと思います。

 

まず「多面的な分析ができるようになった」ということが挙げられます。

 

例えばこの生徒は「睡眠時間と授業中眠くなる頻度」について仮説を立てましたが、分析した結果、それほど高い相関係数がでなかったようです。その結果から「学校でお昼ごはんを食べることが第三の要因としてあるのではないか」と考え直し、新たに検証するためには、このようなアンケート項目にすれば良いのではないか、と考えてくれました。

 

 

また「データの取り方に関する気付き」も出てきました。なぜ結果が出なかったのかを深く掘り下げた結果、「性格や行動パターンに深く関わるデータのほうが相関関係は出やすいのではないか」といった考察に行き着いたのは面白いと思いました。

 

 

「新たな問題発見があった」ということも成果のひとつだと考えます。

 

この生徒は「ハグと幸せの関係」をテーマに仮説を立て分析を行いましたが、思ったような結果は得られませんでした。しかし、その経験から「ハグの効果は長続きしないのかもしれない。もっとハグの定義を具体的にして、何秒ぐらいハグをすると幸せを感じるのか、ということや、ハグの効果の持続時間などを次に研究しても面白いかもしれない」と結論づけています。

 

このように、新たな探究テーマを設けようとする動きにつながったのは良かったと思います。

 

 

教科横断の可能性は多岐にわたる

 

最後に、教科横断の可能性についてです。

 

データ分析の授業の面白さは、自分自身の疑問や知りたいことを明らかにしていく中で、次の疑問や知りたいことが生まれ、問題を発見したり、興味関心がより高まったりするところにあります。この興味関心をどのように次につなげていけばいいのでしょうか。

 

もちろん、情報の授業の中でできれば良いのですが、時間の制約や内容的な取り扱いにくさもあるため、情報の授業だけでは難しいこともあります。

 


一番よく言われているのは、数学科との連携です。分析手法に関する数学的な理解を深めるための取り組みをしてもらって教科連携するということはよく言われていることだと思います。

 


数学科以外にも連携は可能だと思います。例えば、はじめに紹介した気温についての分析であれば、地歴公民科の授業の中で、気候変動がなぜ起こっているのかについて考えさせる時間をとってもらっても面白いかもしれません。

 

同様に「気温が低くなる条件」について、理科の授業で教えてもらう時間を取ってみてもよいでしょう。

 


他には、国連のデータを使った「女性の喫煙率と平均寿命の相関関係の分析」ならば、開発途上国は実際にどのような状況に置かれているのか、寿命や貧困問題について考えさせていくということもよいかもしれません。

 


飲酒や喫煙の健康被害については、保健体育科で考えを深める時間をとることもできるかもしれません。色々な気付きがあった分、その気付きを他の教科とつなぎ、その教科の見方、考え方を生かしながら深めていくということがこのデータ分析の授業では可能なのではないかと感じました。

 

最後になりましたが、「総合的な探究の時間」はこうした気付きを掘り下げるにはとても良いと思います。社会課題や自分自身の興味があるテーマを掘り下げていくことが「総合的な探究の時間」の主旨です。ハグの効果を研究したい生徒は「総合的な探究の時間」で、自分の知りたいことをとことん探究していくことができるかもしれません。

 


最後にこれまでの話をまとめます。今日は、データ分析の授業で、「生徒たちが探究的に学んでいくきっかけ」を作ることができるということ、そして、データ分析の授業での気付きをもとに、教科を横断した学習につなげていくことができるかもしれないという「教科横断の可能性」についてお話ししました。

 


多様な仮説を立てたり、新たな探究テーマに気付いたりする子どもたちの様子を目の当たりにして、データ分析の授業は探究的に学んでいくためのきっかけとして有効だと感じました。

 

また、情報科以外で深められそうなテーマを発見したり、他の分野についての興味関心を喚起したりできたのではないかと思います。このデータ分析の授業を情報科の中だけで完結するのではなく、様々な教科とつながりながら、さらに生徒たちの関心を高め、学びを深めていきたいと思います。

 

このような可能性を秘めるデータ分析の授業です。これからも皆さんと一緒に考えていきたいと思います。

 

神奈川県高等学校教科研究会情報部会 情報科実践事例報告会2020オンライン 実践事例報告