事例290
回帰分析の結果から問題解決を考える授業
岡山県立岡山一宮高校 畑 英利先生
今回は、回帰分析の結果から問題解決を考える授業の実践報告をします。
まず、概要です。本校は、スーパーサイエンスハイスクール(SSH)に指定されています。この特例によよって、「情報Ⅰ」2単位のうち1単位分の代替課目として、「iCデータ&ロジカルサイエンス」という学校設定科目を開講して、この中に「情報Ⅰ」の内容も取り入れた授業を行っています。
本校は45分で授業を行っているので、1単位分は週1コマの授業となります。今回、発表する授業は、この「iCデータ&ロジカルサイエンス」の授業で2回分、週1コマ×2として行いました。
オープンデータを使って回帰分析の意味を理解し、探究活動で使えるように
授業の流れは、スライド中段の通りです。今回のポイントは、回帰分析を行った後、その回帰分析から問題解決を行ったことです。「情報Ⅰ」の内容に回帰分析があります。また大学入学共通テストの試作問題にも回帰分析の内容が出ていました。
回帰分析を、ただ入試対策のような形で行うのであれば、教科書の内容を説明し、教科書にある例題を解けばよいのですが、それでは探究活動につながりませんし、生徒も「回帰分析とは何か」ということが、ピンとこないのではないかと思いました。
生徒が、回帰分析がどういうものかを理解し、それを探究活動につなげていくにはどうすればよいかと考えたときに、「回帰分析の結果から、実際に問題解決をさせてみればよいのではないか」と考えて、このような流れで授業を行うことにしました。
授業の目的は、まずオープンデータを実際に使うことによって、オープンデータが活用できる、ということを実感できるようにすること。そして、問題把握や問題解決の場面で回帰分析が活用できるということを、実感できるようにすることです。この2つを組み合わせることで、実際の探究活動につながるのではないかと考えました。
身近な題材で回帰分析をやってみる~平均気温とアイスクリームの購入金額
第1時では、生徒が身近に感じる内容を題材にしました。いきなり難しい内容ではなく、身近に感じる内容を題材にすることによって、生徒が興味・関心を持って問題解決について考えることができるのではないかと思ったからです。
そこで、月別の平均気温(データは東京地点の月別平均気温を使用)とアイスクリーム購入のための支出金額を組み合わせてみればいいのではないかと思い、実際に散布図を作り、回帰直線を引いてみました。
2017年~2021年の月別平均気温は気象庁のWebページより作成しました。2017年~2021年のアイスクリーム月別支出金額は一般社団法人日本アイスクリーム協会のWebページより作成しました。
実際に回帰直線を引いたものが、こちらです。気温が5℃から15℃と、20℃から25℃の辺りの分布は、大体回帰直線付近にありますが、オレンジ色の丸で囲んだ15℃から20℃辺りは回帰直線より下に、黄色の丸の25℃以上では上に分布が集まっていることがわかります。
25度以上は、暑くなるので、アイスクリームがたくさん売れるのだろう、ということで、ここはそれほど不思議なことではなく、説明もできるかなと思いましたが、この15℃から20℃のところがなぜ回帰直線より下になっているのか、というところについては、私自身ちょっと考えが思い浮かばなかったので、ここを生徒に考えさせてみたら面白いのではないかと思いました。
第1時の具体的な授業の流れがこちらです。
第1時は、まず散布図と相関係数についての説明を行いました。この授業は1年次の3学期に行ったので、生徒たちは数学で散布図と相関係数について既に習っていました。ですので、散布図と相関係数のところは簡単に復習程度で話を終えました。
そして、散布図に回帰直線を引いて回帰係数を表示すれば2つの変数の関係について分析することができると回帰分析について簡単に説明をしました。
今回は回帰分析についてのやり方を理解するということではなく、回帰分析を活用することで問題解決をすることに主眼を置きたかったので、ここでの回帰分析の説明は簡単に終えておきました。
実際の値と推測値が合わないところについて、原因と解決策を考える
次に、CORREL関数を使って相関係数を求めました。すると、相関係数が0.91になったので、気温とアイスクリームの売り上げには強い相関があることを確認することができます。
さらに、散布図に回帰直線と回帰式を追加して、出てきた回帰式
y=41.447x+129.78
に、実際に16℃と18℃のときの月別支出金額の推測値を求めさせました。すると、計算上の値が、16℃のときは793円、18℃のときは876円となりますが、実際にはそれだけは売れていない、ということがわかります。そして、実際の値と推測値に差が生じることを、ここでまず確認させました(図4)。
このように、実際に回帰式に値を代入して計算を行うことで、回帰直線を引いて回帰式を出すことにより、実際の金額が推測値と比較してどうなっているのか、そして、推測値がわかることでどれだけ売れなければいけないかということを、実感することができたのではないかと思います。
回帰直線を引いて、回帰係数に数値を当てはめて計算を行ったことで問題を把握することができたので、次に課題として、「平均気温が15℃から20℃の範囲で月別の支出金額が回帰直線より下回っているのはなぜか」ということを考えさせました。
このように、まず問題を把握して、次に原因を考えた上で、次に解決策を考えさせることにしました。
そこで、次の課題として、「アイスクリーム屋になったつもりで、月別平均気温が15℃から20℃のときに、支出金額が回帰直線に近づくようにするためにはどうすればよいか」ということを考えてもらいました。この原因と対策の部分を個人で考えさせた後、ペアワークで意見交換をさせました。
生徒たちから出てきた意見で、まず15℃から20℃の範囲で回帰直線より下回る原因については、「気温が低いときは、暖房で部屋が暖かいので『アイスクリームを食べたい』と思うけれど、15℃~20℃程度であれば暖房を点けることがないから、アイスクリームを食べようとは思わない」という意見が出ていました。
そして、それを解決する方法としては、オーソドックスなアイデアとして「季節限定のアイスクリームを販売する」という意見が出ました。また、面白いものとして「おでんのように温かいものとセットで販売する」という意見もありました。
このように、第1時で身近なデータを使って回帰直線を引き、回帰係数で計算を行うことで問題を把握する。そして現象の原因を考えて、解決方法を考えるという流れをやってみました。
岡山県の臨床医数と病院数の関係のアンバランスについて考察する
続いて第2時では、社会問題について考える内容へとステップアップをしたいということで、岡山県の臨床医数と病院数等の関係という内容で授業を行いました。
※クリックすると拡大します。
このテーマを選んだのは、都道府県ランキングを使っていろいろな散布図を作ってみていたときです。その中で、臨床医数と病院数等の関係を見ると、図4のような散布図ができて、相関関係があることが分かりました。
そして回帰直線に当てはめてみると、岡山県は、人口10万人当たりの病院数と診療所数の合計値が94.4で、推測値を下回っていることがわかりました。
岡山県は、人口10万人当たりの臨床医数は全国5位と高いのですが、病院数と診療所数は、病院数が15位、診療所数が16位、さらに病院と診療所数の合計になると21位と、臨床医数の数に比べて病院数と診療所数が少なくなっています。生徒たちの地元である岡山県の臨床医数と病院数の関係を題材にすれば、生徒が自分事として興味・関心を持って解決策を考えることができるのではないか、と考えて、この題材を使うことにしました。
臨床医数は、厚生労働省の医師・歯科医師・薬剤師統計より作成しました。病院数および診療所数は、厚生労働省の医療施設調査・病院報告より作成しました。都道府県別の医学部数は、文部科学省Webページより作成しました。
第2時の流れがこちらです。
まず臨床医数と病院数、臨床医数と診療所数の相関係数を見て、それぞれの相関関係を確認します。
プリントの穴埋めを解くという形で問題を出して(図5・6)、生徒は復習として自分で解いてみます。相関係数を見て、これが強い相関なのかどうかというところを見ていきます。
※クリックすると拡大します。
次に、散布図に回帰直線と回帰式
y=0.253x+23
を追加します。
原因の考察のために様々な資料にあたってみる
このxに人口10万人当たりの臨床医数320.1を代入してyの値を求めると、人口10万人あたりの病院数・診療所数の合計推測値は約104. 0となります。実際の合計値は94.4です。回帰直線を引き、回帰係数を使うことで、実際の値が推測値より低いということがわかったので、生徒には、さらに詳しい資料を渡して、それらを見ながらデータにどのような特徴があるのかを考えることで、原因を考えてみました。
※クリックすると拡大します。
まず、図8の臨床医数と病院数・診療所数の都道府県別のランキングを見てもらいました。データから、臨床医数,病院数,診療所数について西日本が多く東日本が少ない西高東低となっていることと、岡山県の全国でのランキングを具体的に把握することができました。さらに別の資料として都道府県別の医学部の数を提示しました。医学部の数も西日本は多く、東日本は少ないという傾向があります。これも一つの資料として生徒に提示しました。
これらの資料は、Google Classroomに配信してChromebookでデータが見られるようにしました。
そして、課題として、岡山県の臨床医数は多いのに病院数や診療所数が少ないことからどういった状況になっているのか、それによってどのような問題が起こるのかということを、生徒に考えてもらいました。これによって、回帰分析を行ったことで問題点が把握でき、さらに他の資料も見たことで、なぜそうなっているのか、という原因を考えさせたということです。
そして、これを解決するためにできることは何かということを考えたことについて、グループで意見交換をさせました。意見交換後にグループとしての意見をスプレッドシートに入力してもらい、クラス全体で共有することができるようにしました。
単に分析するだけでなく、原因や解決策を考えることにつなぐ
グループワークの結果、生徒からは「新人の医師を研修として地方へ派遣してもらう」「企業と市内の病院が連携してプロジェクトを立ち上げ、地方に診療所を作り賛同してくれる医師を集める」「移動式の診療車や訪問診療を普及させる」「オンライン診療を行う」といった意見が出てきました。第2時も第1時と同様に、把握した問題点の解決について一生懸命考えていたと思います。
今回の授業で、生徒は問題の原因や解決策を考えることができていたと思います。そして、回帰分析と問題解決を組み合わせて授業を行ったことで、探究活動につながる授業ができたのではないか、と思います。今回はこちらで問題点を提示しましたが、生徒が問題点を自ら見つける流れにすれば、さらに良くなるのではないかと思います。
そして、より踏み込んで問題点を考えたり、問題解決を行ったりするためにどのようなデータがあればよいか、ということを考えさせるとよいのではないかと思います。
第16回全国高等学校情報教育研究会全国大会(東京大会) ポスター発表より