事例338

SSDSEでPPDAC

東京都立立川高校 佐藤義弘先生

最初に自己紹介をします。現在、立川高校の情報科の指導教諭をしております。2003年に情報科がスタートしたときから、ずっと情報科の教員をしています。

 

大学でも勉強させていただいています。一応、教える側ではありますが、私の方が勉強させてもらっています。

 

また、学習指導要領のお手伝いさせていただいたり、情報科の書籍の作成に協力したりしています。

 

 

私が在職する都立立川高校は、明治34年創立の、もと東京府立第二中学校という伝統校です。

 

もともと普通科だけの学校でしたが、2022年度に「創造理数科」が1クラス新設されました。このコースは今年が完成年度で、現在各学年に1クラスずつあります。彼らの入学時のレベルは、普通科の生徒の偏差値より1レベル高いという感じです。

 

また、進学指導重点校ということで、生徒の75%、約250人が共通テストをフル型(2025年度は6教科7科目)で受験するので、情報科については、私ひとりでどのように指導するのか、というところです。

さらに、スーパーサイエンスハイスクールにも採択されています。

 

「情報Ⅰ」は1年生で必履修、「情報Ⅱ」は3年生の自由選択として、今年開講しました。選択者は5名で、非常に優秀な講師の先生に担当していただいています。

 

 

オープンデータを授業で使うのは本当に大変!

本日の暗号のようなタイトル、「SSDSEでPPDAC」というのは、要はオープンデータを使ったデータ分析の授業実践の紹介です。

 

オープンデータの分析は、学習指導要領にも例示されていますが、実際に授業をすると、オープンデータというのは、いろいろなところが出していることもあって、データが多過ぎるのですね。

 

また、授業の目標が立てにくい、というのも問題です。どのようにしたら完成なのか、ということも含めて、どういったプロセスでやっていくのかがわかりにくいのです。

 

そして、実際にオープンデータを開けてみるとわかりますが、相当慣れている私たちでも、処理するのに苦労するような、整理されていない「汚い」データが出てきて、生徒にやらせると、結局グラフを作るのがやっと、という感じです。データ分析の授業の前に2,3回データの扱い方の授業をやっておいても、全く手に負えないという体たらくです。

 

 

さらに、実際に授業をすると、データが多過ぎるので、探したいデータが見つからない。そして最大の問題が、生徒がデータを見始めると、あれこれ目移りして、データの「沼」に落ちてしまい、あれこれ相関を求めようということになると、時間的にも全く無理な話になってしまいます。

 

また、目標が立てにくいため、何と何を組み合せることができるのか、どのような手順で処理したらよいのか、ということがなかなかうまく整理して進められない。

 

しかも、データの形式がばらばらで、Excelの処理に明け暮れるという「Excel地獄」に陥ってしまい、沼があったり地獄があったりと、大変なことになるわけです。

 

 

数Ⅰで学ぶPPDACで分析の進め方を共有する

そこで改善を図ってみたのが、この「SSDSEとPPDAC」です。

 

まず「PPDACサイクル(統計的探究プロセス)」というのは、「Problem、Plan、Data、Analysis、Conclusion」のことで、実は数学の教科書に載っています。

 

本校で使っている「数学Ⅰ」の教科書にはこれが載っていて、2学期までに履修し終える、という流れになってます。

 

 

PPDACは、この段階に従って分析を進めるといくとうまくいくよ、というもので、「サイクル」なのでこれを何度も回すことになります。

 

「情報Ⅰ」の教科書にも、いろいろな教科書に何となくこの流れが書いてありますし、ずばり、この名称で書いてあるものもあります。

 

ですから、PPDACの段階の踏み方については、「数Ⅰでもう学んだよね、やったよね」ということにつなげることができます。数Iのデータの分析は2学期までに終わっているので、「情報I」の3学期に学ぶ「(4)データの分析」で使うことができる。これでうまくカリキュラム・マネジメントができます。

 

授業のスライドでは、生徒が使っている数学の教科書を見ながら資料を作って、「数学Iの○○ページ」と入れておけば、「数Iの教科書に書いてあったよね」という確認もできます。

 

 

PPDACの良いところは、手順が明確になるので、グループで進めるときに「今2つ目の『P』だから、次に『D』にいかなきゃまずいよね」といった形で、皆が同じ方向で各段階で何をするべきかがわかり、進行状況を共有できます。

 

また、ゴールまでに何をすべきかがわかるので、結論からさらに問題を発見できないか、ということを考えることもできます。サイクルなので、一度結論が出ても、次の分析が必要になるケースも結構あります。それらをグループ内で共有しながら進めることができます。

 

 

SSDSEは、教育用に整形されたデータセットの優れもの

SSDSEは、独立行政法人統計センターが公開している教育用データセット(※)で、オープンデータの中から、教育用にある程度形を整えたデータが提供されているものです。

 

※ https://www.nstac.go.jp/use/literacy/ssdse/

 

 

SSDSEの何よりも良いところは、それぞれのデータに「このExcelを開けると、このような見出しで、こういう項目で、このように整理されたデータがある」という能書きがついていることです。

 

この解説を読めば、実際にデータを開く前に、どのように分析するのか、という方針を立てることができます。

 

データのレイアウトの説明もあるので、これを見ればデータを整えやすいのですね。よく、途中に小計などが入っていて、気が付かないまま加工すると大変なことなになりますが、そういったことがないのでExcel地獄に陥ることもない。目標を持ってデータをいじり始めることができます。

 

 

進行の目安を提示しておき、何をまとめたらよいかをスライドテンプレートで意識させる

こちらが授業の構成です。

 

生徒には、このようなスライドを最初に見せて、「PPDACを3回の授業でやるので、1回目はこの辺り、2回目はこの辺り、3回目はこの辺りを想定しています」と緩く時間配分を示し、グループで進捗状況を確認しながら進めさせます。指示や説明のスライドはこれだけです。

 

生徒には、「SSDSEを利用して、PPDACの手法を使って、統計的な手法や仮説検定で分析できたら面白いよね。分散や相関係数など、数学Ⅰで学んだ統計的手法をとりあえず1個は使ってみて、最後はスライドにまとめてくださいね」という形で進めます。3回でPPDACを回して、その結果を4回目にポスターセッションで発表する、という全4回のシリーズです。

 

 

授業の進行の目安は、先ほどのスライドのように提示しておきます。

 

その際に、作業用のスライドのテンプレート(最近授業用にこういったものを作ることに凝っています)を配布しています。

 

これを作っておくと、このスライドには何を書けばよいかを示すことができます。こちらのスライドで、現在「データの分析の目的」と表示されているころはスライドマスターのままの状態ですが、ここに生徒が入力すると、この表示は消えます。

配布したテンプレート:https://hs-joho.net/23j1/306/23j1-306ws.pptx

 

このように、スライドマスターで、このページには何を書けばよいかを示しておくと、手順を違えずに進めることができます。ただ、生徒は作り終わると、たいていすぐに全部デザインを変えてしまって、私の苦労はどこへ行ってしまったのか、と(笑)。それはそれで構わない、ということにして、このような工夫をしたスライドマスターを配布しています。

 

 

「沼」や「地獄」で悩むのでなく、データ分析の活動自体の難しさや気づきを感じる授業ができた

生徒の感想をChatGPTで要約してみました。

 

1回目の授業の感想がこちらです。「データ収集の楽しさや難しさに気付いた」「データ分析の手法と計画性が必要であることかわかった」というもの。それから「仮説の検証の難しさ」に気付いたりしています。

 

 

2回目の授業では、やはりExcelがなかなか大変だ、という問題が出てきます。また、「4人グループで行ったが、進め方が共有できているので、お互いのアイデアを活かすことができた」ということも出ています。そして、「仮説の設定というのは大変だ」ということにも気づいていました。

 

さらに、「ちゃんと仮説を作ったつもりでも、仮説として成立しておらず、また初めから考えなければいけなかった」という感想もありました。

 

 

3回目になると、やはりデータ分析の難しさが挙げられていました。また「相関関係を見つけたとしても、これで本当に相関があると言ってしまってよいのかな」と疑問に思っていたこともわかります。

この回答を書いたチームは、問題をもう1回見つけて、再度分析しています。

 

また、グラフの作成の工夫も、自分たちで進める中で気付きが生まれています。

 

 

ポスターセッションの感想では、「初めは『相関がない』と結論付けたけれど、他のチームの発表を見て、新たな仮説を立てたらうまくいくのではないか、ということに気付いた」というものがあり、やはり他の人の分析を見るのは大事であることがわかりました。

 

また、「コミュニケーションの重要性」ということで、ポスターセッションをやって、いろいろな人の発表や質問を聞いて、意見交換が研究を深めるために重要であることを認識したこと、そして、「データ分析の課題」として、適切なデータの選定が大事であること、外れ値を適切に処理しないときちんと分析できないことがわかった、といった声が見られました。

 

 

まとめです。

 

SSDSEは、「解説」を活用することで、生徒がデータの沼に落ちずに済み、またデータの形が整っているので、Excel地獄に落ちない、という点がとても優れています。

 

生徒にはSSDSEを使うように言いましたが、実はSSDSEでまず基本的な手法を考えた上で、別のところからオープンデータを拾ってきて、それと組み合わせて分析しているチームも結構ありました。

 

 

PPDACは手順が明確なので、グループで作業しやすいということがあります。

 

実際の授業の中でも、生徒たち自身で「今、Pだよ」「次はDだよね」と声を掛け合いながら行っていました。創造理数科のクラスでは、1回分析が終わったところで新たな問題を発見して、2回目に「新たにこのデータを追加してやってみたいと思います」というグループがいくつもありました。

 

統計的手法の活用については、今回あまりお話ししませんでしたが、この授業の前に2回ほど、「数学で学んだことを『情報』でやってみよう」という授業を行い、Excelなどのツールを使って実際に数値を出してみる、という授業を行いました。ですので、統計的手法については、使おうと思えばすぐに使える状態で、この授業シリーズに入っています。

 

ですから、統計的手法というのは、データを見る尺度として非常に有効であることは理解できた一方で、「相関係数が出たから、だからどうなの」という疑問を持つ生徒もいました。

 

生徒の中には、時々間違った分析をしているケースもありました。例えば、「県民総所得と持ち家数には相関関係がある」というものは、その裏に「人口」という変数があり、擬似相関になります。

 

その辺りを見落としたまま発表したら、ポスターセッションで他の生徒から指摘をされたということがあり、やはりポスターセッションという形で皆の目で見てもらうことも大事だなと感じました。

 

 

[質疑応答]

 

Q1.高校教員

グループで活動されていますが、グループ活動で行ったことで、よかった点を教えてください。

 

A1.佐藤先生

グループで活動するメリットは、もし1人ずつで最後のポスターセッションを行うとアウトプットが40本になり、ポスターセッション自体ができない、というのがまず一つです。

 

グループの人数については、4人グループにしてポスター10本が適当だろう、という部分が大きいですね。また、やはり1人でやっていると、どうしても手が進まなかったり、アイデアが浮かばなかった、というケースがあるので、グループ活動はそれを防ぐ効果もあります。

 

席は最初に自由席で座らせます。隣同士(「相方」と呼んでいます)」は友達2人で、偶然向かい側に座った2人と組んで4人グループとして、グループの中にコミュニケーションができる人と、初めてに近いかもしれない人もいる、そういったところの融合もさせていきたい、というところがあって、グループでやらせているところもあります。

 

 

Q2.高校教員

2点お伺いしたいと思います。1つは、擬似相関の処理や指導はどこまでされているか、ということ。

もう1つは、グループで発表させているということですが、個別の生徒に対する評価はどのようにし

ているのかということです。

 

A2.佐藤先生

まず相関については、正直なところ、相関に見えるデータを持ってきて「相関がある」と言ってしま

っているところもかなりありました。しかし、こちらから指摘するのではなく、ポスターセッション

の中で、「これでは駄目だよね」ということを共有したり、理解したりできました。

 

ですから、こちらからは、「気を付けなさい」とは言いますが、特に指導するわけではありません。た

だ、根底にあるものに気付いていない、というケースはありますね。

 

個別の評価については、この活動では必要ないと思うので、行っていません。観点別評価というのは、

その授業に対して生徒がどのように取り組んでいるのか、ということを、取り組ませているこちら側

の視点で行う評価ですから、生徒一人ひとりが私の指導に従って、ちゃんと取り組んでいるな、と思

われれば、「ちゃんとやっている」という評価でよいと考えています。

 

 

Q3.高校教員

ポスターセッションは、結構ごちゃごちゃとするイメージがありますが、どのようになさっているの

でしょうか。クラスごとに実施されているということであれば、教室をどのように使っているのか、

ポスターはどのように印刷して掲示されているのか、教えてください。

 

A3.佐藤先生

パソコン室の廊下側の壁がパネル(スクールパーテーション)で、磁石が付くものが6枚あります。10チームのポスターを中側4枚、廊下側6枚掲示しています。ポスターを貼る場所は幅90cmくらいの間隔で、A4版で印刷したスライドをマグネットで貼っています。

 

隣のチームと距離は大してなくて、すごく濃密なポスターセッションです。わーっと盛り上がって、非常に楽しい感じです。

 

第17回全国高等学校情報教育研究会全国大会(愛知大会)分科会発表