事例202

「情報I」教科書でのデータサイエンスの扱いについて

京都女子中学高等学校 成瀬浩健先生

「プログラミング」の議論は盛んだが、「データサイエンス」は話題になっていない

ご本人提供
ご本人提供

いよいよ来年4月から、新課程の「情報Ⅰ」が始まります。「プログラミング」については、ずいぶん前から話題になっていて、いろいろな研究会でも取り上げられていましたし、様々な資料が出ていましたが、「データサイエンス」の部分はあまり話題になってなかったので心配だ、と思ってきました。その辺りについて、教科書ではどのような形で取り上げられているのか、ということを整理してみました。

 

まず、自己紹介をいたします。私は京都女子高校で「情報」の授業を担当しています。授業では、パソコンというのはMicrosoftのWordとかExcelのといったofficeソフトのこと、みたいなことはしたくないので、UBUNTUを使った環境で授業を展開しています。

 

 

情報の免許は認定講習で取得した世代ですので、最初は授業で何をやったらよいのか、よく分からない状態でしたので、ICTE情報コミュニケーション教育学会)や、大阪府私学情報化研究会のお世話になって、いろいろな素材やヒントを集めて授業を進めていました。

 

情報科が始まって10年ほど経った頃、もっとちゃんと勉強しようということで関西大学の社会人大学院で勉強し直して、情報科の専修免許頂くことができました。一方で、京都府私立中高連合会の情報科研究会の委員長もしています。

 

本校は、内部進学で京都女子大学に進むコースは高校1年生で「社会と情報」を履修します。私大文系のコースは、多くの生徒が京都女子大への推薦入学となり、一部指定校推薦で他大学へ行きます。このコースでは、高校2年生で「社会と情報」を履修します。

 

そして、国公立大学を目指すコースは、3年生で「社会と情報」を履修するということになっています。私は来年度、その高校3年生に「社会と情報」を教えたら定年を迎えるので、私自身は「情報Ⅰ」を教えることはありませんが、これからどうすべきか、ということについて考えていきたいと思います。

 

数年前に、「センター試験に情報が入るかもしれない、そうなれば『情報の科学』の内容が中心になって出題されるだろう」という話を聞きました。当時は、国公立を目指すコースの高校3年生の授業は、「情報の科学」を教えていたのですが、なぜか職員会議で押し切られて、翌年からは「社会と情報」を教えることになりました。

 

最初に少し紹介しましたが、「情報Ⅰ」を始めるにあたって、「プログラミング」や「データサイエンス」について、多くの先生、特に私のような認定講習組の世代は、どうしたらよいか困っていらっしゃるのではないかと思っています。「プログラミング」はいろいろな研修会が行われてるので、かなり準備ができてきているかと思いますが、データサイエンスや論理回路はちょっと心配なのではないかと考えています。では、どういうことを教えていったらよいかを整理して、皆さんと議論ができたらと考えています。

 

 

「データの活用」で扱う内容を、教科書ごとに「データベース」と「統計処理」について調べる

 

学習指導要領には、「データサイエンス」は「(4)情報通信ネットワークとデータの活用」という形になっていますが、スライドの赤字で示したところを身に付けることと、とされています。

 

「データを蓄積、管理、提供する方法」というのがデータベースです。そして、「表現、蓄積するための表し方」と、「収集、整理、分析する方法」が統計処理的な内容になります。「収集、整理、分析」というのは、条件処理的な話になるかな、と思います。データサイエンスでは、この二つの内容を扱っていかなければならないと思います。

 

 

下図は、文部科学省が令和元年に示した、国のAI戦略に関連した教育改革の資料です。「小中高校ではこういうことをやってください」という中で、「データサイエンスに取り組んでほしい」ということが書かれています。

 

※クリックすると拡大します。

 

文科省の教科書の編集趣意書のページを見ると、「情報Ⅰ」の教科書は、6社から12冊が出ています。それぞれがどういう扱いをしているかを、キーワードを抜き出す形で整理してみました。

 

 

この整理の方法で参考にしたのが、大阪電気通信大学の長瀧先生たちが2014年に行われた、「データベース操作の学習が可能なオンライン学習教材の提案」(情報処理学会論文誌、55(1),2-15)です。

 

これは、当時の「情報の科学」において、リレーショナルデータベースの操作実習を、兼宗先生が作られたsAccessを使って行うことに関する論文の最初のところに、各教科書でデータベース実習がどのように扱われているか、というのがあり、これを使わせていただきました。今回は、データベースと統計処理とを分けて調べてみました。

 

 

表計算ソフトを使ったデータベース実習は多いが、MS Accessを使うものはない

 

データベースに関しては、全ての教科書で、データベースシステムやリレーショナル型のデータベースというキーワードを扱っています。最近はリレーショナル型でないデータベースも話題になっているので、一部ではNoSQLについても触れられています。これは、実習を考えるとちょっと難しいかな、と考えています。

 

データの分析(統計的処理)に関しては、量的データ・質的データ、尺度、テキストマイニングなどは全ての教科書で、言葉としては紹介されていました。

 

また、実習では扱えきれていませんでしたが、オープンデータというキーワードが、約半数の教科書に出ていました。

 

 

具体的に教科書にどのような内容が掲載されているか、というのがこちらです。教科書会社を便宜上A~Fで表記しました。

 

特徴的なのはBで、データベースにキー・バリュー型を、実習ツールにPythonを使っているのが面白いところです。また、表計算ソフトを使った実習がいくつかの教科書に載っています。

 

先ほど紹介した長瀧先生の論文では、MicrosoftのAccessを使った実習がけっこう扱われていましたが、今回はMS Accessは全く登場していません。sAccessは、AとEで出ています。

 

※クリックすると拡大します。

 

 

2019年の全国大会で、都高情研さんが発表された年間指導計画(※1)では、データベースで5時間の設定をされていました。この5時間で、データベースの作成や活用について学び、実際のデータを使って実習することになってくるのかなと考えています。

 

※1 https://www.wakuwaku-catch.net/jirei19131/

 

 

統計処理のキーワードはクロス集計、回帰分析まで。テキストマイニングは説明のみ

 

次が統計処理です。キーワードとしては、クロス集計、回帰分析まで扱っています。テキストマイニングについてはほとんどが説明だけでした。Eの2冊が、テキストマイニングができるフリーのサイトを紹介していて、ここで実際にやってみましょう、という形で扱われていました。

 

※クリックすると拡大します。 

 

この辺りの内容は、だいたい表計算ソフトでできてしまうと思いますが、先ほどお話ししたように、個人的には統計ソフトのRを使ってみたらどうかと感じてます。RにRMeCabまでインストールしてしまえば、テキストマイニングもでき、面白いと思います。

 

 

先ほどの都高情研さんの指導計画に当てはめてみると、テキストマイニングが2時間ですが、Rを使えば、オープンデータを使って傾向の可視化をやっていけるのではないかと思います。

 

 

また、Rを使えば、クロス集計や相関回帰分析など一通りのことができます。統計処理については、私らの大学時代は電卓を使っていたのが、10年前に学び直したときSPSSに出会って、こんな簡単に統計処理できてしまうのか、というのでびっくりしました。当時SPSSはかなり高価でしたが、Rを使えば無料でいろいろなことができることを知ったので、統計の授業に取り入れたら、生徒たちがゆくゆく大学で卒論を書くときに、「そういえば」と思い出してくれるのではないかと思っています。

 

 

私が「情報の科学」でデータベースの授業をやってるときに使ってたのが、『おジさん学習帳』(※2)というブログサイトです。MSアクセスはかなり高価で、自宅のパソコンに入っていない生徒がほとんどなので、家で実習したかったら、Libre Officeというオープンソースをダウンロードし、インストールして実習を行いました。

 

※2 http://oji3fromdti.blog.fc2.com/

 

さて、皆さんはどのような形でデータサイエンス分野を授業で扱われるでしょうか。皆さんから、こういう実習やってみたよ、という内容をいただき、交流できたら嬉しいと思っています。よろしくお願いします。

 

 

[質疑応答]

 

Q1.

「情報I」について分析された中で、この辺りが心配だとか、この辺りの分野をもう少し教科書で突っ込んでやった方がよい、という部分はありますでしょうか。先生のお考えでけっこうですので、お聞かせいただけますでしょうか。

 

A1.成瀬先生

やはり統計のところですね。どの教科書も、表計算ソフトしか扱っていませんが、Rを使えば簡単に因子分析まで簡単にできてしまうので、授業の中で取り組まれてもよいのではないかと思います。

 

Q2.

もし先生が、「情報Ⅰ」を担当されるのであれば、どのような部分に重点を置いて、授業を展開されますか。

 

A2.成瀬先生

本校は、多くの生徒が大学進学しますし、彼女たちが卒論を書くときに、「あのとき習ったこの技術を使ったらできるね」と言えるような内容ですね。例えば、プログラミングもそうですし、データの自動処理などを扱っておけば、習っておいてよかったな、と後で思えるかなと思っています。

 

Q3-1.

データベースは、現在授業で扱っておられているのでしょうか。

 

A3-1.成瀬先生

高校3年生の選択科目として行った授業で、去年は14人でしたが、リレーショナルデータベースを扱いました。

 

リレーショナルデータベースは、表と表が線で結ばれている図を見ただけでは、「ふーん」で終わってしまうので、実際に表を作って、関係の線を引いて、ということを行いました。それからフォーム作って、実際のデータの入力も行って、最後にレポートという形で出力の表を作るところまでやってみて初めて理解できると感じたので、今年も2学期にこれをやろうと思っています。

 

第14回全国高等学校情報教育研究会全国大会(大阪大会) 口頭発表 より