令和の日本型教育とは46

皆さんこんにちは。

「令和の日本型学校教育」の構築を目指して~全ての子供たちの可能性を引き出す、個別最適な学びと、協働的な学びの実現~(答申)が令和3年1月26日に中央教育審議会より出されました。

この答申を少しずつ読んでいきましょう。今までチュウキョウシントウシンとカタカナで聞こえていた内容が、中教審答申と漢字で聞こえるようになるように、行政職の皆様も知識を蓄えていっていただければと思います。

本日はこの答申、令和の日本型教育の構築を目指して、をテキストマイニングした結果をお伝えしようと思っていましたが、それは途中で頓挫しています。ことの顛末をお話ししたいと思います。

テキストマイニングとは

最近よく耳にすることになった「テキストマイニング」とはどのようなものなのか。
wikiによると以下のような説明があります。

https://ja.wikipedia.org/wiki/%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%83%9E%E3%82%A4%E3%83%8B%E3%83%B3%E3%82%B0

書かれている文書の内容(テキスト)から、「それらがどれくらい出てきた」や、「どういう時系列で出てきた」などを解析することで有用な情報を取り出す分析方法です。数字で表されていない、テキストで表現されているものからわかることはないか、と分析することですね。

なんとなく「好き」が多い気がする、と感じていたものをよりクリアにより多くの人が納得できる形で分析・提示できるようにしよう、とする手法です。

テキストマイニングをしようと思った理由

45回にわたってこの答申を読んできましたが、「大事なことは全部書く」が基本姿勢なんだろうな、ということで、本当に現在の課題としてありとあらゆる方面の物事が書かれています。どの課題も解決しなければならない大切なものなのですが、「本当にこの答申で言いたかったことは何か?」ということについて、知りたくなりました。ふんわりと「まあ、これが繰り返し出てきてるからこれじゃないですかね?」というのは簡単ですが、それは読む人によって全く変わります。自分の興味あることしか残らないのは一面の真実ですね。

そのため、実際にテキストマイニングを行って、「どんな言葉が」「どんな関係で」出てくるのか、目に見える形にしたくなりました。

公開されているファイルからテキストを取り出す

文部科学省から出る答申や計画等は高確率で「PDFファイル」での提供となります。今回の答申も例にもれずPDFファイルで提供されています。そこからテキストを取り出す必要があるわけです。もちろん、優秀なソフトウェアがありますから、テキストを取り出すこと自体はさほど難しいわけではありません。

参考にしたのは以下のサイトです。ありがとうございました。

https://www.itmedia.co.jp/bizid/articles/1211/08/news011.html

もともときっとワープロソフトで編集されたものですからテキストさえ取り出せればあとはさっさとKH Coder! と思っていた私は現実の壁に突き当たります。

データクレンジング(人力)

これを読んでいる方で、「何そんなまどろっこしいことを」と思った方はぜひすぐご連絡ください。

私はとりだしたテキストを前に呆然としました。こんな状態だったからです。

令和の日本型教育答申をテキストで取り出したオリジナルの画面

これは、何かを置換したらどうにかなるかというと、ある程度はどうにかなりますが特にテキストの無意味な部分で分かれているところなど、手動でどうにかするしかないですよね……ちなみに答申はもともとA4で90ページ以上ぎっちりあります……

現在このデータクレンジング真っ最中です。私のゴールデンウィークの成果はこれになるでしょう。

あまりに続けてやっているとスクロールバーを見てやる気がなくなるので、時々暴走してあちこちに飛んでクレンジングしています。頑張ります……

投稿者プロフィール

大江 香織
大江 香織
株式会社ハイパーブレインの取締役サポート事業部長 広報室長です。
教育情報化コーディネータ1級
愛知教育大学非常勤講師です。専門はICT支援員の研究です。