2  R on Colab

本書では,R(アール)という統計ソフト (あるいはプログラミング言語)を使って LSAについて学びます。 プログラミングというと難しそうと思うかもしれませんが, ここ数年の急速なコンピュータ技術の進展に伴い, Rを使うハードルは確実に下がっています。 2025年現在では,自分のパソコンにインストールしなくても ブラウザさえあれば,RでLSAの分析ができるようになりました。 Rには,無料でさまざまな統計解析ができるという特徴があります。 ぜひこの機会にRを学び,新たな世界に触れてみてください。

2.1 Rとは

最初にRの概要について説明します1。 何度か述べたように,Rは,統計解析向けのプログラミング言語です。 統計処理に必要なコードを簡単に書けること・ 高度な統計分析のパッケージが充実していること・ 無料で利用できることもあって, 統計を必要とするさまざまな分野で利用されています。 本書が扱うPISAやTIMSSといった大規模学力調査の分析もRで行うことができます。

本書がRを薦める理由は,Rが使いやすく,かつ無料であるという点にあります。 社会調査に馴染みのある人の中には, SPSS(エスピーエスエス)や STATA(ステータ,スタータ) といったソフトウェアを知っている人もいるでしょう。 確かに,これらのソフトウェアを使ってLSAを分析することもできます。 ただ,SPSSやSTATAは無償というわけにはいきません。 そのため,大学や大学院に在籍しているあいだは使えても, そこを離れてしまうと使えないという事態に陥りがちです。 無料というのは本当に重要で,とくに財政難・物価高の昨今, たとえ大学教員であっても年に数万円を捻出するのも難しいという人は少なくないと思います。

Rであればパソコンとインターネットさえあれば誰でも使えますし, 分析結果を他者と共有することも容易です。 本書で扱うColabというシステムを使えば, 作成したファイル(.ipynb)を渡せば情報共有は完了です。 Rからhtmlを作成し,成果をインターネットで公開することもできます。 実際に本書は,Rによるレポート作成機能2を使って作成しています。 ついでに,統計に詳しい人の中にはRを使っている人が多いので, Rが使えると,かれらにアドバイスをもらえたり, かれらの使っているコードを真似できたりといった利点もあります。 最初の一歩はハードルが高いかもしれませんが, そこを超えると,さまざまな可能性が広がっているのです。 ぜひこの機会にRに挑戦してみてください。

2.2 Colabとは

Colab(コラボ)とは, Googleが提供するクラウドベース3の開発環境です。 機械学習やデータサイエンスなどで利用されています。 ブラウザ上でPython(パイソン)というプログラム言語を直接実行でき, 特別な準備が要らないという特徴があります。 Colabは基本的にはPythonを利用するための環境なのですが,簡単な設定でRを利用することができるので, 本書ではColabの利用を前提に,Rについて説明していきます。

RをColabで使うには,いくつかステップを踏む必要があります。 順に解説していきますので,手順に沿って進めてみてください。

2.2.1 Google アカウントを用意する

ColabはGoogleのサービスなので,利用にはGoogle アカウントが必要です。 というわけで,Google アカウントを作成して Googleにログインしてください。 以下の説明は,すでにログインしている前提で行います。

2.2.2 Colabのサイトにアクセスする

まずはColabにアクセスしてください。 おそらく,図 2.1 のような画面が表示されるはずです。 ここで,左下の「ノートブックを新規作成」(青いところ)をクリックすると, 図 2.2 の画面が表示されます。

図 2.1: Colabにアクセスした画面
図 2.2: Colabの初期画面

これがColabです。 この画面にRのコードや文章を入力しながら, レポートを作成することができます。

2.2.3 ランタイムをRに変更する

初期設定ではPythonが前提になっているので, Rのコードを入力するとエラーが発生します。 これを防ぐには,ひと工夫が必要です。

まず,メニューにある「ランタイム」をクリックします。 すると,図 2.3 の画面になるので, 「ランタイムのタイプを変更」をクリックします。

図 2.3: ランタイムのタイプを変更

続いて,図 2.4 の画面で, 「ランタイムのタイプ」をPython 3からRに変更します。

図 2.4: ランタイムのタイプ

これで準備は完了です。 続いて,R on Colabの使い方を簡単に説明します。

2.3 R on Colabの基本操作

2.3.1 コードを実行する

まずは,簡単なコードを実行してみましょう。 ここでは例として,簡単な足し算をしてみましょう。 図 2.5 のように,3 + 4と入力してから「▷」のボタンを押してみてください。 最初は少し時間がかかると思いますが, しばらくすると,図 2.6 のような画面が現れるはずです。

図 2.5: コードの入力
図 2.6: 実行結果

2.3.2 テキストを追加する

Colabの便利なところは,コードだけでなく, テキストを書けるところです。 テキストを書くには, 図 2.7 のように境界付近にカーソルを移動すると出てくる「+テキスト」をクリックします。 すると,図 2.8 のように, 新しいブロック(セルと呼びます)が出現します。

図 2.7: セルを追加
図 2.8: テキスト入力画面

図 2.8 の画面をよく見ると,ブロックが左右に分かれていることに気づくかもしれません。 Colabのテキストは,左側の画面に入力を行います。 すると,図 2.9 のように右側にプレビューが現れます。 入力にはいろいろルールがあるのですが, とりあえず次の二つを覚えておくと良いでしょう。

  • # を最初につけると「見出し」になる
  • - をつけると箇条書きになる

他にもいろいろルールがありますが,とりあえずはこれで十分です。 気になる人は,Markdownを調べてみてください。

図 2.9: テキストの書き方

2.3.3 エラーが出た場合

ColabでRを操作していると,エラーが出ることがあります。 普段パソコンを使っていてエラーに遭遇する機会などないですし, メッセージが英語なので驚くと思いますが, プログラミングでは英語のエラーメッセージに遭遇するのはよくあることです。 ですから,落ち着いてエラー表示を読みましょう。 「ここが間違っています」という指示が(英語で)書かれていることもしばしばありますので, その指示に従ってコードを直せば動くようになります。

2.3.3.1 何も起きない

厳密にはエラーではないのですが,「実行しても何も起きない」と混乱する方がいます。 たとえばa <- 3; b <- 4というコードは,[「aに3,bに4を保存する」という意味です4。 aやbに数値を保存しているだけなので,これだけでは 図 2.10 のように何も起きません。 結果を表示するには,たとえば 図 2.11 のように a + bといった指示を出す必要があるのです。 入力しても「何も起きない」という場合は,自分が結果を出力する指示をしているのかどうか 確認してみてください。

図 2.10: 何も起きない
図 2.11: 実行結果が表示される

2.3.3.2 日本語が文字化けする

初期設定のままRを使うと,図を描画した際に文字化けします。 これを防ぐには, 日本語フォントをインストールするコマンドを入力する必要があります。 以下の例では,IPA fontというフォントをColabにインストールしています。

なお,Colabで日本語フォントを表示する方法はColabの仕様変更に伴って変わることがあります。 以下の設定をしても日本語フォントが表示されない場合は, 仕様が変わってしまったのだなあ・・・と諦めてください (著者も気づいたらできるだけ修正するようにします)。

# 注意!Colab用です!PC上のRでは実行しないこと
# 日本語フォントを導入
system("apt-get -y install fonts-ipafont-gothic")
# 日本語が表示可能
curve(sin(x), -pi, pi, main = "サインカーブ")

2.3.3.3 ランタイムがRになっていない

コードをコピペしたはずなのに動かないという場合, ランタイムの設定がPythonのままになっていないか確認してください。 PythonとRは違う言語なので,RのコードをPythonで動かすと普通はエラーが出ます。 (ごく稀に動くこともありますが)。 ポイントは,図 2.12 のようなipython-inputというメッセージです。 Rを動かしているのですから,pythonなどというメッセージがでるはずがありません。

図 2.12: Runtime Error

2.3.3.4 対応するカッコが抜けている

Rに限らず,プログラムでは( )という表現が多用されます。 ここで(1, 2, 3のように対応するカッコが欠けている場合, 図 2.13 のようなエラーが出ます。この場合, 図 2.14 のように対応するカッコを追加すると,エラーは消えます。 なお,( )以外に[ ]{ }も対応させないとエラーが出ます。

図 2.13: Error in parse
図 2.14: カッコを追加

2.3.3.5 定義していないオブジェクト

Rでは,さまざまな情報を「オブジェクト」5と呼ばれるものに保存して利用します。 たとえば 図 2.15 では,aに1を,bに2を保存しています (<-は何だ?など気になることもあるでしょうが,とりあえず説明は後回しで)。 ここで唐突に,dと入力するとエラーが出ます。 abは定義済みですが,dはまだ定義していないからです。 エラーメッセージにも,object 'd' not found(dが見つからない)と表示されています。

図 2.15: オブジェクトが見つからない

2.3.3.6 奥の手(AIに頼る)

ちなみにエラーが生じると,次のステップ:エラーの説明という表示が 出ることがあります。 ここをクリックするとAIがコードを分析し問題点を解説してくれます (ただし2025年1月時点では説明は英語になります)。 すべての指摘が正しいとはかぎりませんが,問題解決のヒントになることもあるので活用してください。

2.3.4 その他

Colabの基本操作は,これくらいで十分です。 あとは 図 2.7 の手順で 新しいコードセルかテキストセルを追加し, レポートにまとめていきます。

セルの上下を入れ替えたいとか, セルを削除したいといった場合は, 図 2.16 の位置にあるボタンを押すと, セルを操作することができますので試してください。

図 2.16: セルの操作

また,作成したノートブックは, Google Driveに自動保存されています。 ファイルを探したい場合は, 「マイドライブ」の中の「Colab Notebooks」を探してみてください (図 2.17 )。

図 2.17: 作成したファイルの位置

Colabの説明は,これで終わりです。 いろいろ入力してみて,操作に慣れていってください。


  1. より詳しく知りたい場合は, 社会調査の観点からRを扱った書籍[1]ウェブサイトをご覧ください。↩︎

  2. quartoと言います。↩︎

  3. 「パソコンにソフトをインストールせずに作業できる」くらいの意味です。↩︎

  4. オブジェクトをご覧ください。↩︎

  5. オブジェクトをご覧ください。↩︎