web系[欲しいものを自分で作る]模索の日々

javascriptとかphpとか使って色々作って行きます。触ったことのある言語は、C, C++, Java, python, Ruby, Processing

Excelだけでデータ分析してるひとに”R”を勧めたい

データ分析スキルにもうワンポイント欲しいと思った

 最近、転職活動をしてたんですけれども、職務経験から何度かデータアナリストをしてみないかとお誘いがありました。
早速、データ分析経験とかスキルとかまとめて話に行ったところ、自分でデータをHiveQLのクエリ叩いて取ってきて分析してましたー、ってところくらいまではウケがいいのですが、そのデータをExcelで分析してました、っていうとどうも反応よくないなぁという印象がありました。

まぁ、確かにExcelでデータ分析してましたというピンキリなわけでちょっと採用担当としてイメージが湧きにくいようです。
個人的にはExcelじゃできないような高難易度な分析が必要な場面とかはそこまで多くないんじゃないかなぁとも思いますが、会社によっては何々という分析ツールが使える人だけがデータアナリストをやってる、みたいなものが必要な場合もあるような気がしました。


 というわけで、自分も採用をうならせる分析ツールを使えるようにしておこうかなぁ、なんて妄想をしていたら、大学時代にちょっと使っていたRを思い出しました。
早速、今の業務でR使うならどんな感じになるかと思って使ってみたところ、Excelとは違う便利な点が様々あって、併用するとなかなか成果あがりそう、なんて気がしました。
以下、ExcelにはないRの良さを少しまとめようと思います。


Rのいいところ

CSVのまま作業が進められる

 抽出してきたデータはCSVとかいうこと、よくあると思うんです。ExcelだとCSVでデータ落としてきたら開いて元々の分析用のBookにコピーして整形して、テーブルにして、色調整して、列タイトル変えて、、、、と何かと準備に時間かかると思うんですね。
RならCSV落として、同じディレクトリに保存しちゃえばコマンド一つで読み込んであとは自在に使えます。

データの合計とか平均とか諸々の基本計算を1行のコードでまとめてやってくれる

 summary関数というものがあってこれで1行コードを書くと、平均値、中央値、最大値、最小値などをまとめて表示してくれます。

グラフの描画も楽

 plot関数でとりあえずグラフを表示してくれる。
このとりあえずのグラフがまた優秀でシンプルでみやすいんですよ!
Excelだとデータの量とか表の形式によっては見た目の調整が必要なシーン多くて作業が増えることも多々ありますが、Rならあまり気にせずできます。

無料!そしてmacにもwindowsにも対応

 家のPCに有料のOfficeがなくてもRをメインにしていれば勉強も仕事の続きもできます。


ということでExcelもいいけどRも使ってみたらいいんじゃない?って人はこんな人!

  • 取ってきたデータの状態を手っ取り早く知りたい人
  • データ1つ1つの値よりもデータトレンドや異常値に関してチェックが必要な人
  • Excelの他にもデータ分析ツール使ってみたいという人
次回からは実際に使い方とか紹介していこうと思います

Mac
R for Mac OS X

Windows
Download R-3.2.2 for Windows. The R-project for statistical computing.

みんなのR -データ分析と統計解析の新しい教科書-

みんなのR -データ分析と統計解析の新しい教科書-