統計コンサルの議事メモ

統計や機械学習の話題を中心に、思うがままに

人工知能って何ですか

今日、ニュースを見ていたらこんな記事がありました。

人工知能が株式市場で存在感、学識者驚く的中率68%-将来8割可能も - Bloomberg

株式の将来予測に人工知能を用いることで上昇/下降を精度よく的中させることが可能であるとのことです。私は投資家ではないので的中率68%というのがどれほど凄いことであるかはわかりませんが、どうやらかなりのパフォーマンスであるとのこと。羨ましいですね。

続きを読む

Mac Book Airを買いました

こんにちは、ushi-goroshiです。
先日は冬とは思えないぐらいに暖かい日があり、春を感じる今日この頃です。

突然ですが、Macデビューを果たしました。
Mac Book Airを買いました。

これまでずっと何をやるにも会社貸与のPCを使用していたのですが、Windows環境だとやりにくいことが色々あったりします(例えばGoogleのTensorFlowはWindows用にはリリースされていなかったり)。
なのでずっとLinux環境を作りたいと思っていて、以下の方法を考えてみました。

結果としてはいずれも❌で、VMのインストールは認められておらず、Mac版の貸与PCはありませんでした。
AWSはイケるか?と思ったのですが、Linuxインスタンスに接続するためのPuTTYのインストール申請が通らないようです。

というわけで自前でデバイスを用意せざるを得ず、SurfaceMBAを悩んだ結果、どうせなら一度触ってみようということでMacデビューを果たしたという流れです。
無事にTensorFlowをインストールすることもできましたので、これから色々触ってみようと思います。

無作為抽出と無作為割り当て

こんにちは、ushi-goroshiです。
今日は(も)統計のお話。


有名なオンライン講座のcourseraでは統計学の講義もいくつかあります。
そのうちの一つ、Duke Universityの「Data Analysis and Statistical Inference」はRを使いながら統計の勉強ができる非常に親切な講義ですが、先日、この講義を見ていた際に無作為抽出と無作為割当の話がありました。
非常に大事な話なので、当ブログ本来の目的でもある備忘録として整理しておきます。

続きを読む

SAS + R

ushi-goroshiです。
あけましておめでとうございます。


最近知ってとても衝撃だったのですが、統計解析ソフトとして有名なSASがなんと無料で使えます。

  • SAS University Edition

無償の統計ソフトウェア SAS University Edition | SAS

  • インストールなどを解説したページ

NIBLOG: 無料で SAS を使ってみよう


PCにVMware/Virtual Boxをインストール可能であれば今日からSASを利用することが可能です。もちろん商用利用不可ですが、SASを学べる環境はなかなか準備できないのでこの機会に是非触ってみてはいかがでしょう。なんせタダ!

最近SASはRのスクリプトを呼び出すProc Rというプロシジャが出来たそうなので、SASであらかた処理してしまい、手が届かない部分をRで処理するのが良いかもしれません。


余談ですが、最近はRと連携可能なソフトウェアが増えてきていますね。
しかしRは分析結果を「リスト」と呼ばれる形式で返したがる(これが便利なんです)ので、そういった正規化されていないデータを各ソフトウェアがどのように処理しているのか、大変気になります。
必要な情報だけを吸い出しているのだろうと想像はつくのですが、それだと汎用性に欠け、「Rと連携している」と言えるのかな、と。


「Rと連携できる!」という謳い文句は、要注意です。

21世紀の相関係数

こんにちは、ushi-goroshiです。


相関係数と言えばPearsonの積率相関係数(Excelの関数ではCorrel)が有名ですが、この値は2つの変数間の「直線的関係」しか見れないため、数値をそのまま信用すると痛い目にあったりします(非線形の関係を見逃してしまうので)。

続きを読む

IBMが機械学習用のライブラリSystemMLをOSS化

こんばんは、ushi-goroshiです。
12月に入るとあっという間にクリスマスな雰囲気ですね。今年のプレゼントは何にしようか。。。


さてタイトル。
先日のGoogleに続き、今度はIBM機械学習のライブラリ(SystemML)をOSS化するそうです。

japan.zdnet.com

このSystemMLというライブラリは聞いたことがなかったのですが、少し調べた限りではSparkのMLlibで競合するとのことでした。
そこでもう少し調べたところ、SystemMLのリファレンスが。

SystemML Algorithms Reference - SystemML 0.8.0

一方、Spark MLlibはと言うと。

MLlib | Apache Spark

うーん、似ている・・・ような。


ところでこのSystemMLは先日のTensorFlowと異なりディープラーニング用というわけではないようで、上記のリファレンスを見る限りニューラルネットに対応していないようです。
ではIBMニューラルネットを開発するものはと言うと、System Gというのがあるようです。

IBM System G | Neural Network Toolkit


ところで、他社と比較するとAppleの動きが遅いように思うのですが、いずれ動きがあるんでしょうか。

Googleが人工知能ライブラリTensorFlowをオープンソース化

こんにちは、ushi-goroshiです。
少しずつ寒さが増しており、夜、帰宅すると眼鏡が曇る日々がやってきました。


さてタイトル。
GoogleがTensorFlowという人工知能ライブラリをオープンソースで解放したというニュースが流れていました。
しかも商用利用可!ということで、多くの企業が関心を持ちそうです。

japanese.engadget.com


Mac/Linux環境があればインストール ~ テストは簡単にできるようで、「試してみた!」的な記事がいくつか出ていますね。
私の勤務先はWindows環境しかなく、しかもVM系のソフトのインストールは禁止なのでなかなか試せませんが、これは気になります。

TensorFlowもそうですが、Theanoやchainerなどのディープラーニングのフレームワーク/ライブラリはWindows環境だとインストールで躓くことが多いので、ぜひLinux環境を用意してほしいと切に願う今日この頃です。
せめてMacを用意してくれれば。。。



参考:
http://googledevjp.blogspot.jp/2015/11/tensorflow-google.html
http://www.wired.com/2015/11/google-open-sources-its-artificial-intelligence-engine/