応用統計学フロンティアセミナー「データサイエンスと応用統計学」参加記録
10/19に開催された応用統計学フロンティアセミナーに参加してきましたので、そのメモを共有しておきます。話を聴きながらのメモなので単語しか書けず意味がわかりにくいところもありますが、ご参考まで。なおセミナーの様子は以下のtogetterでまとめられていますので、そちらも合わせてご覧ください。
- データサイエンスにおける応用統計人材の育成
- 楽天技術研究所におけるデータサイエンスおよび統計の様々な応用事例
- 自動車とデータサイエンス
- 企業ビッグデータから捉える企業活動と未来の活用可能性
- 早稲田大学におけるデータサイエンス人材育成への取り組み
- 学校における「統計」教育の課題 我々は木に縁りて魚を求めてはいないか
- 岩崎先生あいさつ
データサイエンスにおける応用統計人材の育成
横浜市立大学 岩崎学 氏
これまでとこれからの統計的データ解析
- 研究目的の設定
- データ収集法の立案(実験、観察、調査)
- データの収集(モニタリング)
- データの電子化
- データのチェック・マージ
- データの集計とグラフ化(記述統計)
- 統計的推測ないしは予測(推測統計)
- プレゼン・文章化、意思決定(終了もしくは最初に戻る) → 役に立たないと意味がない
いまのデータサイエンス、データありきになっているかもしれない
- 推測統計の部分にフォーカスが当たっている
- 全体の流れを見ることが大事
データサイエンスとは?
横浜市立大学での状況
- 線形代数の学部生の試験成績、文系と理系でほとんど差がない(120点満点で76 vs 72とか)
- 2020年、大学院
- ヘルスデータサイエンス専攻(医学部があるので)
- データサイエンス専攻(M20名、D3名)
楽天技術研究所におけるデータサイエンスおよび統計の様々な応用事例
楽天 森正弥 氏
1.3Bユーザー、48Kの店舗(ビジネスパートナー)
250Mのアイテムについて需要予測
- 価格、在庫の調整
- 非線形回帰。基盤を作ったロシア人が手作業でフィッティング。DLに勝つ。
金融市場予測
- Now-Cast
- Forecastに対してNowcast
- 今の状態を推測する
- Hal Varian
- Bayesian variable selection for nowcasting economic time series
- https://www.nber.org/chapters/c12995
- 独自の景気動向指数
- 会社の株価
- 売上と株価、2ヶ月のラグ
- 相関が0.96
- でも予測精度は芳しくない
- 化粧品会社の株価
- 多段のDoc2Vecでメーカー名のリンキング
- 楽天トラベルのデータ、インバウンド
- Now-Cast
自動車とデータサイエンス
日産自動車 上田哲郎 氏
- Connected Carのエキスパート、ITのエキスパート
- 自動車、AI/ITに関しては新卒の人たちの方が専門性高い
- 今はリアルタイムで車の車種まで特定できる
- BigData、 AI、IoT
- 箱根登って下るとバッテリー回復するので沼津まで行ける
- シミュレーションではなく過去のリーフのデータから、どこまで行けるか示せる
- ProPilot 2.0
- マジでやばい
- ハンドルから手を離して良いと言っている(高速に限る)
- ドライバーを監視している、前方を見ている限り
- Adaptive Cruise Control
- 単眼可視光カメラで前方の車との距離を測る
- ナンバープレートのサイズがわかっているのでカメラの画素数から車間距離がわかる
- AI
- オイルフィルターの真贋判定
- 空気抵抗を計算で求める
- スパコンでも数日かかる
- CADとCdの関係性
- Voxel dataとCdの関係性を学習
- 精度はまだまだ
- R値で0.7(R2のこと?)
- GANで車のデザインを生成
- 画像の生成を三次元に拡張する
- データアナリスト
- 問題のモデル化
- 人材育成
- 自動車業界、サプライヤーが持ってくる
- うまくいってない
- データを使っていて車に興味を持っている人に来てもらいたい
- 自動車がなくなっていく?
- MaaS、CASE
- 痛し痒しと思っている
- 体力のあるうちに全部やっておこう
企業ビッグデータから捉える企業活動と未来の活用可能性
帝国データバンク 中川みゆき 氏
- 帝国データバンクの保有するデータ
- 調査員が現地に足を運んで入手した、ネットでは得られないデータベース
- 100近い項目
- 定量、定性
- 中小企業が99%
- 年間60万件超の調査
- 活用事例
- 守りの活用
- 信用リスク
- 攻めの活用
- 取引関係からつながりを見る
- バリューチェーン全体のマッピング
- データはファクト、データサイエンスとは価値を創り出すこと
- 人間が本来もつ、マシンではできないことに注力
- 「未来の力」はマシンインテリジェンスに対してのリーダーシップ
- 人がやる部分
- 内訳
- 複雑な問題解決
- クリティカルシンキング
- 想像力
- マネジメント
- 人間関係調整
- 情緒的知性
- 決断
- サービスディレクション
- 交渉力
- 認識の柔軟性
- 守りの活用
早稲田大学におけるデータサイエンス人材育成への取り組み
早稲田大学 松嶋敏泰 氏
- 大隈重信と統計学
- 統計院を設立
- 統計センターの前身
- 統計院を設立
- DSとは
- Interdisciplinary Field
- concept to unify
- 日本だとSexiest Jobで広まったので、ビジネスの面が強い
- Fourth paradigm of science
- メタサイエンス
- 知覚と思考の拡大
- 早稲田のフォーカス領域
- 専門性(応用先)
- データサイエンス
- 教育
学校における「統計」教育の課題 我々は木に縁りて魚を求めてはいないか
代々木ゼミナール 西岡康夫 氏
- 初等・中等教育の現状
- サッカー、世界で活躍できるようになった理由は多くの子供がサッカーをやるようになったから
- 棟梁レベルのDSを多く育てるなら裾野を広げないといけない
- 国によってはエリート制を採用しているが、日本のカルチャーに合わないのでは
- 教育改革
- センター試験の廃止
- 混沌の極み
- 大学入学選抜は暗記、再生
- ドーリットル、甚兵衛、小ピピン
- 理系尚もて数学す、況や文系をや
- 統計が入ってきた
- 産業界の要請
- 教員研修や教職課程のカリキュラム改革
- まったく進んでない
- 統計のイロハのイもダメ
- 教員研修や教職課程のカリキュラム改革
- 産業界の要請
- 若者の強い自己否定感
- センター試験の廃止
岩崎先生あいさつ
- Technologyは変わっていくがPrincipleは変わらない