Submit Search
Upload
Tokyo r94 beginnerssession3
•
1 like
•
772 views
K
kotora_0507
Follow
TokyoR#94の初心者セッション3の資料です
Read less
Read more
Technology
Report
Share
Report
Share
1 of 33
Download now
Download to read offline
Recommended
ゲームのモデリング
ゲームのモデリング
Keiko Mizuno
ベイズモデリングと仲良くするために
ベイズモデリングと仲良くするために
Shushi Namba
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
shima o
RStanとShinyStanによるベイズ統計モデリング入門
RStanとShinyStanによるベイズ統計モデリング入門
Masaki Tsuda
機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計
Takahiro Kubo
[Track4-3] AI・ディープラーニングを駆使して、「G検定合格者アンケートのフリーコメント欄」を分析してみた
[Track4-3] AI・ディープラーニングを駆使して、「G検定合格者アンケートのフリーコメント欄」を分析してみた
Deep Learning Lab(ディープラーニング・ラボ)
不均衡データのクラス分類
不均衡データのクラス分類
Shintaro Fukushima
DAUを評価指標から捨てた会社の話 #tokyowebmining
DAUを評価指標から捨てた会社の話 #tokyowebmining
Tokoroten Nakayama
Recommended
ゲームのモデリング
ゲームのモデリング
Keiko Mizuno
ベイズモデリングと仲良くするために
ベイズモデリングと仲良くするために
Shushi Namba
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
shima o
RStanとShinyStanによるベイズ統計モデリング入門
RStanとShinyStanによるベイズ統計モデリング入門
Masaki Tsuda
機械学習で泣かないためのコード設計
機械学習で泣かないためのコード設計
Takahiro Kubo
[Track4-3] AI・ディープラーニングを駆使して、「G検定合格者アンケートのフリーコメント欄」を分析してみた
[Track4-3] AI・ディープラーニングを駆使して、「G検定合格者アンケートのフリーコメント欄」を分析してみた
Deep Learning Lab(ディープラーニング・ラボ)
不均衡データのクラス分類
不均衡データのクラス分類
Shintaro Fukushima
DAUを評価指標から捨てた会社の話 #tokyowebmining
DAUを評価指標から捨てた会社の話 #tokyowebmining
Tokoroten Nakayama
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
Hiroyuki Masuda
ベイズファクターとモデル選択
ベイズファクターとモデル選択
kazutantan
Rustに触れて私のPythonはどう変わったか
Rustに触れて私のPythonはどう変わったか
ShunsukeNakamura17
SPADE :Semantic Image Synthesis with Spatially-Adaptive Normalization
SPADE :Semantic Image Synthesis with Spatially-Adaptive Normalization
Tenki Lee
学位論文の書き方メモ (Tips for writing thesis)
学位論文の書き方メモ (Tips for writing thesis)
Nobuyuki Umetani
Chapter7 回帰分析の悩みどころ
Chapter7 回帰分析の悩みどころ
itoyan110
TokyoR101_BeginnersSession2.pdf
TokyoR101_BeginnersSession2.pdf
kotora_0507
Learning Process-Based Therapy_Chapter 1 (Book Club Japan).pdf
Learning Process-Based Therapy_Chapter 1 (Book Club Japan).pdf
Jun Kashihara
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
takehikoihayashi
20181130 lidar object detection survey
20181130 lidar object detection survey
Takuya Minagawa
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
Preferred Networks
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII
プログラミング言語のマスコットとか紹介
プログラミング言語のマスコットとか紹介
Takaaki Hirano
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Preferred Networks
[DL輪読会]Diffusion-based Voice Conversion with Fast Maximum Likelihood Samplin...
[DL輪読会]Diffusion-based Voice Conversion with Fast Maximum Likelihood Samplin...
Deep Learning JP
さらば!データサイエンティスト
さらば!データサイエンティスト
Shohei Hido
MICの解説
MICの解説
logics-of-blue
時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17
horihorio
⼤企業で実現するイマドキの内製開発
⼤企業で実現するイマドキの内製開発
NTT Communications Technology Development
Positive-Unlabeled Learning with Non-Negative Risk Estimator
Positive-Unlabeled Learning with Non-Negative Risk Estimator
Kiryo Ryuichi
Tokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's Rule
Hiroki Matsui
Tokyo r80 beginnerssession1
Tokyo r80 beginnerssession1
kotora_0507
More Related Content
What's hot
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
Hiroyuki Masuda
ベイズファクターとモデル選択
ベイズファクターとモデル選択
kazutantan
Rustに触れて私のPythonはどう変わったか
Rustに触れて私のPythonはどう変わったか
ShunsukeNakamura17
SPADE :Semantic Image Synthesis with Spatially-Adaptive Normalization
SPADE :Semantic Image Synthesis with Spatially-Adaptive Normalization
Tenki Lee
学位論文の書き方メモ (Tips for writing thesis)
学位論文の書き方メモ (Tips for writing thesis)
Nobuyuki Umetani
Chapter7 回帰分析の悩みどころ
Chapter7 回帰分析の悩みどころ
itoyan110
TokyoR101_BeginnersSession2.pdf
TokyoR101_BeginnersSession2.pdf
kotora_0507
Learning Process-Based Therapy_Chapter 1 (Book Club Japan).pdf
Learning Process-Based Therapy_Chapter 1 (Book Club Japan).pdf
Jun Kashihara
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
takehikoihayashi
20181130 lidar object detection survey
20181130 lidar object detection survey
Takuya Minagawa
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
Preferred Networks
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII
プログラミング言語のマスコットとか紹介
プログラミング言語のマスコットとか紹介
Takaaki Hirano
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Preferred Networks
[DL輪読会]Diffusion-based Voice Conversion with Fast Maximum Likelihood Samplin...
[DL輪読会]Diffusion-based Voice Conversion with Fast Maximum Likelihood Samplin...
Deep Learning JP
さらば!データサイエンティスト
さらば!データサイエンティスト
Shohei Hido
MICの解説
MICの解説
logics-of-blue
時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17
horihorio
⼤企業で実現するイマドキの内製開発
⼤企業で実現するイマドキの内製開発
NTT Communications Technology Development
Positive-Unlabeled Learning with Non-Negative Risk Estimator
Positive-Unlabeled Learning with Non-Negative Risk Estimator
Kiryo Ryuichi
What's hot
(20)
失敗から学ぶ機械学習応用
失敗から学ぶ機械学習応用
ベイズファクターとモデル選択
ベイズファクターとモデル選択
Rustに触れて私のPythonはどう変わったか
Rustに触れて私のPythonはどう変わったか
SPADE :Semantic Image Synthesis with Spatially-Adaptive Normalization
SPADE :Semantic Image Synthesis with Spatially-Adaptive Normalization
学位論文の書き方メモ (Tips for writing thesis)
学位論文の書き方メモ (Tips for writing thesis)
Chapter7 回帰分析の悩みどころ
Chapter7 回帰分析の悩みどころ
TokyoR101_BeginnersSession2.pdf
TokyoR101_BeginnersSession2.pdf
Learning Process-Based Therapy_Chapter 1 (Book Club Japan).pdf
Learning Process-Based Therapy_Chapter 1 (Book Club Japan).pdf
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
20181130 lidar object detection survey
20181130 lidar object detection survey
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
プログラミング言語のマスコットとか紹介
プログラミング言語のマスコットとか紹介
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
[DL輪読会]Diffusion-based Voice Conversion with Fast Maximum Likelihood Samplin...
[DL輪読会]Diffusion-based Voice Conversion with Fast Maximum Likelihood Samplin...
さらば!データサイエンティスト
さらば!データサイエンティスト
MICの解説
MICの解説
時系列解析の使い方 - TokyoWebMining #17
時系列解析の使い方 - TokyoWebMining #17
⼤企業で実現するイマドキの内製開発
⼤企業で実現するイマドキの内製開発
Positive-Unlabeled Learning with Non-Negative Risk Estimator
Positive-Unlabeled Learning with Non-Negative Risk Estimator
Similar to Tokyo r94 beginnerssession3
Tokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's Rule
Hiroki Matsui
Tokyo r80 beginnerssession1
Tokyo r80 beginnerssession1
kotora_0507
重回帰分析で頑張る
重回帰分析で頑張る
Shota Yasui
TokyoR79 beginnerssession1
TokyoR79 beginnerssession1
kotora_0507
統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践
id774
TokyoR101_BeginnersSession1.pdf
TokyoR101_BeginnersSession1.pdf
kotora_0507
TokyoR102_BeginnersSession.pdf
TokyoR102_BeginnersSession.pdf
kotora_0507
第1回 Jubatusハンズオン
第1回 Jubatusハンズオン
JubatusOfficial
第1回 Jubatusハンズオン
第1回 Jubatusハンズオン
Yuya Unno
Big data解析ビジネス
Big data解析ビジネス
Mie Mori
数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro
数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro
Jiro Iwanaga
機械学習を使った時系列売上予測
機械学習を使った時系列売上予測
DataRobotJP
C++0x concept
C++0x concept
Akira Takahashi
BotとWikiを使った試験的な並列プログラミング
BotとWikiを使った試験的な並列プログラミング
Takashi Yamanoue
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
Tatsuya Tojima
Pythonと型チェッカー
Pythonと型チェッカー
Tetsuya Morimoto
Hadoopカンファレンス20140707
Hadoopカンファレンス20140707
Recruit Technologies
Similar to Tokyo r94 beginnerssession3
(17)
Tokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's Rule
Tokyo r80 beginnerssession1
Tokyo r80 beginnerssession1
重回帰分析で頑張る
重回帰分析で頑張る
TokyoR79 beginnerssession1
TokyoR79 beginnerssession1
統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践
TokyoR101_BeginnersSession1.pdf
TokyoR101_BeginnersSession1.pdf
TokyoR102_BeginnersSession.pdf
TokyoR102_BeginnersSession.pdf
第1回 Jubatusハンズオン
第1回 Jubatusハンズオン
第1回 Jubatusハンズオン
第1回 Jubatusハンズオン
Big data解析ビジネス
Big data解析ビジネス
数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro
数理モデリングからはじめるPython数理最適化 PyData.Tokyo 2017/6/28 Retty Inc. Iwanaga Jiro
機械学習を使った時系列売上予測
機械学習を使った時系列売上予測
C++0x concept
C++0x concept
BotとWikiを使った試験的な並列プログラミング
BotとWikiを使った試験的な並列プログラミング
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
Tokyo.R 41 サポートベクターマシンで眼鏡っ娘分類システム構築
Pythonと型チェッカー
Pythonと型チェッカー
Hadoopカンファレンス20140707
Hadoopカンファレンス20140707
More from kotora_0507
TokyoR98_BeginnersSession1.pdf
TokyoR98_BeginnersSession1.pdf
kotora_0507
Sendai r01 beginnerssession1
Sendai r01 beginnerssession1
kotora_0507
Beginners session2 in TokyoR69
Beginners session2 in TokyoR69
kotora_0507
Beginners session2 68
Beginners session2 68
kotora_0507
Tokyo rの運営方針 2017
Tokyo rの運営方針 2017
kotora_0507
TokyoR58 初心者セッション
TokyoR58 初心者セッション
kotora_0507
TokyoR #57 初心者セッション
TokyoR #57 初心者セッション
kotora_0507
TokyoR#53初心者セッション
TokyoR#53初心者セッション
kotora_0507
More from kotora_0507
(8)
TokyoR98_BeginnersSession1.pdf
TokyoR98_BeginnersSession1.pdf
Sendai r01 beginnerssession1
Sendai r01 beginnerssession1
Beginners session2 in TokyoR69
Beginners session2 in TokyoR69
Beginners session2 68
Beginners session2 68
Tokyo rの運営方針 2017
Tokyo rの運営方針 2017
TokyoR58 初心者セッション
TokyoR58 初心者セッション
TokyoR #57 初心者セッション
TokyoR #57 初心者セッション
TokyoR#53初心者セッション
TokyoR#53初心者セッション
Recently uploaded
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
Hiroshi Tomioka
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
FumieNakayama
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
Yuki Kikuchi
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
博三 太田
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
sugiuralab
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
akihisamiyanaga1
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
FumieNakayama
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
UEHARA, Tetsutaro
Recently uploaded
(9)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
Tokyo r94 beginnerssession3
1.
初心者セッション3 - Introduction to
rstan - Tokyo.R #94 @kotatyamtema 1
2.
自己紹介 TwitterID : @kotatyamtema 大学での専門:
行動生態学 立案 捕獲 実験 分析までワンオペ 今まで : 客先ぼっち分析屋→アパレル通販会社 現在 : 医療検査会社 R歴 : 10年過ぎたかも?永遠の初心者 近況 : 相変わらず令和ちゃんの季節変化が雑すぎて つらいです… くれぐれも体調に気をつけましょう
3.
目的 rstanとは何か rstanの基本的な使い方が 分かるようになる
4.
0. 事前準備 - projectの作成、パッケージのインストール、データハンドリング 0.
今回使用するデータとモデル 1. stanとは/rstanとは 2. rとstanの関係 3. 必要なファイル 4. stanファイルの書き方 5. MCMCの設定方法 6. MCMCの結果と評価 7. 参考資料 MENU
5.
project1 .Rmd project2 setwd() project3 setwd() setwd() .Rmd .Rmd 事前準備 -projectの作成 Rのprojectとは: デ ィレクトリとの紐付け(WD)、R環境などをまとめる仕組み →projectを設定することで解析環境の切り替えが容易に →複数の解析を同時に実行していると非常に便利
6.
新しいフォルダを作ってWDにする 今あるフォルダをWDにする 右上にあるProjectをクリック →New Projectを選択 事前準備 -projectの作成
7.
新しいフォルダを作ってWDにする 今あるフォルダをWDにする WDにするフォルダを選択 WDの名前(project名) WDを置くフォルダを選択 ✔ ✔ projectで指定したWDに [project名.Rproj]という ファイルができていれば 設定完了 事前準備 -projectの作成
8.
事前準備 -パッケージのインストール 今回必要なパッケージ palmerpengunins, dplyr,
ggplot2, rstan, bayesplot, shinystan 依存パッケージごとインストールする
9.
dplyrパッケージとは data.frameのデータ処理を扱うためのpackage ・特徴 - 関数を%>%でつないで実行していく - 書いた順に実行される -
考えた通りに書けるのでストレスが減る - 他のdata.frameを扱うpackage(tidyrとか)の関数に シームレスに渡せる - 集計後に横持ちに変換して欠損を0埋めしてもう 一度縦持ちに戻すなんて処理がいっぺんにできる 事前準備 -データハンドリング 今回データハンドリングに使用するパッケージはdplyrパッケージ
10.
dplyr:基本機能 関数 select filter mutate group_by summarise join系 arrange 動作 列の選択 条件による行の抽出 列の追加 条件による行のグループ化 行の集約 data.frame同士の結合 行の並べ替え 今回データハンドリングに使用するパッケージはdplyrパッケージ 事前準備 -データハンドリング 詳細は別途公式HPや専門書など
11.
今回使用するデータとモデル 今回使用するデータはpolmerpenguinsパッケージに入っている penguins データ https://allisonhorst.github.io/palmerpenguins/
12.
今回使用するデータとモデル penguins データからジェンツーペンギン(Gentoo)のデータのみ 抽出して体重とフリッパーの長さの単回帰モデルを作成する
13.
今回使用するデータとモデル glmで作成した体重とフリッパーの長さの単回帰モデル flipper_length_mm ∼ 0.009*body_mass_g
+ 171.3 # Gentooのデータのみ抽出 # 欠損値(NA)を除外する GentooData <- penguins %>% filter(species == "Gentoo") %>% filter(!is.na(flipper_length_mm) & !is.na(body_mass_g))
14.
stanとは/rstanとは stanとは MCMCサンプリングの実行に特化したプログラム 単体でも色々可能だが今回はMCMCサンプリングのみ使用 rstanとは Rとstanをつなげるためのラッパーパッケージ stanの実行条件を指定して実行 またstanの出力結果を見やすくするための関数多数
15.
rとstanの関係 町工場の分業体制 R データ加工、可視化 stan MCMCサンプリング rstan データと設定 サンプリング結果
16.
必要なファイル 今回必要なファイルは2種類 1. データの前処理やサンプリング設定を書いたR/Rmdファイル 2. stanが実行するモデルの設定を書いたstanファイル -
今回は penguin_glm.stan というファイルを作成 - stanファイルはRStudioで作成可能 - 文法チェック機能あり:Check on Save(ただしちょっと重い)
17.
stanへのデータの渡し方 stanにはリストにしたデータを渡す - stanファイルに記載するデータ名を要素名にしてリスト化 - stanは欠測値を受け付けないので除外しておく stanファイルではlistの要素名を使って書く -
混乱しない、間違いにくいことが大事 GentooData_list <- list( N = NROW(GentooData), #サンプルサイズ flipper_length = GentooData$flipper_length_mm, #フリッパーの長さ body_mass = GentooData$body_mass_g #体重 )
18.
stanファイルの書き方 1. stanに渡す設定はブロックごとに分けて書く ブロックの構成(7ブロック) functions /
data / transformed data / parameters / transformed parameters / model /generated quantities - 必須はmodelのみ - ブロックの順番は変更不可 - 今回使うのは data / parameters / model 2. ブロックは中括弧で囲む 3. 行の最後には必ずセミコロンをつける 4. コメントアウトは//(スラッシュ2本) 5. ファイルの最終行には必ず空白を入れる
19.
stanファイルの書き方 dataブロック サンプルサイズとデータを指定 - データ型と名前を指定、一部のデータ型ではサンプルサイズを明 記する - int
N; Nは整数である(int:整数型) - vector[N] flipper_length; flipper_lengthはN個のベクトル - vector[N] body_mass; body_massはN個のベクトル data { int N; // サンプルサイズ vector[N] flipper_length; // フリッパーの長さ vector[N] body_mass; // 体重 }
20.
stanファイルの書き方 parametersブロック モデルで推定するパラメータの指定 今回のモデル:flipper_length = beta
* body_mass + Intercept flipper_length[i] Normal(mu[i], sigma) mu[i] = beta * body_mass[i] + Intercept 推定すべきパラメータは beta, Intercept, sigma - 今回はすべてのパラメータがreal(実数) - 標準偏差であるsigmaのみ絶対0以上になるため<lower=0>の 条件を追加 parameters { real Intercept; // 切片 real beta; // 係数 real<lower=0> sigma; // 標準偏差
21.
stanファイルの書き方 modelブロック 観測値の分布を指定 今回のモデル:flipper_length = beta
* body_mass + Intercept flipper_length[i] Normal(mu[i], sigma) mu[i] = beta * body_mass[i] + Intercept flipper_length[i] Normal(beta*body_mass[i]+Intercept, sigma) → fliiper_lengthは平均(Intercept + beta*body_mass)と標準偏差 (sigma)の正規分布に従う model { for (i in 1:N) { flipper_length[i] normal(Intercept + beta*body_mass[i], sigma); } }
22.
MCMCの設定と実行 stan関数で指定するMCMCの設定 今回設定する引数 - file, data,
seed, chains, iter, warmup, thinの7つ Gentoo_stan_result <- stan( file = penguin_glm.stan", # モデルを記載したstanファイルへのパス data = GentooData_list, # stanに渡すデータリスト seed = 71, # 乱数シード chains = 4, # 乱数生成のセット数 iter = 3000, # 1セットの乱数生成の繰り返し数 warmup = 1000, # 初期生成乱数の切り捨て期間 thin = 1 # 間引き(1だと間引きなし) # 大きくすることで自己相関を緩和する )
23.
MCMCの結果と評価 MCMCの結果で評価しないといけないこと ・MCMCの有効サンプルサイズが十分かどうか - あまりにも少ない(参照100以下)場合は改良が必要
24.
MCMCの結果で評価しないといけないこと ・サンプリング結果が収束しているか - すべてのパラメータのRhatが1.1未満かどうか MCMCの結果と評価
25.
MCMCの結果と評価 MCMCの結果で評価しないといけないこと ・サンプリング結果が収束しているか - トレースプロットを作成、すべてチェーンが同じようなトレース になっていることを確認 - bayesplot:mcmc_combo関数で事後分布とトレースプロットが 同時に確認できる #
stanの結果からMCMCサンプルを抽出 Gentoo_stan_sample1 <- rstan::extract(Gentoo_stan_result, permuted = FALSE) # パラメータ(Intercept, beta, sigma)を指定してトレースプロットを作成 mcmc_combo(Gentoo_stan_sample1, pars = c("Intercept", "beta", "sigma"))
26.
MCMCの結果と評価 MCMCの結果で評価しないといけないこと ・サンプリング結果が収束しているか
27.
MCMCの結果と評価 自己相関が十分低いか - bayesplot:mcmc_acf_barで可視化できる - Lagが0に集まっているほど良い
28.
モデルの収束確認完了
29.
目標 flipper_length_mm ∼ 0.009*body_mass_g
+ 171.3 推定結果 flipper_length[i] Normal(0.009*body_mass[i]+171.3, 4.68) MCMCの結果と評価
30.
妥当なモデルの推定 成功 千里の道も一歩から 複雑なモデルの作成も 簡単なモデルから
31.
MCMCの結果と評価 もっとビジュアライズされた結果の評価ツール shinyrstanパッケージ 参照サイト:RStanとShinyStanによるベイズ統計モデリング入門 https://www.slideshare.net/masakitsuda940/rstanshinystan
32.
本 StanとRでベイズ統計モデリング (Wonderful R) 松浦
健太郎 、 石田 基広 実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリン グによるデータ分析入門 馬場 真哉 slideshare RStanとShinyStanによるベイズ統計モデリング入門 Stan超初心者入門 blog Kosugitti s BLOG アンドロイドは正規分布の夢を見るか Logic of Blue 参考資料
33.
ENJOY!
Download now