趣味の投資とプログラミング備忘録

趣味の投資と独学の「R言語」によるプログラミングを混ぜて、なぜ投資が必要なのか、メモがてら書いていきたいと思います。投資もプログラミングも初心者という方の勉強の一助となれば幸いです。

株式や投資信託が正規分布に従うのは本当か?JNJで検証してみた!(リターンは当該期間の終値比算出)

免責事項

当ブログに掲載する情報は投資勧誘を目的としたものではありません。株式などの金融商品の取引は損失を出す恐れがあります。 全て自己判断、自己責任での投資をお願いいたします。 このブログは投稿者が趣味として記載しているものであり、いかなる損失が出た場合でも責任を負うことはできません。 誤情報が入り込んだり、情報が古くなったりすることもあります。 必ずしも正確性を保証するものではありません。また合法性や安全性なども保証いたしません。 当ブログに掲載された内容によって生じた損害等の一切の責任を負いかねますので、ご了承ください。

導入

シミュレーションをする際に正規分布を仮定して正規分布から乱数を発生させているが、これは様々な文献によって、株式や投資信託などは正規分布におおむね従うためということが言われているためです。
しかし、本当に正規分布に従っているのでしょうか?
今回はそれを確認してみます。(JNJ パート2)

パート1は算出平均により算出しています。

 

パート1は↓

syumino.hatenablog.com


方法

 

米国JNJ(ジョンソンエンドジョンソン)のデータをGoogleスプレッドシートGoogle Finance関数を使って抽出。
(使用データ 1970-06-01~2021-07-30)

月末の日付と終値だけのデータを「R」で抽出してデータフレームを作成。
月末の終値から、前月比率(n=613)を算出し計算に用いる。

 

平均値、標準偏差は前月比率の値613個の当該期間の最後の月末終値/当該期間の最初の月末終値から算出し利用する。

 

 

・検証方法
1. コルモゴロフースミルノフ検定により数値的に正規性を評価する。
2. ヒストグラム、箱髭図、散布図、QQプロットの4点から視覚的に正規性、等分散性について評価する。
3. 正規分布による乱数生成(標本から平均、分散を算出する)
4. F検定により、標本分布と生成した分布の等分散性を評価する。
5. student-t検定により標本分布と生成した分布の平均の差があるかを評価する。

 

なお、有意水準は5%とするが、今回は計3回検定を行っているため多数の偽陽性(第1種の過誤)が生じるのを避けるべく、ボンフェローニ補正法により0.0167%(有意水準/検定数)を適応する。


結果

 

1. コルモゴロフースミルノフ検定

f:id:HanamoriH:20210824164939p:plain

両側検定におけるp値は0.09809 と 0.0167を超えており、帰無仮説の「正規性である」ということは棄却はできない。そのため、正規性がないとは言えない。

 

2. ヒストグラム、箱髭図、散布図、QQプロット

f:id:HanamoriH:20210824165112p:plain
ヒストグラムの形状から正規分布のようにも見える。プロットからも逸脱はあまり見られない。箱髭図から、中央値の偏りはないように見える。散布図からも、データに大きな偏りはないように見える。

 

3. 正規分布による乱数生成(標本から平均、標準偏差を算出)

f:id:HanamoriH:20210824165217p:plain

乱数生成するための分布のサンプルサイズは標本と同じにして、標本から算出した平均と標準偏から正規分布に従う乱数を発生させた結果をヒストグラムにして並べた。出現頻度、範囲、形状で似ているように見える。

 

4. F検定により、標本分布と生成した分布の等分散性を評価する。

f:id:HanamoriH:20210824165329p:plain

両側検定におけるp値は0.8654と0.0167を超えており、帰無仮説の「分散に差はない」ということは棄却はできない。そのため、等分散ではないとは言えない。

95%信頼区間においても、0.8417143 ~1.1559102 と母分散比が1をまたいでおり、差がないだろうと評価する。

 

5. student-t検定により標本分布と生成した分布の平均の差があるかを評価

f:id:HanamoriH:20210824165444p:plain

両側検定におけるp値は0.1667と0.0167を超えており、帰無仮説の「平均値に差はない」ということは棄却はできない。そのため、平均値に差がないとは否定できない。

 95%信頼区間においても、 -0.1920751~1.1114151 平均差が0をまたいでおり、差がないだろうと評価する。

考察

以上の1~5から、数値的には正規分布に従っていないとは言えないという結果、だが、視覚的には正規分布していそう、という結果だった。

そのため、生成した乱数の分布(標本から算出した平均、標準偏差正規分布)とも差があるとは言えず、正規分布に従っていると思って差し支えないと考えられる。

 

そのため、株式や投資信託のシミュレーションを行う際に、正規分布による乱数発生を用いても問題ないだろうと評価する。

 

サンプルサイズも申し分ないのではないだろうか。

 

株式でも正規分布に従うのだろうなというのがわかります。

 

今後もいくつかの株式や投資信託でも確認を行っていきたい。

検証方法に問題があればコメントくださいませ。

よろしくお願いします。

 

以上。