趣味の投資とプログラミング備忘録

趣味の投資と独学の「R言語」によるプログラミングを混ぜて、なぜ投資が必要なのか、メモがてら書いていきたいと思います。投資もプログラミングも初心者という方の勉強の一助となれば幸いです。

株式や投資信託が正規分布に従うのは本当か?GLDで検証してみた!(リターンは当該期間の終値比算出)

導入

シミュレーションをする際に正規分布を仮定して正規分布から乱数を発生させているが、これは様々な文献によって、株式や投資信託などは正規分布におおむね従うためということが言われているためです。
しかし、さて、金(ゴールド)は 正規分布に従っているのでしょうか?
今回はそれを確認してみます。

 

免責事項

当ブログに掲載する情報は投資勧誘を目的としたものではありません。株式などの金融商品の取引は損失を出す恐れがあります。 全て自己判断、自己責任での投資をお願いいたします。 このブログは投稿者が趣味として記載しているものであり、いかなる損失が出た場合でも責任を負うことはできません。 誤情報が入り込んだり、情報が古くなったりすることもあります。 必ずしも正確性を保証するものではありません。また合法性や安全性なども保証いたしません。 当ブログに掲載された内容によって生じた損害等の一切の責任を負いかねますので、ご了承ください。

 

 

 

GLDチャート

f:id:HanamoriH:20210906152904p:plain

 

方法

経費控除前で、金地金の価格の動向を反映させることを目標としている米国GLD。

GLDのデータをGoogleスプレッドシートGoogle Finance関数を使って抽出。
(使用データ 2004-11-18 ~2021-09-03 )

月末の日付と終値だけのデータを「R」で抽出してデータフレームを作成。
月末の終値から、前月比率(n=202)を算出し計算に用いる。

 

平均値、標準偏差は前月比率の値202個の当該期間の最後の月末終値/当該期間の最初の月末終値から算出し利用する。

 

 

・検証方法
1. コルモゴロフースミルノフ検定により数値的に正規性を評価する。
2. ヒストグラム、箱髭図、散布図、QQプロットの4点から視覚的に正規性、等分散性について評価する。
3. 正規分布による乱数生成(標本から平均、分散を算出する)
4. F検定により、標本分布と生成した分布の等分散性を評価する。
5. student-t検定により標本分布と生成した分布の平均の差があるかを評価する。

 

 

 

なお、有意水準は5%とするが、今回は計3回検定を行っているため多数の偽陽性(第1種の過誤)が生じるのを避けるべく、ボンフェローニ補正法により0.0167%(有意水準/検定数)を適応する。

 

結果

1. コルモゴロフースミルノフ検定

f:id:HanamoriH:20210906151917p:plain



両側検定におけるp値は0.8771 と 0.0167を超えており、帰無仮説の「正規性である」ということは棄却はできない。そのため、正規性がないとは言えない。

 

2. ヒストグラム、箱髭図、散布図、QQプロット

f:id:HanamoriH:20210906151956p:plain

ヒストグラムの形状から正規分布のようにも見える。プロットからも逸脱はあまり見られない。箱髭図から、中央値の偏りはないように見える。散布図からも、データに大きな偏りはないように見える。

 

3. 正規分布による乱数生成(標本から平均、標準偏差を算出)

f:id:HanamoriH:20210906152213p:plain乱数生成するための分布のサンプルサイズは標本と同じにして、標本から算出した平均と標準偏から正規分布に従う乱数を発生させた結果をヒストグラムにして並べた。出現頻度は異なるが、範囲や形状は似ているようにも見える。

 

4. F検定により、標本分布と生成した分布の等分散性を評価する。

f:id:HanamoriH:20210906152247p:plain

両側検定におけるp値は0.4611と0.0167を超えており、帰無仮説の「分散に差はない」ということは棄却はできない。そのため、等分散ではないとは言えない。

95%信頼区間においても、 0.8410185 ~1.4643489 と母分散比が1をまたいでおり、差がないだろうと評価する。

 


5. student-t検定により標本分布と生成した分布の平均の差があるかを評価

f:id:HanamoriH:20210906152343p:plain

両側検定におけるp値は0.7697と0.0167を超えており、帰無仮説の「平均値に差はない」ということは棄却はできない。そのため、平均値に差がないとは否定できない。

 95%信頼区間においても、 -0.8538961 ~ 1.1529438 平均差が0をまたいでおり、差がないだろうと評価する。

 

 

なお、計算した結果2004-11-18 ~2021-09-03 のGLDの平均リターンと標準偏差は以下となった。

年間平均リターンは8.238791%、年間標準偏差は17.30119

月間平均リターンは 0.661928%、月間標準偏差は4.994423

 

考察

以上の1~5から、数値的には正規分布に従っていないとは言えないという結果、だが、視覚的には正規分布していそう、という結果だった。

そのため、生成した乱数の分布(標本から算出した平均、標準偏差正規分布)とも差があるとは言えず、正規分布に従っていると思って差し支えないと考えられる。

 

そのため、GLDのシミュレーションを行う際に、正規分布による乱数発生を用いてモンテカルロシミュレーションをしても問題ないだろうと評価する。

 

ただし少し足りないか?サンプルサイズ370~380くらい?ほしいところだったが、現状データがないので今回は保留にする。

 

今後もいくつかの株式や投資信託でも確認を行っていきたい。

検証方法に問題があればコメントくださいませ。

よろしくお願いします。

 

以上。