趣味の投資とプログラミング備忘録

趣味の投資と独学の「R言語」によるプログラミングを混ぜて、なぜ投資が必要なのか、メモがてら書いていきたいと思います。投資もプログラミングも初心者という方の勉強の一助となれば幸いです。

株式や投資信託が正規分布に従うのは本当か?セゾン資産形成の達人ファンドで検証してみた!(リターンは当該期間の終値比算出)

免責事項

当ブログに掲載する情報は投資勧誘を目的としたものではありません。株式などの金融商品の取引は損失を出す恐れがあります。 全て自己判断、自己責任での投資をお願いいたします。 このブログは投稿者が趣味として記載しているものであり、いかなる損失が出た場合でも責任を負うことはできません。 誤情報が入り込んだり、情報が古くなったりすることもあります。 必ずしも正確性を保証するものではありません。また合法性や安全性なども保証いたしません。 当ブログに掲載された内容によって生じた損害等の一切の責任を負いかねますので、ご了承ください。

導入

シミュレーションをする際に正規分布を仮定して正規分布から乱数を発生させているが、これは様々な文献によって、株式や投資信託などは正規分布におおむね従うためということが言われているためです。
しかし、本当に正規分布に従っているのでしょうか?

インデックスファンドやバリュー株は検証しましたが、アクティブファンドはまだしていませんでした。

今回はそれを確認してみます。


方法

 

アクティブファンドであるセゾン資産形成の達人ファンドデータをセゾン投信のホームページよりダウンロード。
(使用データ 2007-03-15~2021-08-24)

月末の日付と終値だけのデータを「R」で抽出してデータフレームを作成。
月末の終値から、前月比率(n=173)を算出し計算に用いる。

 

以下から基準価額のcsvデータをダウンロードして使用させていただきました。

www.saison-am.co.jp

 

平均リターンは前月比率の値613個の当該期間の最後の月末終値/当該期間の最初の月末終値から算出し利用する。

613ヶ月間のリターンを年率換算するため、

当該期間の(613か月目の終値/1か月目の終値)^(613/12) で算出しています。

リスクは全期間の変動値の標準偏差の統計計算で算出します。

(613か月間の月間騰落率の標準偏差)^√(613)で算出します。

 

上記の計算方法は『アセットマネジメントOne株式会社』さんのホームページ掲載の資料【今日から使える『リスクとリターン』】がわかりやすかったので参考とさせていただきました。

www.am-one.co.jp

・検証方法
1. コルモゴロフースミルノフ検定により数値的に正規性を評価する。
2. ヒストグラム、箱髭図、散布図、QQプロットの4点から視覚的に正規性、等分散性について評価する。
3. 正規分布による乱数生成(標本から平均、分散を算出する)
4. F検定により、標本分布と生成した分布の等分散性を評価する。
5. student-t検定により標本分布と生成した分布の平均の差があるかを評価する。

 

なお、有意水準は5%とするが、今回は計3回検定を行っているため多数の偽陽性(第1種の過誤)が生じるのを避けるべく、ボンフェローニ補正法により0.0167%(有意水準/検定数)を適応する。


結果

 

1. コルモゴロフースミルノフ検定

f:id:HanamoriH:20210824222745p:plain

両側検定におけるp値は0.04934 と 0.0167を超えており、帰無仮説の「正規性である」ということは棄却はできない。そのため、正規性がないとは言えない。

 

2. ヒストグラム、箱髭図、散布図、QQプロット

f:id:HanamoriH:20210824222858p:plain
ヒストグラムの形状から正規分布のようにも見える。プロットからも逸脱はあまり見られない。箱髭図から、中央値の偏りはないように見える。散布図からも、データに大きな偏りはないように見える。

 

3. 正規分布による乱数生成(標本から平均、標準偏差を算出)

f:id:HanamoriH:20210824222936p:plain

乱数生成するための分布のサンプルサイズは標本と同じにして、標本から算出した平均と標準偏から正規分布に従う乱数を発生させた結果をヒストグラムにして並べた。出現頻度、範囲、形状で似ているように見える。

 

4. F検定により、標本分布と生成した分布の等分散性を評価する。

 


f:id:HanamoriH:20210824223029p:plain

両側検定におけるp値は0.8757と0.0167を超えており、帰無仮説の「分散に差はない」ということは棄却はできない。そのため、等分散ではないとは言えない。

95%信頼区間においても、-0.9763788 1.2468475 と母分散比が1をまたいでおり、差がないだろうと評価する。

 

5. student-t検定により標本分布と生成した分布の平均の差があるかを評価

f:id:HanamoriH:20210824223105p:plain

両側検定におけるp値は0.811と0.0167を超えており、帰無仮説の「平均値に差はない」ということは棄却はできない。そのため、平均値に差がないとは否定できない。

 95%信頼区間においても、 -0.9763788 ~ 1.2468475 平均差が0をまたいでおり、差がないだろうと評価する。

 

なお、使用データ 2007-03-15~2021-08-24での平均リターンや標準偏差の結果は以下となります。

 

年間平均リターン:8.022258%

年間平均標準偏差:18.09939%

 

月間平均リターン:0.6451313%

月間平均標準偏差:5.224845%

 

 

考察

以上の1~5から、数値的には正規分布に従っていないとは言えないという結果、だが、視覚的には正規分布していそう、という結果だった。

そのため、生成した乱数の分布(標本から算出した平均、標準偏差正規分布)とも差があるとは言えず、正規分布に従っていると思って差し支えないと考えられる。

 

そのため、株式や投資信託のシミュレーションを行う際に、正規分布による乱数発生を用いても問題ないだろうと評価する。

 

サンプルサイズは正直足りないかなとは思いますが、

 

アクティブファンドでも正規分布に従うのだろうなと思えます。

 

今後もいくつかの株式や投資信託でも確認を行っていきたい。

検証方法に問題があればコメントくださいませ。

よろしくお願いします。

 

以上。