アーカイブ

  • その141:  円周率(Π)での「数値0~9」出現度数分布を調査した話

    今回は2023年の話題の最後として、通常のデータマネジメント話とは方向を変えて、筆者が何となしに抱いていた「ある疑問」への試みについて紹介します。その疑問は、ほぼ誰もが知っていると考えられる代表的無理数「円周率(Π)」についてであり、「無限に続く小数点列について、各桁に現れる数値(0~9)は一体どのような出現傾向があるのだろうか?」ということでした。

    これを調べる方法として、円周率の小数点第1位から第10000位の値を対象に(注1)、1000桁ごとに数値「0」から「9」迄の値がどれ位の頻度で出現するかをカウントし、それを積み上げ棒グラフに描いて視覚化する方針にしました。そのカウントしグラフ化した結果を本稿の最後に掲示しています(因みにこのカウント手段としては言語Rの環境を使用しました)。この結果グラフでの横軸は、小数点以下1000桁毎に10000迄の1000の数値計数を積み上げ棒グラフの形にしたものです。1本の棒グラフでは、値ゼロ(Val0)から値9(Val9)のそれぞれの出現数を色分けで表しています。従って1本の棒グラフ内の各数値の出現数を合計すると1000になります。

    この結果グラフをざっと眺めると、各1000桁内に現れる値0~9迄のカウント値には極端な差が出ていないように見て取れます。1000桁グループ毎の桁数値がほぼ均等に出現すると判定して良いかを評価するには、0~9の各数値の出現期待値が100回(1000/10)と近くなっているかを調べる必要があります。このために各数値の期待出現率が10%として評価できるかをカイ(Χ)2乗検定を用いて調べました。その結果を表1に示します。この結果を概観すると、小数点桁2001~3000位の出現部分を除き、各1000桁内の数値の出現数は10%と見做すことを否定できないということになりました。(また、小数点以下10000桁としてカウント集計した数は、数値0から9迄、それぞれ、968回、1026回、1021回、974回、1012回、1046回、1021回、970回、948回、1014回となっています)

    この結果を得ての筆者の思いとしては、円周率Πの小数点以下で示す値の無限数列を構成する数値がほぼ均等に出現すると考えてもよさそうだということです。円周率の桁に現れる数値を使って乱数生成の一つの種としてとして利用する可能性を感じています。円周率の値は様々な場面で出現利用されていますが、改めてこのΠという値の持つ不思議さを筆者は感じている次第です。
  • (注1) ここで用いる円周率(Π)の値は、データ分析ツール提供会社であるWolframのWebサイトから入手利用した。最後の桁は丸め処理が施されるため、今回は小数点以下10002桁分のデータを用いた。
  • (先頭に戻る)
  • 表1 1000桁毎出現値のΧ2乗評価でのp-値
    桁位(1000桁毎)
    各桁数値10%出現期待
    とした場合のp-値
    1~1000
    0.8564
    1001~2000
    0.8395
    2001~3000
    0.0067
    3001~4000
    0.577
    4001~5000
    0.403
    5001~6000
    0.4118
    6001~7000
    0.5503
    7001~8000
    0.4559
    8001~9000
    0.9918
    9001~10000
    0.4083