「偶然じゃない?」は怖くない!Excelでt検定をしよう!
こんにちは!
クラウドファンディングを通じて導入をご支援いただいたUMITRON CELL。
半年経過した今も元気に稼働しています!
その育成効果を確認するため、先日真鯛の身体測定を行いました!
https://akasakasuisan.co.jp/technology/1592
UMITRON CELLは、今年の6月後半に入荷した稚魚のうちの、約25,000尾の給餌に活用しております。その育成効果を確認するため、同じ種苗で従来の給餌機で育てた別の筏の真鯛と、尾又長(頭から尾の割れ目までの体長)で比較しました。
各筏に網を入れて50尾ずつランダムにすくいます
1尾1尾長さを計測します
揺れのある船上では、魚体重は棒ばかりで計測します
結果発表
図1:尾叉長の計測結果とその平均
一般的な従来の給餌機で育てた真鯛50尾の期待値(平均)は198mmで、ウミトロンセルで育てた真鯛は206mmとなり、
ウミトロンセルを使用している筏の方が8mm大きく成長していることが分かります。
現在の尾又長差で4%、入荷時からの成長幅で6%ほどの差が出ています。
高々6%かと思うかもしれませんが、出荷時までこの差が続くとすると、ざっとこの筏のロットで194万円もの売上の増加が見込めることになります。
金額で考えると大きな差に感じませんか?
しかし、このデータだけだと、誰かから必ずこう言われます。
「たった8mmくらいの差だったらたまたま個体が偏っただけでしょ?偶然じゃない?ウミトロンセルの方で大きいのばっかりとれたんじゃない?」
今から説明する方法を用いれば、この厄介な問いかけに対し、こう返せます
「その確率は0.007%だけどそう思います^^?」
とういうことで、統計学の仮説検定という、効果の有無を検証するための方法を、できるだけ専門用語を使わずに説明していきます。(厳密さを犠牲にして)
t検定
仮説検定とは、2つのデータ間に、偶然では生じづらい有意な違いがあるかどうかを検証する方法の1つです。
その中でも最もポピュラーなt検定は、今回のように、「何かしたものとしてないものとの期待値(平均)に、偶然では生じづらい確かな差があることを証明し、きちんと効果があることを示したい」ときに使います。
そのため主要な用途としては、新薬の効果があるかどうかや、製品量産体制や販売体制を変更した際に、品質や売上が向上したかどうか等を見るために使われます。
(t検定を用いる条件として、元の集団の数字の出方が正規分布というものになる必要があるのですが、対象の集団が十分に多い場合は、CLTという定理により大体正規分布になるので、とりあえずそんなに心配する必要はありません。)
では、そのt検定をExcelを使ってやってみます!
Excelでt検定をやろう!
①まず、どこか空いてるセルに以下の通りに入力します
=T.TEST(比べたいもの①の数列,比べたいもの②の数列,2,3)
図1の結果だとこんな感じです。
=T.TEST(C2:AZ2,C3:AZ3,2,3)
おわり
これだけ!
むしろt検定を知っている人ほど驚く手軽さ!
その数式を打ち込んだところに、平均の差が偶然である確率(P値)が表示されます。
大体この確率が1%以下(もしくは、5%以下)となるかどうかで合否を判定します。
今回は偶然である確率が、たったの0.007%!
これにより、UMITRON CELLを用いることで、魚の成長に有意な効果を生じさせることが出来ることを示せました!
凄いぞUMITRON CELL
t.test関数の中の2、3という数字はそれ程気にしなくて構いません。
要は、一番汎用性の高い条件で検定を実施しています。
ここで、各々最初の2尾だけ体測したものとします。
この場合、従来の給餌機区では平均192mm、ウミトロンセル区では平均208mmとなり、その差は16mmにもなります。
しかし、t検定「=T.TEST(C2:D2,C3:D3,2,3)」で算出できる、平均の差が偶然である確率は24%にもなり、結果への信頼性はかなり低くなります。
これが、10尾体測した場合でも13%、20尾体測してようやく1.4%となります。
つまり、偶然ではなく確かな効果があることを示すためには、出来るだけ沢山データを取得する必要があるということです!
すごく直感的なことですが、水産系の論文や企業が開示しているデータでは、十分なデータ量を満たしていないことが多いなと思います・・・
データの取得が比較的簡単なものなら、統計学の知識やテクニックを学ぶよりも、とりあえずデータ数を増やすのが手っ取り早いです。
(治験など、データの取得が難しいものではそうもいかないので、しっかり統計の勉強をして補う必要があります。)
最後に
今回t検定という統計学的手法を、できるだけ簡単に扱う方法を説明しました。
仮説検定は、割と厚めの統計学の入門書の最後の方に出てくる内容なので、厳密に学ぶとそこそこ時間がかかると思います。
統計とか数学とか聞くと身構える方も多いと思いますが、IT技術の進歩により、ただ使う分には結構簡単でめっちゃ便利で汎用性の高い手法も多いです。
今回のコラムの内容に少しでもいいねと思った方は、お子様の「大人になったら数学なんて使うの?」という問いに「めっちゃ使うよ!」とお答えいただければ幸いです✨(何この締め)
じわじわ増えています!赤坂水産のお魚が食べられるお店
只今送料無料!!飲食店様卸様向け白寿真鯛業務用直販サイト
※会員数、在庫数に限りがございます。
【NEW】お歳暮に!数量限定ギフト用通販サイト
こちらも送料無料!!津本式楽天市場店