24-BLOG

雑文集

相関と霊感は疑え

副題:データ(事実)は操作できる

はてなブログでTeXを使える事実が判明しました。

私は素人ですから高度な言語を扱えません。せいぜいHTMLなどのマークアップかスタイルシートが少しわかる程度です。

しかしそうすると、普通に記事を書く分にはさして不便ないのですが、数式を記述できないんですよね。これ。

たとえば相関の分数表現程度なら「係数r=Sxy/Sx·Sy」とか書けそうですが、連分数とかシグマとかルートとか記述の量が増えると見た目がつらくなる。

TeX使えたらなぁ・・
とダメ元でチャレンジしてみたら、ちゃんと反映されました!

されないですね。

「tiny」より小さなサイズは指定できないのでこれ(どれ?)が調整限界。

仕方ないので「font size」でムリヤリ挟んだら、スマホ画面では丁度よい感じに収まるもののPC画面だと極小サイズに!!

\tiny r=\dfrac{\dfrac {1}{n}\displaystyle \sum_{i=1}^{n}\left(x_i-\overline{x}\right)\left(y_i-\overline{y}\right)}{\sqrt{\dfrac {1}{n}\displaystyle \sum_{i=1}^{n}\left(x_i-\overline{x}\right)^2}\times\sqrt{\dfrac {1}{n}\displaystyle \sum_{i=1}^{n}\left(y_i-\overline{y}\right)^2}}\tiny

しかし、たったこれっぽっちの表現で↓292文字↓カウント。

\tiny r=\dfrac{\dfrac {1}{n}\displaystyle \sum_{i=1}^{n}\left(x_i-\overline{x}\right)\left(y_i-\overline{y}\right)}{\sqrt{\dfrac {1}{n}\displaystyle \sum_{i=1}^{n}\left(x_i-\overline{x}\right)^2}\times\sqrt{\dfrac {1}{n}\displaystyle \sum_{i=1}^{n}\left(y_i-\overline{y}\right)^2}}\tiny
自分の勉強用に相関関係について少し書こうと思ったのだけれど、いや、なんかもう無理。

目が痛い。

*****

最近、相関関係をエビデンスとして振りかざす手合いが増えたように思う。

はい論破!ならぬ
はい相関!みたいな

交絡因子(偏相関)や無相関検定などの諸概念を念頭に置くことなく標本相関係数の大きい小さい「からのみ」有意性を主張したり、ここから因果効果を直接推論するかのような暴論もわりと見かけるようになった。

相関分析と回帰分析(回帰分析はエビデンスレベルが一番低い。メタアナリシスがトップ)は目的も概念も異なるはず。

まず自分自身が理論武装をきちんとしておかないと、相関エビデンス星人に欺かれそうで。

たとえばこんな風に。

⚫ミス・アメリカの年齢と暖房器具による死傷者数



赤=ミス・アメリカの年齢
黒=スチームによる死傷者

⚫商店街の総収入とコンピューターサイエンス博士号の授与者数



赤=アーケード収入
黒=CS博士号

引用元:tylervigen.com
http://www.tylervigen.com/spurious-correlations
(偽相関を集めたWebサイト)

次は、ある高名な学者同士のダイアローグ。
上野:私は経験科学の研究者だから嘘はつかないけど、本当のことを言わないこともある。

古市:つまり、データを出さないこともある?

上野:もちろんです。

古市:それはいいんですか?

上野:当たり前よ。それはパフォーマンスレベルの話だから。

光文社 古市憲寿 著
「古市くん、社会学を学び直しなさい!!」(2016)
上野千鶴子先生に「社会学の使い方」を聞く!p75
上掲した「見せかけの相関」は背景がわからない。概念を説明する目的で交絡因子の存在をあえて省いたのかもしれない。

一方、引用した文章はどうか。

これが社会学の常識なのか私に知る術はないけれど、発表される学問的事実なんてデータを扱う者の意図次第で幾らでも操作可能であることはわかる。

気を付けなければ。

© 24-BLOG Repost is prohibited
I'm in a contract with Mikata 弁護士保険