副題:データ(事実)は操作できる
はてなブログでTeXを使える事実が判明しました。
私は素人ですから高度な言語を扱えません。せいぜいHTMLなどのマークアップかスタイルシートが少しわかる程度です。
しかしそうすると、普通に記事を書く分にはさして不便ないのですが、数式を記述できないんですよね。これ。
たとえば相関の分数表現程度なら「係数r=Sxy/Sx·Sy」とか書けそうですが、連分数とかシグマとかルートとか記述の量が増えると見た目がつらくなる。
TeX使えたらなぁ・・
とダメ元でチャレンジしてみたら、ちゃんと反映されました!
されないですね。
「tiny」より小さなサイズは指定できないのでこれ(どれ?)が調整限界。
仕方ないので「font size」でムリヤリ挟んだら、スマホ画面では丁度よい感じに収まるもののPC画面だと極小サイズに!!
しかし、たったこれっぽっちの表現で↓292文字↓カウント。
\tiny r=\dfrac{\dfrac {1}{n}\displaystyle \sum_{i=1}^{n}\left(x_i-\overline{x}\right)\left(y_i-\overline{y}\right)}{\sqrt{\dfrac {1}{n}\displaystyle \sum_{i=1}^{n}\left(x_i-\overline{x}\right)^2}\times\sqrt{\dfrac {1}{n}\displaystyle \sum_{i=1}^{n}\left(y_i-\overline{y}\right)^2}}\tiny |
目が痛い。
*****
最近、相関関係をエビデンスとして振りかざす手合いが増えたように思う。
はい論破!ならぬ
はい相関!みたいな
交絡因子(偏相関)や無相関検定などの諸概念を念頭に置くことなく標本相関係数の大きい小さい「からのみ」有意性を主張したり、ここから因果効果を直接推論するかのような暴論もわりと見かけるようになった。
相関分析と回帰分析(回帰分析はエビデンスレベルが一番低い。メタアナリシスがトップ)は目的も概念も異なるはず。
まず自分自身が理論武装をきちんとしておかないと、相関エビデンス星人に欺かれそうで。
たとえばこんな風に。
赤=ミス・アメリカの年齢
黒=スチームによる死傷者
⚫商店街の総収入とコンピューターサイエンス博士号の授与者数
赤=アーケード収入
黒=CS博士号
引用元:tylervigen.com
http://www.tylervigen.com/spurious-correlations
(偽相関を集めたWebサイト)
次は、ある高名な学者同士のダイアローグ。
上野:私は経験科学の研究者だから嘘はつかないけど、本当のことを言わないこともある。上掲した「見せかけの相関」は背景がわからない。概念を説明する目的で交絡因子の存在をあえて省いたのかもしれない。
古市:つまり、データを出さないこともある?
上野:もちろんです。
古市:それはいいんですか?
上野:当たり前よ。それはパフォーマンスレベルの話だから。
光文社 古市憲寿 著
「古市くん、社会学を学び直しなさい!!」(2016)
上野千鶴子先生に「社会学の使い方」を聞く!p75
一方、引用した文章はどうか。
これが社会学の常識なのか私に知る術はないけれど、発表される学問的事実なんてデータを扱う者の意図次第で幾らでも操作可能であることはわかる。
気を付けなければ。