Wednesday, April 05, 2006

白爛永遠都在...

轉引自http://onnetea.myweb.hinet.net/database/diary.htm#060405

就是那個說「相關係數不是0代表不是沒有 相關!」的白爛...這傢伙的統計老師是誰?真該去切腹自殺,怎麼教出這種連by chance都不知道的腦殘學生的啊。

因為他支持的赤襪隊大將去年沒拿到MVP,然後有人告訴他「算VORP的話,Orz確實是比不過A-ROD...」

於是這傢伙就開始高喊「VORP無用論」,近日一篇則是說:「VORP 是不是必要?創造 replacement level的好處在哪裡?直接用平均或零可以比的,有必要再去算replacement level 嗎?

(轉這種腦殘文字過來很對不起各位,請多包涵)

這個人對統計數字的迷信到一種很誇張的地步,完全忘記統計解釋的最多祇是相關,而不是因果推論(那要用實驗法),因此他會認為:「像樣的統計,要有假設、有模型。在合理的假設下,推導出的模型與公式

我看了是差點沒翻桌.....

這種人最恐怖的地方就是他們如小黃所說的:「玩統計的人老是把每個自 變項都當成各自獨立的,這樣建立出來的模型根本沒有實際上的意義!因為世界上沒有不受其他變項干擾的自變項!

就我的瞭解來說,在棒球統計(sabermetrics)裡面要使用統計技術建立一套模型非常困難,因為各自變項之間的相關頗高(例如OBP跟SLG,算 過就知道這東西多麻煩),這樣子用Multiple Regression跑出來一套很漂亮的model,內容是大有問題的。

不然以美國那邊玩sabermetrics的那麼多,怎麼可能還沒有人用到SEM之類的東西跑出一套超級漂亮的Model?

非不能也,不為也。因為這樣跑出來的公式其實質內容是很糟糕的。

公式這東西更會給人強烈"因果推論"的印象,但我要再重申一次,統計技術祇能給你「相關」,不能給你「因果」。

更不用說沒有理論哪來的模型了,學SEM的老師一再重申的「要跑這些 技術,一定要有深厚的理論基礎,才能夠根據理論來建立MODEL,不然祇是垃圾進垃圾出(GIGO)」。

而B*****這個腦殘傢伙居然想不根據理論(也沒有理論),直接生出假設(怎麼來的?)然後靠統計建立MODEL?

喵的這傢伙統計老師是誰啊!?

==============

更重要的是sabermetrics不是要解釋因果(也不可能),也不是要預測未來,最重要的目的在於「評估」。

例如什麼是選手的能力,什麼又是他的貢獻(注意,能力跟貢獻是分開的,貢獻方面還可以再加進不小的運氣)。哪些能力會是選手穩定的,而趨勢又多半是如何。

最有名的就是BABIP理論,他告訴全世界一個嚇死人的事情「投手對被打出去的球是否成為安打,並沒有控制能力」。

這個理論是可以被反證的,BP那邊三千多的人搞了半天卻是無法反證它,於是祇好接受(保留)這個BABIP理論。

PS.
若光是推導出一個公式或MODEL?我拿SPSS跑兩下也跑出來了,這有什麼難啊....我連係數都可以很漂亮的給你,但這些係數背後的意義呢?任我掰 啊....操,這樣的統計有個鳥用...

No comments: