時間:2023-06-05 09:57:17
開篇:寫作不僅是一種記錄,更是一種創(chuàng)造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇應(yīng)用統(tǒng)計學(xué),希望這些內(nèi)容能成為您創(chuàng)作過程中的良師益友,陪伴您不斷探索和進步。
魅力無限的花園學(xué)府
我是浙江工商大學(xué)2003屆的學(xué)生。是下沙新校區(qū)的第一屆學(xué)生,我們常常戲稱自己是這里的開拓者,新校區(qū)在下沙高教園東區(qū),東臨錢塘江,遠眺蕭山觀潮城。風(fēng)景怡人,雖然最初條件不是很好,但到處是一片新氣象。開拓者的感覺很讓人精神振奮,
隨著建設(shè)的快馬加鞭,學(xué)校的設(shè)施也逐漸完善,如今呈現(xiàn)在眼前的,是青灰色的統(tǒng)一建筑,整齊、干凈、大氣而美麗,小河像血脈一樣連通著校園,一片片草坪綠得耀眼,點綴著年輕的小樹――在和煦的陽光下,杭州細膩的美景中。或看書或聊天,非常愜意;如今再一次從設(shè)計精美的求知泉、藍天碧水的月亮灣、大氣的啟航廣場走過,看著三五成群的學(xué)弟學(xué)妹,一臉笑容,一臉朝氣,讓已經(jīng)失去校園滋補的我滿是羨慕,不知不覺,我走到了校園最遠處的鴿房,這是我最喜歡的地方,草坪上設(shè)計了幾個專供鴿子休憩的木頭房子,鴿子優(yōu)雅地在草坪上踱步、飛揚,這種場景讓人感到高貴而純潔。
快離開教學(xué)區(qū)的時候,我又去瞻仰了一下學(xué)校的飛翔門,飛翔門――顧名思義,門的形狀像展翅飛翔的鳥,氣勢磅礴,象征著莘莘學(xué)子即將起航飛揚神州大地。
浙商大的培養(yǎng)方法很獨特,施行“子女戰(zhàn)略”,視學(xué)生為子女,讓學(xué)生在嚴格要求與熱情關(guān)愛中健康成長,學(xué)校給新生寄教材。讓他們早日開始大學(xué)的學(xué)習(xí);實行早讀和晚自習(xí)制度,這造就了學(xué)校良好的學(xué)風(fēng);在全校學(xué)生中聘任校長書記聯(lián)絡(luò)員,讓學(xué)生直接和校領(lǐng)導(dǎo)交流,這些使得整個學(xué)校就像一個大家庭一樣溫暖。
枯燥而有趣的統(tǒng)計學(xué)
我學(xué)的是統(tǒng)計學(xué),這是一個老牌專業(yè),主要包括一般統(tǒng)計和經(jīng)濟統(tǒng)計兩類專業(yè)方向,需要學(xué)習(xí)數(shù)學(xué)基礎(chǔ)課(分析、代數(shù)、幾何)、概率論、數(shù)理統(tǒng)計、運籌學(xué)、計算機基礎(chǔ)、應(yīng)用隨機過程、實用回歸分析、時間序列分析、多元統(tǒng)計分析、抽樣調(diào)查、非參數(shù)統(tǒng)計、統(tǒng)計預(yù)測與決策、風(fēng)險管理等,統(tǒng)計學(xué)是一個枯燥的專業(yè),我們要和大量的數(shù)據(jù)打交道,堆積如山的各式表格看了都讓人害怕,更別說還要去整理和分析這一堆堆冷冰冰的數(shù)字了,不過,統(tǒng)計學(xué)又是一個有趣的專業(yè),畢竟它是和生活緊密聯(lián)系在一起的。
你知道美女是怎么來的嗎?美女都是被“統(tǒng)計”出來的。比如某一天你在街上閑逛,迎面走來一位女生,這時你就統(tǒng)計她出現(xiàn)在你面前時的心率,如果高于120次,就絕對可以稱之為美女了,如果某一天你遇到一位讓你心跳超過140次的女孩子。那在你看來,沉魚落雁、絕代佳人都不足以形容這位美女,當然。你此刻的心情也無語言表。
你想知道你心儀的女孩子對你的態(tài)度嗎?要看一個女孩子對你的態(tài)度究竟怎樣。那你就統(tǒng)計去找她時,有多少次她會說自己忙、抽不出空來。或者不巧、沒有辦法、抱歉,如果這樣的比例高于某個百分比,那你就該知道,再死纏爛打下去,也不會有好的結(jié)果。
你看,統(tǒng)計學(xué)是多么的有趣,居然關(guān)系到同學(xué)們的終身大事,當然這僅僅是一個玩笑而已,不過,它在現(xiàn)實生活中確實是很重要的,在現(xiàn)代,我們很難找到不會利用統(tǒng)計學(xué)的領(lǐng)域了,太陽每天從東方升起,但天安門廣場上與太陽同時升起的國旗,其升旗時間卻每天不同;冬天過去,春天就要來臨,但今年的春色比去年更加明媚;物體失去支撐就會墜落,但受風(fēng)速、風(fēng)向、地心引力等很多細小因素的影響。兩個同樣重的物體墜落速度和落點會有差別;“神舟五號”飛船按設(shè)計的軌跡運轉(zhuǎn),但每次經(jīng)過我國領(lǐng)空的時間都略有差距;經(jīng)濟按市場規(guī)則運行,但今年的GDP比去年增長8%;奔波的人們按自己的哲學(xué)度日,但一年又一年我們的生活逐漸發(fā)生了改變。
充滿希望的就業(yè)前景
如前所述,現(xiàn)代統(tǒng)計學(xué)的應(yīng)用是很廣泛的,理、工、農(nóng)、醫(yī)、文、經(jīng),沒有不用到統(tǒng)計學(xué)的,所以,它的出路不再尷尬。前途充滿光明。
畢業(yè)后,你可以選擇工作,去政府統(tǒng)計部門,銀行、證券公司、保險公司等金融機構(gòu)。信息咨詢公司等,整體而言,如果英語比較好,統(tǒng)計分析能力強,并且具備一定的社會實踐經(jīng)驗,就能夠進入跨國公司與大牌的咨詢公司,薪酬會非常高,在8000元左右,如果沒有這方面的優(yōu)勢,薪酬就會比較一般,北京、上海、深圳等一線城市,普遍薪酬在4000元左右。
醫(yī)學(xué)統(tǒng)計學(xué)是根據(jù)概率論和數(shù)理統(tǒng)計的原理, 結(jié)合醫(yī)藥衛(wèi)生工作的實際情況, 研究實驗設(shè)計和數(shù)字資料的搜集、整理、分析和推斷的一門科學(xué), 廣泛應(yīng)用于基礎(chǔ)醫(yī)學(xué)、臨床醫(yī)學(xué)、預(yù)防醫(yī)學(xué)、藥學(xué)和衛(wèi)生事業(yè)管理等諸多領(lǐng)域。它是人們認識客觀世界的一種重要手段, 現(xiàn)代科技工作者做科學(xué)研究或撰寫論文, 很少看到不用統(tǒng)計學(xué)。
與此同時,如果統(tǒng)計學(xué)方法應(yīng)用不當,不僅不能準確地反映科研結(jié)果,而且還可能帶來錯誤的結(jié)淪。Rosenfeld 等比較了不同年表的文章,在20 世紀90年代以后有更多的文章使用了統(tǒng)計推斷,而且比較復(fù)雜的統(tǒng)計分析方法如多因素分析等也更多的應(yīng)用于臨床研究中,但同時也存在使用統(tǒng)計方法欠妥或敘述不清的情況。
因此本文將對醫(yī)學(xué)科技論文常見統(tǒng)計學(xué)方法的正確應(yīng)用進行討論,希望加強作者的統(tǒng)計思維,進而提高期刊論文的統(tǒng)計質(zhì)量及學(xué)術(shù)水平。
2、統(tǒng)計學(xué)方法的內(nèi)容
統(tǒng)計軟件包、統(tǒng)計分析方法及檢驗水準是統(tǒng)計學(xué)方法必須描述的3 方面內(nèi)容。SPSS (statistics package for social science) 和SAS(statistical analysis system ) 是全世界學(xué)術(shù)界公認且最常用的兩大統(tǒng)計軟件包[6]。檢驗水準即A,表示組間實際無差別而統(tǒng)計結(jié)果判斷為有差別,犯這類錯誤的概率[1]。實際工作中常取 A=0.05,表示本次研究計算所得P 值必須小于0.05,才能認為組間差異有統(tǒng)計學(xué)意義。統(tǒng)計分析方法的準確描述是科技論文科學(xué)性的關(guān)鍵所在。統(tǒng)計學(xué)方法一般包括統(tǒng)計描述和組間差異性檢驗(即:假設(shè)檢驗) 兩部分內(nèi)容。
3、統(tǒng)計學(xué)方法的正確選用
統(tǒng)計方法的選擇取決于研究設(shè)計、數(shù)據(jù)資料類型和變量值的分布。計量資料常用u檢驗、t檢驗(.配對t檢驗)、 F檢驗;計數(shù)資料用 檢驗;等級資料、偏態(tài)資料或不明分布的資料可用秩和檢驗等。每種顯著性檢驗方法均有其適用范圍, 如方差分析(F檢驗).要求數(shù)據(jù)服從正態(tài)分布, 且各總體方差齊, 否則不宜作方差分析, 若改用非參數(shù)統(tǒng)計方法, 則會降低統(tǒng)計效率, 故常在可能情況下, 通過變量變換(如對數(shù)變換、平方根變換、反正弦函數(shù)變換、例數(shù)變換等)使資料轉(zhuǎn)換為正態(tài)分布, 以滿足方差分析或t檢驗的應(yīng)用條件。醫(yī)學(xué)期刊中最常見的是t檢驗和 檢驗, 這兩種方法誤用也較為多見。
3.1重復(fù)t檢驗
多個樣本均數(shù)間的兩兩比較(又稱多重比較)不宜用t檢驗, 因為重復(fù)數(shù)次,t檢驗將增加第一類錯誤的概率, 使檢驗效率降低。此時宜用方差分析, 并在此基礎(chǔ)上用兩兩比較方法..(如.SNK、LSD、Duncan法等)。對于同一對均數(shù)間的差異, 用t檢驗無顯著性, 而兩兩比較可能有顯著性, 可見錯誤選用統(tǒng)計方法將推出錯誤結(jié)論。
3.2行列標 檢驗誤用
行列表 檢驗用于2個或多個樣本率(或構(gòu)成比).比較, 它要求行列表中不宜有1/5以上格子的理論頻數(shù)T
3.3需要注意的統(tǒng)計學(xué)問題
3.3.1無足夠的統(tǒng)計學(xué)信息
論文中未說明統(tǒng)計方法和 取值, 無均數(shù)、標準差或率及t值、 值等統(tǒng)計量, 甚至未作假設(shè)檢驗直接下結(jié)論。不少臨床醫(yī)學(xué)論文作者只在文中提及P值大小并據(jù)此推斷結(jié)果的顯著性。實際上, 臨床醫(yī)學(xué)研究關(guān)心的是各組之間結(jié)局(如療效)的差別大小, 而不單純是統(tǒng)計學(xué)顯著性, 因此應(yīng)同時說明檢驗方法、 水平、統(tǒng)計量值、P值和可信區(qū)間, 以便讓讀者了解所用的方法和結(jié)論是否適當及其臨床的實際意義。
3.3.2統(tǒng)計圖、表
統(tǒng)計圖、表是統(tǒng)計描述的重要工具。統(tǒng)計圖宜少而精, 應(yīng)按資料性質(zhì)和分析目的選用適合的統(tǒng)計圖形, 統(tǒng)計圖雖直觀但不能代替精確的數(shù)據(jù)或統(tǒng)計量同。統(tǒng)計表宜簡單明了, 層次清楚, 一般采用三線表。常見的統(tǒng)計表運用不當有.. 標題復(fù)雜或過于簡略甚至無標題, 輔助線過多, 標目繁雜, 層次不清。另外, 表內(nèi)不宜留空格, 暫缺或未記錄可用“…” 表示, 無數(shù)字用“一”表示, 數(shù)字若是“0”則填明“0”。
3.3.3統(tǒng)計軟件使用的誤區(qū)
目前計算機應(yīng)用已十分普及, 統(tǒng)計軟件的使用也非常方便, 但軟件只能解決計算問題, 并不能替代人腦的統(tǒng)計思維。根據(jù)資料的分布特征和數(shù)據(jù)特點選擇統(tǒng)計方法, 正確地解釋分析結(jié)果并推導(dǎo)出正確的結(jié)論, 這是科研工作者在做統(tǒng)計分析時必須首先掌握的, 計算只是一種工具。有了諸如SASA、SPSS等高級統(tǒng)計軟件包, 復(fù)雜了多元分析如多重回歸、多因素方差分析等已變得十分容易, 于是一些作者片面追求使用高深的多元統(tǒng)計方法且多種方法一起用, 誤以為統(tǒng)計方法用得越高級, 文章水平越高。實際上如果使用不當, 多元統(tǒng)計方法使用得越多, 錯誤可能也越多。一個精心設(shè)計的臨床研究, 資料可能用簡單的t檢驗或 檢驗就足以說明問題, 若濫用多元分析、結(jié)果會適得其反。
4.結(jié)語
通過上面的分析,在醫(yī)學(xué)研究中必須正確運用統(tǒng)計學(xué),這是科研工作的科學(xué)性所決定的。搞科研,首先必須尊重科學(xué)。借助統(tǒng)計學(xué)這個有用的工具,可以去探索未知事物,揭示和闡明客觀事物變化的規(guī)律性。
參考文獻:
[1]于國藝, 周曉彬, 王俊. 醫(yī)學(xué)論文常見統(tǒng)計方法誤用分析.編輯學(xué)報, 1998;10(3):132.
[2]楊樹勤, 主編.衛(wèi)生統(tǒng)計學(xué).第3版.北京: 人民衛(wèi)生出版社, 1995;145-147.
主干學(xué)科:應(yīng)用統(tǒng)計學(xué)。主要課程:數(shù)學(xué)基礎(chǔ)課(分析、代數(shù)、幾何)、概率論、數(shù)理統(tǒng)計、運籌學(xué)、計算機基礎(chǔ)、應(yīng)用隨機過程、實用回歸分析、時間序列分析、多元統(tǒng)計分析、抽樣調(diào)查、參數(shù)統(tǒng)計、統(tǒng)計預(yù)測與決策、風(fēng)險管理等,以及根據(jù)應(yīng)用方向選擇的基本課程等。
應(yīng)用統(tǒng)計學(xué)專業(yè)主要包括一般統(tǒng)計和經(jīng)濟統(tǒng)計兩類專業(yè)方向,培養(yǎng)具有良好的數(shù)學(xué)或數(shù)學(xué)與經(jīng)濟學(xué)素養(yǎng),掌握統(tǒng)計學(xué)的基本理論和方法,能熟練地運用計算機分析數(shù)據(jù),能在企業(yè)、事業(yè)單位和經(jīng)濟、管理部門從事統(tǒng)計調(diào)查、統(tǒng)計信息管理、數(shù)量分析等開發(fā)、應(yīng)用和管理工作,或在科研、教育部門從事研究和教學(xué)工作的高級專門化應(yīng)用型人才。
(來源:文章屋網(wǎng) )
一、地質(zhì)統(tǒng)計學(xué)的概述
地質(zhì)統(tǒng)計學(xué)是1962年,法國著名統(tǒng)計學(xué)家G.Matheron在Traitédegéostatistiqueappliquée一文最早提出的,之后其他科學(xué)家大量理論研究的基礎(chǔ)上逐漸形成的一門新的統(tǒng)計學(xué)與地質(zhì)學(xué)的交叉學(xué)科。地質(zhì)統(tǒng)計學(xué)所利用的是應(yīng)用統(tǒng)計學(xué)。地質(zhì)統(tǒng)計學(xué)因為具有空間的分布特點,而且是利用區(qū)域變量理論作為理論基礎(chǔ),因此地質(zhì)統(tǒng)計學(xué)在礦產(chǎn)開發(fā)、資源開發(fā)、動植物研究、地質(zhì)地貌方面都有著很突出的作用。之所以將它稱作地質(zhì)統(tǒng)計學(xué)是因為,它最早只是應(yīng)用在地理科學(xué)當中。地質(zhì)統(tǒng)計學(xué)的創(chuàng)立最初是由G.Matheron創(chuàng)造的,經(jīng)過長時間的改造與發(fā)展,現(xiàn)在的地質(zhì)統(tǒng)計學(xué)已經(jīng)成為一門非常完善的數(shù)學(xué)工具了,而且它的應(yīng)用也變得越來越廣泛,由最初單純的地理研究,發(fā)展到今天在地球物理、地質(zhì)、生態(tài)、土壤等領(lǐng)域的廣泛應(yīng)用。
二、地質(zhì)統(tǒng)計學(xué)在礦山儲量分析當中的應(yīng)用
地質(zhì)統(tǒng)計學(xué)是以研究區(qū)域化變量為基礎(chǔ)的,以變異函數(shù)為研究工具,研究在空間上具有隨機性和結(jié)構(gòu)性的自然現(xiàn)象的科學(xué)。地質(zhì)統(tǒng)計學(xué)在礦山儲量分析當中的應(yīng)用中的原理大致分為以下幾種:1.區(qū)域化變量區(qū)域化變量是地質(zhì)統(tǒng)計學(xué)理論體系的核心基礎(chǔ),在實踐中,鉆孔的位置。在絕大多數(shù)情況下是不隨機的。當兩個樣品在空間的距離很小時,樣品間會存在較強的相似性,而當距離很大時,相似性就會減弱或不存在。也就是說,樣品之間存在著某種聯(lián)系,這種聯(lián)系的強弱是與樣品的相對位置有關(guān)的,樣品之間的聯(lián)系在空間上既具有隨機性又具有位置之間的聯(lián)系。2.半變異函數(shù)的數(shù)學(xué)模型通常情況下樣品由于取樣、化驗誤差和礦化作用在短距離內(nèi)的變化,在絕大多數(shù)情況下半變異函數(shù)在原點不等于零。也就是會存在塊金效應(yīng)。但是地質(zhì)統(tǒng)計學(xué)在礦山儲量分析當中的應(yīng)用在實際工作中區(qū)域化變量的變化性很復(fù)雜,通常要計算幾個具有代表性的方向,然后通過結(jié)構(gòu)分析,得到一個能代表其空間變異性的模型函數(shù),由于區(qū)域化變量往往存在各向異性,不同方向上的半變異函數(shù)具有不同的變程,影響范圍是一橢球體,即各向異性橢球體。在確定空間搜索橢球體時,不僅需要指出塊金常數(shù)、基臺、變程,還需要指定一些參數(shù):圓錐體的容差角、容差限、滯后距等,各個參數(shù)的意義用幾何圖形表示。當然應(yīng)用地質(zhì)統(tǒng)計學(xué)法對礦山儲量分析,被大部分人認為是一種較好的品位估值方法,尤其適用于品位變化大,礦巖界線由品位控制的礦床。在估值計算過程中,當有了足夠的地質(zhì)鉆孔數(shù)據(jù)時,對礦床進行正式可行性評價時,選用地質(zhì)統(tǒng)計學(xué)法是一種較好的方法,而在對礦床進行初步評價或是數(shù)據(jù)量不足時,就要首選較簡單的方法。基于地質(zhì)統(tǒng)計學(xué)原理和礦體三維可視化建模技術(shù)的DIMINE礦業(yè)軟件,實現(xiàn)了按照不同的邊界品位動態(tài)圈定礦體,能夠以市場經(jīng)濟為向?qū)?快速計算出礦體范圍內(nèi)的礦石量,并進行儲量分級,在此過程中所得到的各中間參數(shù),可以為投資決策和日常管理提供必要的參考依據(jù)。
三、地質(zhì)統(tǒng)計學(xué)在勘探網(wǎng)度優(yōu)化方面的應(yīng)用
地質(zhì)統(tǒng)計學(xué)在勘探網(wǎng)度優(yōu)化中的應(yīng)用主要要注意以下的兩個個因素,其一是:構(gòu)造復(fù)雜程度;二是煤層的穩(wěn)定性。當勘探區(qū)的構(gòu)造已經(jīng)經(jīng)過,詳細的勘探,構(gòu)造問題基本解決之后,勘探網(wǎng)度優(yōu)化主要的問題就是煤層的穩(wěn)定性。當一個煤田有兩種或者是兩種以上的煤層穩(wěn)定結(jié)構(gòu)時、應(yīng)該按照儲量和厚度占有優(yōu)勢的那一個煤層類型選擇勘探網(wǎng)度的優(yōu)化。應(yīng)用地質(zhì)統(tǒng)計學(xué)的方法對露天的在勘探網(wǎng)度進行優(yōu)化,主要要分為兩個步驟:其一是建立地質(zhì)變量的最佳理論變差函數(shù);其二是應(yīng)用地質(zhì)變量的估計方差評價勘探過程對礦床的控制程度。
四、結(jié)語
本文詳細論述了地質(zhì)統(tǒng)計學(xué)的概述、地質(zhì)統(tǒng)計學(xué)在礦山儲量分析當中的應(yīng)用、以及地質(zhì)統(tǒng)計學(xué)在勘探網(wǎng)度優(yōu)化方面的應(yīng)用,通過對以上問題的論述,我們更加清晰的認清了地質(zhì)統(tǒng)計學(xué)以及地質(zhì)統(tǒng)計學(xué)在固體礦山中的應(yīng)用。就目前的情況而言,我國對地質(zhì)統(tǒng)計學(xué)的認識還是不夠充分的,大多數(shù)都將地質(zhì)統(tǒng)計學(xué)看做一門非常復(fù)雜的科目,所以沒有去進行深入的研究,所以,我國的地質(zhì)統(tǒng)計學(xué)還處在一個非常初級的階段,地質(zhì)統(tǒng)計學(xué)的作用也難以在我國發(fā)揮出來。由于我國的地質(zhì)狀況非常復(fù)雜,與外國的地質(zhì)狀況非常不同,主要體現(xiàn)在:地質(zhì)類型多、地質(zhì)結(jié)構(gòu)復(fù)雜、多高山、少平原、礦產(chǎn)資源豐富。因此地質(zhì)統(tǒng)計學(xué)在我國的發(fā)展既有機遇同時也存在著挑戰(zhàn)。總而言之,地質(zhì)統(tǒng)計學(xué)在我國的研究是非常有意義的,但是因為各種條件的限制,我國在地質(zhì)統(tǒng)計學(xué)上的發(fā)展還是不夠完善,而且現(xiàn)在的地質(zhì)統(tǒng)計學(xué)的應(yīng)用不單單只限于地理科學(xué)方面的研究,它在各個領(lǐng)域都是有所涉及的,如環(huán)境科學(xué)、農(nóng)田水利、氣象、林業(yè)、海洋等領(lǐng)域均已涉及,因此,發(fā)展我國的地質(zhì)統(tǒng)計學(xué)是現(xiàn)在非常重要的任務(wù),因為地質(zhì)統(tǒng)計學(xué)的高速發(fā)展有利于我國國民經(jīng)濟的快速發(fā)展,也有利于解決我國資源緊缺的問題。隨著應(yīng)用領(lǐng)域的不斷擴大和方法本身的不斷完善,地質(zhì)統(tǒng)計學(xué)已逐步方展成一個通用的工具性科學(xué)。也希望我國能夠通過地質(zhì)統(tǒng)計學(xué)固體礦山中的應(yīng)用中有很大的進步。
作者:馮艷娟 單位:河北省地質(zhì)礦產(chǎn)勘查開發(fā)局第四地質(zhì)大隊
摘 要:隨著我國經(jīng)濟發(fā)展水平的不斷提高,各行各業(yè)得到了顯著發(fā)展,數(shù)據(jù)統(tǒng)計學(xué)方法也變得日趨多樣,數(shù)據(jù)挖掘是建立在數(shù)據(jù)庫與人工智能基礎(chǔ)上發(fā)展起來的一種高新技術(shù),其功能是從眾多的數(shù)據(jù)當中挖掘到最有價值的信息,進而實現(xiàn)對數(shù)據(jù)資源的高效利用。聚類分析能夠被當成一種數(shù)據(jù)分析工具,能真實反映出數(shù)據(jù)分布情況,本文主要對統(tǒng)計學(xué)在數(shù)據(jù)挖掘中的應(yīng)用進行了探討,從而表現(xiàn)統(tǒng)計學(xué)在數(shù)據(jù)挖掘應(yīng)用中的重要性。
關(guān)鍵詞:統(tǒng)計學(xué)方法;數(shù)據(jù)挖掘;應(yīng)用分析
數(shù)據(jù)挖掘就是指從眾多實際應(yīng)用數(shù)據(jù)中獲取批量大、有噪聲、且隨機性強的數(shù)據(jù),將潛在的信息與數(shù)據(jù)提取出來,就是從數(shù)據(jù)中挖掘有價值的知識,而大多數(shù)原始數(shù)據(jù)具有一定的結(jié)構(gòu)化特征,比如,關(guān)系數(shù)據(jù)庫中的數(shù)據(jù);也可以通過文本、圖形、圖像等半結(jié)構(gòu)化發(fā)掘有用知識,這些知識可以是數(shù)學(xué)的也可以是非數(shù)學(xué)形式的;數(shù)據(jù)挖掘能以歸納形式存在,能夠被廣泛應(yīng)用到信息查詢、信息管理、信息決策控制中,方便數(shù)據(jù)的維護與管理。由此可見,數(shù)據(jù)挖掘是一門交叉性強的學(xué)科,加強對其的研究非常有意義,下面將對統(tǒng)計方法在數(shù)據(jù)挖掘中的具體應(yīng)用進行分析。
一、數(shù)據(jù)挖掘與統(tǒng)計學(xué)的關(guān)系
(一)數(shù)據(jù)挖掘的內(nèi)涵
通常來說,數(shù)據(jù)挖掘的定義較為模糊,沒有明確界定,大部分對其的定義只是停留在其背景與觀點的內(nèi)容上。通過對不同觀點的統(tǒng)一整理,人們最終將其描述為:從大量多樣化的信息中發(fā)現(xiàn)隱晦性、規(guī)律性等潛在信息,并對這些信息進行創(chuàng)造、加工的過程。數(shù)據(jù)挖掘作為一門重要的交叉學(xué)科,能夠?qū)?shù)據(jù)庫、人工智能、機器學(xué)習(xí)、統(tǒng)計學(xué)等眾多的科學(xué)融入到一起,從而實現(xiàn)技術(shù)與理論的創(chuàng)新與發(fā)展[1]。其中,數(shù)據(jù)庫、人工智能與統(tǒng)計學(xué)是數(shù)據(jù)挖掘當中的三大支柱理論。數(shù)據(jù)挖掘的目的是從數(shù)據(jù)庫當中發(fā)掘各種隱含的知識與信息,此過程的方法非常多,有統(tǒng)計學(xué)知識、遺傳算法、粗集方法、決策法、模糊邏輯法等,還可以應(yīng)用向鄰近的可視技術(shù)、模式識別技術(shù)等,在以上所有技術(shù)的支持上能夠使數(shù)據(jù)挖掘更為科學(xué)、有序。
(二)數(shù)據(jù)挖掘與統(tǒng)計學(xué)間的關(guān)系
通常來說,統(tǒng)計學(xué)的主要功能是對統(tǒng)計原理與統(tǒng)計方法進行研究的科學(xué)。具體來說就是指對數(shù)字資料進行的收集、整理、排序、分析、利用的過程,數(shù)字資料是各種信息的歸納與總結(jié),可以將其作為特性原理的認知、推理方法[2]。而統(tǒng)計學(xué)則表示的是使用專業(yè)的統(tǒng)計學(xué)、概率理論原理等對各種屬性關(guān)系的統(tǒng)計與分析過程,通過分析成功找到屬性間的關(guān)聯(lián)與發(fā)展的規(guī)律。在此過程中,統(tǒng)計分析方法是數(shù)據(jù)挖掘最為重要的手段之一。
在數(shù)據(jù)挖掘這一課題被提出來之前,統(tǒng)計分析技術(shù)對于人們來說更熟悉,也是人們?nèi)粘i_展工作、尋找數(shù)據(jù)間規(guī)律最常使用的方法。但是不能簡單的將數(shù)據(jù)挖掘作為統(tǒng)計學(xué)的延伸與替代工具,而是要將兩者的區(qū)別認識到位,再結(jié)合兩者間的不同特點分析其應(yīng)用特點[3]。大部分的統(tǒng)計學(xué)分析技術(shù)都是建立在數(shù)學(xué)理論與技巧上的,預(yù)測通常較為準確,效果能夠讓大部分人滿意。數(shù)據(jù)挖掘能夠充分借鑒并吸收統(tǒng)計學(xué)技術(shù),在融入到自身特點以后成為一種數(shù)據(jù)挖掘技術(shù)。
統(tǒng)計學(xué)與數(shù)據(jù)挖掘存在的目標都是一致的,就是不斷對數(shù)據(jù)結(jié)構(gòu)進行發(fā)掘。鑒于統(tǒng)計學(xué)與數(shù)據(jù)挖掘在目標上的一致性,致使很多研究學(xué)者與專家將數(shù)據(jù)挖掘作為了統(tǒng)計學(xué)的一個分支機構(gòu)[4]。但是這種認知非常不正確,因為數(shù)據(jù)挖掘不僅體現(xiàn)在與統(tǒng)計學(xué)的關(guān)系上還體現(xiàn)在思想、工具與方法上,尤其是在計算機科學(xué)領(lǐng)域?qū)?shù)據(jù)挖掘起到的作用非常大。比如,通過借助數(shù)據(jù)庫技術(shù)與人工智能的學(xué)習(xí),能夠關(guān)注到更多統(tǒng)計學(xué)與數(shù)據(jù)挖掘上的共通點,但是兩者存在的差異依然非常大。數(shù)據(jù)挖掘就是指對大量的數(shù)據(jù)信息不斷挖掘的過程,DM能夠?qū)?shù)據(jù)模式內(nèi)的數(shù)據(jù)關(guān)系進行充分挖掘,并對觀測到的數(shù)據(jù)庫處理有著極高的關(guān)注度。
二、數(shù)據(jù)挖掘的主要過程
從數(shù)據(jù)本身出發(fā)探討數(shù)據(jù)挖掘過程,數(shù)據(jù)挖掘的過程分為信息的收集、數(shù)據(jù)集成、數(shù)據(jù)處理、數(shù)據(jù)變換、數(shù)據(jù)挖掘?qū)嵤┑冗^程。
首先,要將業(yè)務(wù)對象確定下來,明確不同業(yè)務(wù)定義,并認清數(shù)據(jù)挖掘的目的,這是做好數(shù)據(jù)挖掘最關(guān)鍵的一步,也是最重要的一步,雖然挖掘的結(jié)果不能被準確預(yù)測到,但卻需要對問題的可預(yù)見性進行探索[5]。其次,還要做好數(shù)據(jù)準備工作,包含數(shù)據(jù)清理、數(shù)據(jù)變換等工作,數(shù)據(jù)清理的實際意義是將噪聲與空缺值補全,針對這一問題,可以使用平滑技術(shù),而空缺值的處理則是屬性中最常見的,可以將統(tǒng)計中最可能出現(xiàn)的值作為一個空缺值[6]。
信息收集指的是按照特定的數(shù)據(jù)分析對象,可以將分析中需要的特征信息抽象出來,并在此基礎(chǔ)上選擇出較為科學(xué)、適合的信息收集方法,將全部的信息全部錄入到特定的數(shù)據(jù)庫中。如果數(shù)據(jù)量較大,則可以選擇一個專門的管理數(shù)據(jù)的倉庫,實現(xiàn)對信息的有效保護與管理;數(shù)據(jù)集成就是指將來源不同、格式不同、性質(zhì)不同、特點不同的數(shù)據(jù)集成到一起,進而為企業(yè)提供更為全面、系統(tǒng)的數(shù)據(jù)共享平臺;數(shù)據(jù)變換就是通過聚集、概化、規(guī)范化等方式對數(shù)據(jù)進行挖掘,對于一些實用數(shù)據(jù),則可以通過分層與分離方式實現(xiàn)對數(shù)據(jù)的轉(zhuǎn)換;數(shù)據(jù)挖掘就是結(jié)合數(shù)據(jù)倉庫中的數(shù)據(jù)信息點,并選擇正確的分析方法實現(xiàn)對有價值數(shù)據(jù)的挖掘,事例推理、規(guī)則推理、遺傳算法等都是應(yīng)用較多的方法[7]。
三、統(tǒng)計學(xué)方法中的聚類分析
在統(tǒng)計學(xué)聚類方法基礎(chǔ)上能夠構(gòu)建出潛在的概率分布假設(shè),可以使用試圖優(yōu)化的方法構(gòu)建數(shù)據(jù)與統(tǒng)計模型的擬合效果。基于統(tǒng)計學(xué)聚類方法當中,Cobweb方法是在1987年由Fisher提出的,能夠以分類樹作為層次聚類創(chuàng)建的方法,在分類樹上,每一個節(jié)點都能代表著一個概念,該方法就是對節(jié)點概率描述的過程。Cobweb方法還使用了啟發(fā)式估算方式,使用分類效用對分類樹的構(gòu)建進行指導(dǎo),從而實現(xiàn)對最高分類的劃分目的,能夠?qū)⒉煌诸悓ο笕繗w類到一個類別中,并依據(jù)這些內(nèi)容創(chuàng)建出一個新的類別。但是這種方法也存在一定局限性,局限性在于假設(shè)的屬性概率分布都是獨立的,并不能始終處于成立狀態(tài)中。
只有在掌握了Cobweb算法以后才能對概念聚類算法的特點進行探究。Cobweb算法能夠以分類樹方式創(chuàng)建層次聚類,可以將概率表現(xiàn)為p(Ai=Vii/Ck)條件概率,其中,Ai=Vij是一個類別下的,同屬于一個值對,Ck是概念類中的一種。在給出一個特定的對象以后,Cobweb能夠?qū)⑷繉ο笳系揭粋€節(jié)點上,從而計算出分類效應(yīng),分數(shù)最高的效用就是對象所在的節(jié)點位置[8]。如果對象構(gòu)建失去節(jié)點,則Cobweb能夠給出一個新的節(jié)點,并對其進行分類使用,這種節(jié)點計算方法起步較晚,能夠?qū)ΜF(xiàn)有的節(jié)點與計算相互對比,從而劃分出最高的分類指標,將全部對象統(tǒng)一到已有的分類中,從而構(gòu)建出一個新的類別。
Classitci是Cobw eb方法的一種延伸與發(fā)展,能夠使用其完成聚類數(shù)據(jù)的處理,在該方法下,節(jié)點中的每一個存儲屬性都是處于連續(xù)分布狀態(tài)中,能夠?qū)⑵渥鳛榉诸愋Ч拚姆椒ǎ⒁远攘康男问奖憩F(xiàn)出來,這種度量基礎(chǔ)上能夠?qū)崿F(xiàn)連續(xù)性的積分,從而降低分散發(fā)生率,該方法是積分過程而不是對屬性的求和過程。
Auto Class方法也是一種應(yīng)用較為普遍的聚類方法,該方法主要采用統(tǒng)計分析對結(jié)果類的數(shù)目進行估算,還可以通過模型搜索方式分析空間中各種分類的可能性,還能夠自動對模型數(shù)量與模型形態(tài)進行描述。在一定類別空間中,不同的類別內(nèi)屬性存在關(guān)聯(lián)性,不同的類別間具有相互繼承性,在層次結(jié)構(gòu)當中,共享模型參數(shù)是非常重要的。
還有一種使用較為普遍的模型是混合模型,混合模型在統(tǒng)計學(xué)聚類方法上使用也非常普遍。該方法最為基本的思想就是概率分布決定著每一種聚類狀態(tài),并且模型中的每一個數(shù)據(jù)都是由多個概率在分布狀態(tài)下產(chǎn)生的。混合模型還能夠作為一種半?yún)?shù)密度評估方法,其能夠?qū)?shù)估計與非參數(shù)估計的優(yōu)點全部集中到一起,并將參數(shù)估計法與非參數(shù)估價法的諸多優(yōu)點融合到一起,因為模型具有一定復(fù)雜性,為此,不能將其限制在概率密度函數(shù)表達形式上,這種復(fù)雜性決定了模型與求解存在關(guān)聯(lián),與樣本集合的聯(lián)系非常少。通過以上的研究可以了解到,數(shù)據(jù)發(fā)掘中應(yīng)用聚類方法非常有效,并且較為常見。比如,構(gòu)建出Cobweb模型與混合模型,采用Clara與Clarans方法中的抽樣技術(shù),將Denclue方法用在概率密度函數(shù)中。
結(jié)束語
統(tǒng)計學(xué)方法自產(chǎn)生開始已經(jīng)有非常久遠的歷史,將嚴謹?shù)臄?shù)學(xué)邏輯作為基礎(chǔ),將分類算法假定作為獨立條件,屬性值之前能夠相互保持獨立,對假定進行計算,當假定成立時,可以再與其他分類算法進行對比,這種分類算法準確性非常高。為此,其不僅能夠?qū)B續(xù)值進行預(yù)測,還可以通過線性回歸方程對系數(shù)進行比較,從而歸納出結(jié)果。
(作者單位:中國人民大學(xué))
參考文獻:
[1] 張愛菊.基于數(shù)據(jù)挖掘技術(shù)的瓦斯氣體紅外光譜定量分析方法的研究[J].光譜學(xué)與光譜分析,2013,33(10):2646-2650.
[2] 許長福,李雄炎,譚鋒奇等.任務(wù)驅(qū)動數(shù)據(jù)挖掘方法的提出及在低阻油層識別中的應(yīng)用[J].吉林大學(xué)學(xué)報(地球科學(xué)版),2012,42(1):39-46.
[3] 鄭曉峰,王曙.基于粗糙集與關(guān)聯(lián)規(guī)則的道路運輸管理信息數(shù)據(jù)挖掘方法[J].華南理工大學(xué)學(xué)報(自然科學(xué)版),2014(2):132-138.
[4] 周復(fù)之.固定收益決策支持系統(tǒng)機理建模與數(shù)據(jù)挖掘的協(xié)同研究[J].系統(tǒng)工程理論與實踐,2010,29(12):38-45.
[5] 張繼福,張素蘭,蔣義勇等.基于約束概念格的天體光譜局部離群數(shù)據(jù)挖掘系統(tǒng)[J].光譜學(xué)與光譜分析,2011,29(2):551-555.
[6] 張欣欣,繆弈洲,張月紅等.CrossRef文本和數(shù)據(jù)挖掘服務(wù)――《浙江大學(xué)學(xué)報(英文版)》的實踐[J].中國科技期刊研究,2015,26(6):594-599.
關(guān)鍵詞 Excel;生物統(tǒng)計學(xué);t分布;TINV函數(shù);TDIST函數(shù)
中圖分類號 G642 文獻標識碼 A 文章編號 1007-5739(2016)23-0271-02
生物統(tǒng)計學(xué)是研究數(shù)據(jù)資料的收集、整理、分析、解釋的一門科學(xué)[1],也是畜牧、獸醫(yī)、農(nóng)學(xué)、微生物、醫(yī)學(xué)等領(lǐng)域中不可缺少的統(tǒng)計工具,越來越多的數(shù)據(jù)分析離不開生物統(tǒng)計學(xué)的原理。隨著計算機技術(shù)的發(fā)展,已經(jīng)有更多的軟件或操作系統(tǒng)被應(yīng)用于生物統(tǒng)計學(xué),如Excel[2]、SAS[3]、SPSS[4-6]等,但是不同的統(tǒng)計軟件具有不同的統(tǒng)計特點,如Excel統(tǒng)計功能更為簡單,適合生物統(tǒng)計學(xué)的初學(xué)者。SAS統(tǒng)計功能比較寬廣,因其統(tǒng)計模塊的限制,所以更適合能夠自己編寫程序的學(xué)者。SPSS的統(tǒng)計功能更為強大,幾乎具備了所有的統(tǒng)計分析功能,操作相對簡單、直觀。雖然從統(tǒng)計分析上來看,SAS和SPSS的統(tǒng)計分析功能略勝于Excel,但是Excel也具有其獨特的地方,如對一些常用分布的概率計算來說Excel就顯得更簡單。本文則針對Excel在生物統(tǒng)計學(xué) t分布中的一些應(yīng)用進行探討。
1 t分布
2 Excel在t分布計算的應(yīng)用
2.1 t分布的概率計算
例1:如果一個t分布的自由度(df)等于60,臨界值(或者分位數(shù))是2,求t分布的兩尾概率是多少?求t分布的單尾概率是多少?
t分布的雙尾概率是指在其分布的2個尾部(左尾和右尾部)概率之和,Excel中選定空格―插入―fx函數(shù)―統(tǒng)計―TDIST,在其對話框中從上至下依次輸入2、60、2,具體見圖2,其概率為0.050 0。
t分布的單尾概率是指在其分布的左尾部概率或右尾部概率,因為t分布是左右對稱分布,所以單側(cè)的左尾概率與右尾概率相等。Excel中選定空格―插入―fx函數(shù)―統(tǒng)計―TDIST,在其對話框中從上至下依次輸入2、60、1。
2.2 t分布的R界值計算
例2:如果一個t分布的兩尾概率為0.05,自由度(df)為10時,則其臨界值是多少?
Excel中選定空格―插入―fx函數(shù)―統(tǒng)計―TINV,在其對話框中從上至下依次輸入0.05、10,具體見圖3,其臨界值為2.228 2。
3 結(jié)語
在本科生的教學(xué)改革與實踐中,已經(jīng)把各種分布的概率計算納入生物統(tǒng)計學(xué)的實踐教學(xué)中,而且在概率計算這方面,Excel比較方便快捷。本文主要介紹了用Excel中 的TDIST和TINV函數(shù)在t分布中的應(yīng)用,在用TDIST函數(shù)模塊時,雙尾概率和單尾概率的不同之處在于提示框中“Tails”的填寫數(shù)字不同,雙尾填“2”,單尾填“1”。而TINV函數(shù)只能提供雙尾概率的臨界值,如果要計算單尾概率的臨界值,如單尾概率為0.01的臨界值,則可以事先變換成雙尾概率即 0.02,然后即可利用TINV函數(shù)計算出其臨界值[7-8]。
4 參考文獻
[1] 張勤.生物統(tǒng)計學(xué)[M].北京:中國農(nóng)業(yè)大學(xué)出版社,2009.
[2] 王香萍,王文凱,李俊凱,等.EXCEL中關(guān)于生物統(tǒng)計中兩組平均數(shù)的應(yīng)用方法及探討[J].考試周刊,2011(6):180-181.
[3] 黃中文,張丹.生物統(tǒng)計與SAS教學(xué)中大學(xué)生自主學(xué)習(xí)能力的培養(yǎng)[J].新鄉(xiāng)學(xué)院學(xué)報(社會科學(xué)版),2013,27(5):140-142.
[4] 白俊艷,徐廷生,張小輝.《生物統(tǒng)計附試驗設(shè)計》上機實驗改革與實踐[J].教育教學(xué)論壇,2015(18):247-248.
[5] 白俊艷,賈小平,張小輝,等.生物統(tǒng)計學(xué)課程改革與實踐[J].畜牧與飼料科學(xué),2013,34(10):57-58.
[6] 白俊艷,武曉紅,張小輝,等.生物統(tǒng)計附試驗設(shè)計課程考核方式的改革與實踐[J].安徽農(nóng)業(yè)科學(xué),2015,43(5):369-370.
本文較系統(tǒng)地介紹了統(tǒng)計學(xué)在證券期貨市場中的應(yīng)用,其中包括作者的一些最新成果,如:證券期貨市場指標體系的研究;新華財經(jīng)指數(shù)的編制;證券投資組合的研究與應(yīng)用等。
關(guān)鍵詞:統(tǒng)計學(xué) 證券市場 期貨市場
分類號:O212 C8 F832.5 標識碼:A
文章編號:1002-1566(2000)01-0054-04
Application of Statistics on Securities and Futures Markets
LI Cong-zhu,DING Shao-fang,WANG Ling-hua,SUN Da-ning
(North China University of Technology,100041)
Abstract:In this paper,the Application of Statistics on Securities and Futures Markets is introduced,author's many new achievements are included in it,such as study of index system on Securities and future markets;study of Xin Hua index number of securities;study and application of investment in bond and so on.
Key Words:statistics securities markets futures markets
一、序
言
我國自九十年代初建立證券期貨市場以來,短短幾年,得到了迅猛,方興未艾。僅拿股市來看(截至1999年07月13日),在滬深兩市上市的境內(nèi)公司已達900家,滬深市場的A,B股股數(shù)是981只,上市公司900家,其中滬市501只(461家),深市480只(439家),滬深A(yù)股股數(shù)874只,B股股數(shù)107只。這與1991年滬市8家深市6家上市公司相比,可見發(fā)展速度之快。市價總值21083億元人民幣,占國內(nèi)生產(chǎn)總值的比重超過25%;開辦證券90家,兼營證券業(yè)務(wù)的信托投資公司237家,下屬證券營業(yè)部2400多家;現(xiàn)有43家境內(nèi)海外上市,累計籌集資金100多億美元;已有107家公司成功發(fā)行了B股,籌集資金近50億美元;股民已達4000多萬。自1999年五月十九日井噴式行情以來,滬深兩市的日成交量猛增,至六月二十五日高達800多億(1998年8月18日香港股市一天的成交量為790億港元),創(chuàng)下空前的天量。證券市場的作用愈來愈大,并逐漸成為國民的晴雨表。
統(tǒng)計學(xué)及其相關(guān)學(xué)科在證券期貨交易中有什么作用呢?我們先從世界范圍談起。
據(jù)有關(guān)報道,當今華爾街最搶手的不再是傳統(tǒng)的MBA,而是有統(tǒng)計背景、數(shù)理能力強的人才。一些在美國獲得統(tǒng)計或數(shù)學(xué)博士學(xué)位的留學(xué)生被華爾街錄用,轉(zhuǎn)眼間便當上了年薪百萬美元的“白領(lǐng)”貴族。如,1984年入中國技術(shù)大學(xué)少年班的黃沁于1988年提前畢業(yè),赴美國麻省理工學(xué)院就讀研究生,畢業(yè)后受聘到華爾街某大型證券公司工作。在這個世界上證券業(yè)最發(fā)達的地方,他以統(tǒng)計和數(shù)學(xué)為基礎(chǔ),建立了自己的投資,現(xiàn)已升任該公司副總裁,主管對外投資工作。年僅27歲的黃沁是進入華爾街金融界高層領(lǐng)導(dǎo)的少數(shù)華人之一。
華爾街取才原則的轉(zhuǎn)向,從一個側(cè)面反映出證券期貨等金融業(yè)發(fā)展面臨的挑戰(zhàn)和未來的潮流。證券金融交易是信息量最大,信息敏感度最強、信息變化頻度最高的領(lǐng)域。隨著市場日趨復(fù)雜,數(shù)字已成為傳遞信息最直接的裁體,加上未來的經(jīng)濟是被覆蓋與籠罩的數(shù)字化經(jīng)濟,大量的數(shù)學(xué)與統(tǒng)計工具將在研究中發(fā)揮不可或缺的重要。能否把握那看似枯燥無味的數(shù)字所隱含的精微變化,成為決定未來競爭成敗的關(guān)鍵因素之一。
前年諾貝爾經(jīng)濟學(xué)獎授予在期權(quán)定價方面做出開拓性貢獻的經(jīng)濟學(xué)家和統(tǒng)計學(xué)家。他們在二十多年前就探索出具有劃意義的定價模型——布萊克.斯科爾期定價公式。本世紀20年代開設(shè)了股票期權(quán)品種,由于采用柜臺交易方式和缺乏標準化的設(shè)計合約,很難轉(zhuǎn)讓對沖,交易量不足稱道。1973年美國經(jīng)濟學(xué)家布萊克和斯科爾斯,引進概率統(tǒng)計上隨機變量函數(shù)的一些定理和積分求值,推導(dǎo)出不支付紅利的股票期權(quán)定價公式,從此期權(quán)有了明確科學(xué)的價格定位依據(jù),很快形成一個完整的市場,并迅速推廣到全世界,直至現(xiàn)在,期權(quán)占據(jù)著金融王國的重要位置。定價公式成為整個市場運轉(zhuǎn)的基礎(chǔ)。這個期權(quán)公式的定價思想所引發(fā)的金融革命表現(xiàn)在,預(yù)測遠期價格成為可能,不僅使期權(quán)為指數(shù)、貨幣、利率、期貨交易提供了全新的保值,投資手段,極大地豐富了金融市場,而且進一步推動了對各種金融產(chǎn)品的價值研究,提高了操作的理論水平。由此可以推斷,沒有布萊克.斯科爾斯定價模型,期權(quán)就不可能發(fā)展這么快,全球金融衍生品市場也就不可能有今天的高度發(fā)達,如今國外大型金融機構(gòu)在金融交易失利原因時,總是首先追究最初的定價是否存在漏洞和錯誤
建立一個模型就摘取領(lǐng)域的桂冠這一事實,體現(xiàn)了經(jīng)濟與統(tǒng)計數(shù)學(xué)密不可分的關(guān)系。據(jù)不完全統(tǒng)計,自1969年設(shè)立諾貝爾經(jīng)濟學(xué)獎以來的40多位獲獎?wù)咧校挠嬃拷?jīng)濟學(xué)家有23位,10位擔(dān)任過世界計量經(jīng)濟學(xué)會會長,有六位直接靠計量經(jīng)濟的和成果獲獎。借用統(tǒng)計數(shù)學(xué),將經(jīng)濟數(shù)學(xué)公式化,將經(jīng)濟行為定量化,已成為當今世界經(jīng)濟的熱門課題。
有關(guān)專家指出,統(tǒng)計學(xué),經(jīng)濟理論和數(shù)學(xué)這三者對于真正了解經(jīng)濟生活中的數(shù)量關(guān)系來說,都是必要的,但本身并非充分條件。三者結(jié)合起來,就是力量。數(shù)學(xué)給經(jīng)濟界帶來新的視角,新的觀念。抽象的數(shù)學(xué)工具一旦準確地切入市場,就顯得非常實用和有價值。二十多年來,指導(dǎo)期權(quán)交易的理論—定價模型得到廣大投資者的一貫遵循。沒有統(tǒng)計基礎(chǔ)、不懂定價公式含義的人要想在市場有出色表現(xiàn)將是十分困難的。
證券金融市場的風(fēng)險管理是個永恒的話題,投資者都想尋求收益回報,但又必須面對各種各樣的損失可能。市場到底存在哪些風(fēng)險,如何確定風(fēng)險的大小,如何才能實現(xiàn)收益最大化和風(fēng)險最小化,歷來都是受人關(guān)注的焦點和難點。自從1952年美國學(xué)者馬柯威茨運用數(shù)量創(chuàng)立證券組合理論以來,市場風(fēng)險的神秘色彩逐漸淡化,不再變得那么可怕和不可駕馭。
馬柯威茨組合理論的立足點是全面考慮“期望收益最大”和“不確定性(即風(fēng)險)最小”。它通過投資損失的概率分布和可能收益與預(yù)期收益的偏離程度(即我們統(tǒng)計學(xué)上的方差),發(fā)現(xiàn)投資者應(yīng)該同時按適當比例購買各種證券而不是一種證券,進行分散化投資,其收益才盡可能是確定的。通過數(shù)量得出的這種結(jié)論,迎合了投資者避風(fēng)險的需要。風(fēng)險管理能力的提高促進了基金的蓬勃。在短短的幾十年間,隨著量化研究的不斷深入,組合理論及其實際運用方法越來越完善,成為現(xiàn)資學(xué)中的主流工具。由于馬哥威茨證券組合選擇理論給金融投資和管理思想帶來革新,1990年他獲得了諾貝爾經(jīng)濟學(xué)獎。
眾所周知,量變引起質(zhì)變。數(shù)量關(guān)系的背后,牽扯著市場的穩(wěn)定與發(fā)展。金融業(yè)的現(xiàn)代化推動了統(tǒng)計與數(shù)理方法的應(yīng)用研究,反過來,當今世界的金融管理特別是防范金融風(fēng)險,也越來越要量化研究。早在1995年9月,美國斯但福大學(xué)經(jīng)濟學(xué)教授劉遵義就通過實證比較,數(shù)量分析和模糊評價等方興,預(yù)測出菲律賓、韓國、泰國、印尼和馬來西亞有可能發(fā)生金融危機。后來的事實果然如此。這從一個側(cè)面提醒我們,沒有完整、的分析預(yù)測工具,就可能在國際金融競爭中蒙受重大損失。只有加強對作為金融信息的各種變量的研究,才能提高對金融運行的認識,才能把握市場的發(fā)展動向。
經(jīng)濟理論的數(shù)學(xué)化和統(tǒng)計分析,使各種經(jīng)濟行為也越來越數(shù)量化。在金融領(lǐng)域也不例外。定價公式和組合理論地位的確立,就證明數(shù)量工具已發(fā)揮了不可磨滅的作用。有統(tǒng)計顯示,在西方金融市場,三分之一的人運用組合理論來投資,三分之一的人靠技術(shù)分析管理頭寸,另外三分之一的人仍在堅守基礎(chǔ)分析。雖然運用何種手段來指導(dǎo)決策是投資者個人偏好、觀念的,但組合理論和技術(shù)分析所運用的統(tǒng)計工具逐漸被認同,說明理性投資將成為市場的寵兒。由此我們不難理解華爾街選才的動機。
主觀意見和直覺判斷有很大的隨意性,顯然與現(xiàn)資決策的要求相去甚遠。對市場和價格進行定量研究,從而揭示客觀存在的數(shù)量依存關(guān)系,成為投資和管理決策的一項基礎(chǔ)工作。用統(tǒng)計工具處理各種證券金融數(shù)據(jù),可以比較全面地分析各種因素的力度。其主要表現(xiàn)在:
1 結(jié)構(gòu)分析:證券市場與匯率、利率變動和國民經(jīng)濟發(fā)展有多大的關(guān)聯(lián)度;單一證券與整個市場之間如何相互影響,市場指數(shù)設(shè)計是否合理;證券與期貨價格走勢是否相互制約;同一類證券有沒有一定的連動關(guān)系。
2 價值預(yù)測:分析未來證券發(fā)行和上市價格的理論定位,確定金融衍生證券的價格,分析預(yù)測證券期貨的價格走勢,進行投資決策等。
3 政策評價:市場系統(tǒng)風(fēng)險的預(yù)警及控制,探討不同的組合投資效果。
4 檢驗:證券價格能否反映所有的信息,市場的有效性實證檢驗;各種技術(shù)指標的適用性和優(yōu)化處理,周期效應(yīng)的對比。
從以上可看出,量化研究有助于搞好風(fēng)驗管理,設(shè)計投資組合,選擇交易時機,評估市場特性。統(tǒng)計工具在證券市場的大量,對交易技術(shù)的升級換代,管理水平的提高做出了特殊貢獻。現(xiàn)在,電腦交易系統(tǒng)在國外大行其道,依據(jù)不同要求設(shè)計的模型軟件層出不窮,只要把數(shù)據(jù)輸入電腦中,投資者根據(jù)分析結(jié)果隨時制訂和調(diào)整投資計劃。
投資者競爭的優(yōu)勢不再停留在信息的收集上,而是綜合處理信息的能力。誰的模型從總量上與趨勢上能更合理、地分析市場,誰就能掌握主動。
雖然統(tǒng)計學(xué)是一門基于數(shù)學(xué)的學(xué)科,但是它實在很枯燥!嚴格地說——如果你曾經(jīng)不得不大量地研究雙邊置信區(qū)間、學(xué)生T檢驗以及卡方分布測試,有時你會覺得很難消化這些知識點。
一般來說,我是喜歡物理學(xué)和力學(xué)的,因為很多時候只需簡單地分析一個事例,你就能核實現(xiàn)狀。當你計算蘋果從樹上落下的速度及方向時,如果你的結(jié)果是蘋果應(yīng)以每小時1224英里垂直向上拋出,也就是實際上你已經(jīng)在頭腦中核實過結(jié)果了。
統(tǒng)計學(xué)的優(yōu)勢在于易理解且具合理性;而劣勢在于它的奇特性。無論如何,這篇文章的話題不會讓你覺得枯燥。因為大部分的話題都是有形的、屬于重要的數(shù)據(jù)資料,你應(yīng)有精力去慢慢摸索。
statistics(from wired.com)
統(tǒng)計學(xué):黑暗的科學(xué)
統(tǒng)計學(xué)是所有學(xué)科領(lǐng)域中最易被邪惡勢力濫用的科學(xué)。
統(tǒng)計學(xué)可以同邪惡行徑相比較是因為在使用不當時,這門學(xué)科的分支就會被推斷出各種無意義或者不真實的裙帶關(guān)系(參見本文末尾的實例)。如果政治家或其它非專業(yè)人士掌控了統(tǒng)計學(xué),那么他們就可以操縱一些重要決定。一般來說,基于錯誤總結(jié)的壞決策從來不受好評。
也就是說,使用得當時,統(tǒng)計學(xué)無疑非常有用且有益。而對于強權(quán)勢力者來說,他們會將統(tǒng)計學(xué)應(yīng)用于一些非法途徑,甚至是一些純粹無用的渠道。
統(tǒng)計學(xué)——所謂的爭議
我已準備好作一個緊湊的總結(jié),然而我注意到維基百科已經(jīng)對統(tǒng)計學(xué)作了定義,而且語言幾近詩歌體系。如下:
統(tǒng)計學(xué)是應(yīng)用數(shù)學(xué)的一個分支,主要通過收集數(shù)據(jù)進行分析、解釋及呈現(xiàn)。它被廣泛應(yīng)用于各個學(xué)科領(lǐng)域,從物理學(xué)到社會科學(xué)到人類科學(xué);甚至用于工商業(yè)及政府的情報決策上。(Courtesy Wikipedia.org)
這真的是一段很感人的文章。特別是最后那句“用于情報決策上”。
當然,作者忘記添上“在游戲設(shè)計領(lǐng)域”,但是我們原諒他對這一蓬勃發(fā)展的新興行業(yè)的無知。
以下為我自己撰寫:
統(tǒng)計學(xué)是應(yīng)用數(shù)學(xué)的一個分支,它涉及收集及分析數(shù)據(jù),以此確定過去的發(fā)展趨勢、預(yù)測未來的發(fā)展結(jié)果,獲得更多我們需了解的事物。(Courtesy Tylerpedia)
如果將此修改為適用游戲設(shè)計領(lǐng)域,那可以如此陳述:
統(tǒng)計學(xué)為你那破損的機制及破碎的設(shè)計夢指引了一條光明大道。它為你有意義的設(shè)計決策提供了穩(wěn)定且具有科學(xué)性的數(shù)據(jù)。
須知的事實
統(tǒng)計學(xué)同其它硬科學(xué)一樣深奧且復(fù)雜。如同第一部分的內(nèi)容一樣,本文只涉及一些精選的話題,我自認為只要掌握這些就足夠了。
再次突擊測驗
很抱歉我要采取另一項測試了。別討厭出題目的人,討厭測試吧。
Q1a)假設(shè)有20名測試員剛剛完成新蝸牛賽跑游戲《S-car GO!》中的一個關(guān)卡。你得知完成一圈的時間最少為1分24秒,最多為2分32秒。你期望的平均時間為2分鐘左右。請問這個測試會成功嗎?
Q1b)在同一關(guān)卡中你收集了過多的數(shù)據(jù),在分析后得出這樣的結(jié)果:平均值=2分5秒;標準差=45秒。請問你會滿意這個答案嗎?
Q2)你設(shè)計了一款休閑游戲,不久就要發(fā)行。在最后的QA階段,你分布了一個測試版本,然后收集了所有的數(shù)據(jù)作為試驗對象。你記錄了1000多位玩家的分數(shù),還有100多位特殊的玩家的分數(shù)(有些玩家允許重復(fù)玩游戲)。運算這些數(shù)據(jù)可知平均分為52000pts,標準差為500pts。請問這游戲可以發(fā)行了嗎?
Q3)你設(shè)計了一款RPG游戲,然后收集數(shù)據(jù)分析新的玩家從關(guān)卡1到關(guān)卡5的游戲進程會有多快。收集的數(shù)據(jù)如下所示:4.6小時、3.9小時、5.6小時、0.2小時、5.5小時、4.4小時、4.2小時、5.3小時。請問你可以計算出平均值和標準差嗎?
總體和樣本
統(tǒng)計學(xué)的基礎(chǔ)為分析數(shù)據(jù)。在分析數(shù)據(jù)的時候,你需要了解兩個概念:
1.總體:
總體是指某一領(lǐng)域中所有需要測量的對象。總體是抽象的,只在你需要測量時候才會具體化。比如,你想了解人們對某一特定問題的看法。那你就可以選擇地球上所有的人,或者愛荷華州所有的人或者只是你街道附近所有的人作為一個總體。
2.樣本:
樣本實際上就是指抽取總體中部分用于測量的對象。原因很明顯,因為我們很難收集到所有總體的數(shù)據(jù)。相對來說,你可以收集部分總體的數(shù)據(jù)。這些就是你的樣本了。
正確性及樣本容量
統(tǒng)計學(xué)結(jié)果的可靠性通常由樣本容量的大小決定。
我們完美的想法是希望樣本容量就是我們的總體——也就是說,你想整個收集全部涉及到的數(shù)據(jù)!因為樣本越少,你就需要估計可能的趨勢(這是一種數(shù)學(xué)性的推斷)。而且,數(shù)據(jù)點越多越好;你最好能建立一個大型的總體而不是小型的。
例如,相對于調(diào)查10000個初中生對《Fruit Roll-Ups》的感想,試想下調(diào)查人員能否詢問到每一個學(xué)生。100萬個的數(shù)目過于龐大,做不到的話,10萬個也不錯。仍然做不到,好吧,10000個剛剛好。
由于時間和費用的關(guān)系,通常呈現(xiàn)出的研究結(jié)果都是基于樣本所做的調(diào)查。
1.統(tǒng)計學(xué)的常識性規(guī)則:
你無法通過一個數(shù)據(jù)點來預(yù)測整個趨勢。如果你知道我喜歡巧克力冰淇淋,你不能總結(jié)所有的Sigmans都喜歡巧克力冰淇淋。如果現(xiàn)在你詢問我家庭中的許多成員,然后你可能會得出關(guān)于他們的想法這類比較合理的結(jié)論,或者你至少知道是否能總結(jié)出一個合理的推斷。
廣泛的分布圖(重點!)
由于種種原因,只有《The Big Guy》可以解釋生活中的許多事情傾向于同一模式發(fā)展或者分布。
最普遍的分布也有一個合理的名稱——“正態(tài)分布”。是的,無法匹配這一分布圖的都為非正態(tài),所以有點怪異(需要適當避免)。
正態(tài)分布也稱“高斯分布”,主要因為“正態(tài)”一詞聽起來不夠科學(xué)。
正態(tài)分布也稱為“鐘形曲線”(又稱貝爾曲線),因為其曲線呈鐘形。
bell curve(from gamasutra)
鐘形曲線的突出特點是大多數(shù)的總體均分布在平均值周圍,只有個別數(shù)據(jù)散落在一些極限位置(主要指那些偏高或偏低的數(shù)據(jù))。中間成群的數(shù)據(jù)構(gòu)成了鐘的外形;而那些偏高數(shù)據(jù)或偏低數(shù)據(jù)分布在鐘的邊緣。
我們周圍有上百萬的不同事例呈現(xiàn)出正態(tài)分布的景象。如果你測量了你所生活的城市中所有人的身高,結(jié)果可能呈現(xiàn)正態(tài)分布。這表明,只有少數(shù)個體屬于非正常的矮,少數(shù)個體屬于姚明那樣的身高,而大多數(shù)人會比平均身高多幾英寸或者矮幾英寸。
鐘形曲線同樣極典型地適用于調(diào)查人們的技能水平。以運動為例——極少部分人在這一領(lǐng)域為專業(yè)人士,大多數(shù)的人都還過得去,只有少部分的人實在不擅長,所以沒有被選為隊員(比如我)。
其它分布圖
盡管正態(tài)分布圖很完美,但它并非我們周圍唯一的一種分布圖。只是它比較普遍地存在。
比如有些其它的分布圖直接與賭博及游戲設(shè)計有關(guān),只要看下扔骰子的概率分布圖,這種情況下出現(xiàn)了如下的d6情形及2d6情形:
D6 distribution(from gamasutra)
2d6 distribution(from gamasutra)
現(xiàn)在我想說的是第一個分布圖看起來一點也不像鐘形曲線,而第二幅圖開始呈現(xiàn)出了鐘的形狀。
平均值
這一小塊內(nèi)容可以說是這篇冗長的文章中的一個小插曲。這塊自我指涉的小內(nèi)容的存在只有一個目的:提醒你什么是“平均值”。這塊自我指涉且迂腐的小內(nèi)容將被動地提醒你平均值是指一整套的數(shù)學(xué)平均數(shù)據(jù)。
方差和標準偏差
我們必須理解什么是方差和標準偏差,并且它們也具有許多有形的價值。除了能夠幫助我們做出有價值的數(shù)據(jù)總結(jié)外,這兩個術(shù)語還能夠幫助我們更明智地陳述分布問題。比起說“中間聚集了大量的數(shù)據(jù)點”,我們可以換個說法,即“68.2%的樣本是一個平均值的標準偏差”。
sigman(from gamasutra)
方差和標準偏差是相互聯(lián)系的,它們都能夠測量一個元素,即分散數(shù)據(jù)。直觀地說,較高的方差和標準偏差也就意味著你的數(shù)據(jù)分散于四處。當我在投擲飛鏢時,我便會獲得一個較高的方差。
我們可以通過任何數(shù)據(jù)集去估算方差和標準偏差。我本來應(yīng)該在此列出一個方程式的,但是這似乎將違背“聽起來不像是一本教科書”的規(guī)則。所以我這里不引用公式,而是采用以下描述:
標準偏差:樣本或人口統(tǒng)計的平均數(shù)值偏離平均值的程度。由希臘之母σ(sigma)表示。
舉個例子來說吧,你挑選了100個人并測試他們完成你的新游戲第一個關(guān)卡分別用了多長時間。讓我們假設(shè)所有數(shù)據(jù)的平均值是2分鐘30秒而標準偏差則是15秒。這一標準偏差表明游戲過程中出現(xiàn)了集聚的情況。也就是平均來看,每個游戲過程是維持在平均值2.5分鐘中的±0.25分鐘內(nèi)。從中看來這一數(shù)值是非常一致的。
這意味著什么以及為何你如此在乎這一數(shù)值?答案很簡單。假設(shè)你不是獲得上述結(jié)果,而是如下結(jié)果:
平均值=2.5分鐘(如上)
σ=90秒=1.5分鐘
所以我們現(xiàn)在擁有相同的平均值以及不同的標準偏差。這套數(shù)值表明玩家所用的游戲時間差別較大。90秒鐘的游戲時間背離了平均游戲時間。而因為游戲時間是2.5分鐘,所以這種偏差過大了!基于各種設(shè)計目的,出現(xiàn)這種較大的差值都不是設(shè)計師想看到的結(jié)果。
而如果我們所說的游戲時間是15分鐘而標準偏差是90秒(1.5分鐘)的話差別變更大了。
通過一個小小的標準偏差便能夠衡量一致性。標準偏差比率除以平均值便能夠獲得相關(guān)數(shù)值。就像在第一個例子中,15秒/150秒=10%,而在第二個例子中,90秒/150秒=60%。很明顯,60%的標準偏差真是過大了!
但是并不是說較大的標準偏差“總是”糟糕的。有時候設(shè)計師在進行測量時反而希望看到較大的標準偏差。不過大多數(shù)情況下還是糟糕的,因為這就意味著數(shù)值的差異性和變化性較大。
更重要的是,標準偏差的計算將告訴你更多有關(guān)游戲/機制/關(guān)卡等內(nèi)容。以下便是通過測量標準偏差能夠獲得的有用的數(shù)據(jù):
1.玩家玩每個關(guān)卡的游戲時間
2.玩家玩整款游戲的游戲時間
3.玩家打敗一個經(jīng)典的敵人需要經(jīng)歷幾次戰(zhàn)斗
4.玩家收集到的貨幣數(shù)量(游戲中有一個意大利水管工)
5.玩家收集到的吊環(huán)數(shù)量(游戲中有一個快速奔跑的藍色刺猬)
6.在教程期間時間控制器出現(xiàn)在屏幕上
誤差
誤差與統(tǒng)計結(jié)論具有密切的關(guān)系。就像在每一次的蓋洛普民意測驗(游戲邦注:美國輿論研究所進行的調(diào)查項目之一)中也總是會出現(xiàn)誤差,如±2.0%的誤差。因為民意調(diào)查總是會使用樣本去估算人口數(shù)量,所以不可能達到100%精準。零誤差便意味著結(jié)果極其精確。當你所說的人口數(shù)量大于你所采取的樣本數(shù)量,你便需要考慮到誤差的可能性。
如果你是利用全部人口作為相關(guān)數(shù)據(jù)來源,你便不需要考慮到誤差——因為你已經(jīng)擁有了所有的數(shù)據(jù)!就像我問街上的任何一個人是喜歡象棋還是圍棋,我便不需要考慮誤差,因為這些人便是我所報告的全部數(shù)據(jù)來源。但是如果我想基于這些來自街上行人的數(shù)據(jù)而對鎮(zhèn)上的每個人的答案做出總結(jié),我便需要估算誤差值了。
你的樣本數(shù)量越大,最終出現(xiàn)的誤差值便會越小。Mo data is bettuh(越多數(shù)據(jù)越好)。
置信區(qū)間
你可以使用推論統(tǒng)計為未來數(shù)據(jù)做出總結(jié)。一個非常有效的方法便是估算置信區(qū)間。理論上來看,置信區(qū)間與標準偏差密切相關(guān),即通過一種數(shù)學(xué)模式去表示我們多么確定某一特定數(shù)據(jù)是位于一個特定范圍內(nèi)。
置信區(qū)間:即通過一種數(shù)學(xué)方法傳達“我們帶著A%的置信保證B%的數(shù)據(jù)將處于C和D價值區(qū)間。”
雖然這個定義很繞口,但是我們必須知道,只要具有一定的自信,我們便能夠造就任何價值。讓我以之前愉快但卻缺乏滿足感的工作為例:
我過去是從事應(yīng)力分析和飛機零部件的設(shè)計工作。如果你知道,或者說你必須知道,飛機,特別是商業(yè)飛機的建造采用的是現(xiàn)代交通工具中最嚴格的一種形式。人們總是會擔(dān)心機翼從機身上脫落下來。
作為飛機建造工程師,我們所采取的一種方法便是基于材料優(yōu)勢屬性設(shè)置一個高置信區(qū)間。關(guān)機設(shè)計的傳統(tǒng)置信區(qū)間便是“A基值許可”,即我們必須95%地確信裝運任何一種特殊材料都有99%的價值落在一個特定的價值區(qū)間內(nèi)。然后我們將根據(jù)這一價值與可能發(fā)生的最糟糕的空氣條件進行設(shè)計,并最終確立一個最佳安全元素。
當你真正想了解某種數(shù)據(jù)值時,置信區(qū)間便是一種非常有幫助的方法。幸運的是在游戲中我們并不會扯到生死,但是如果你想要平衡一款主機游戲,你便需要在設(shè)計過程中融入更多情感和直覺。計算置信區(qū)間能夠幫助你更清楚地掌握玩家是如何玩你的游戲,并更好地判斷游戲設(shè)置是否可行。
不管你何時想要計算置信區(qū)間,備用統(tǒng)計規(guī)則都是有效的:越多數(shù)據(jù)越好。你的樣本中擁有越多數(shù)據(jù)點,你的置信區(qū)間也就越棒!
你不可能做到100%的肯定
這便引出了另一個統(tǒng)計規(guī)則:
并不存在100%之說:你永遠不可能創(chuàng)造一個100%的置信區(qū)間。你不可能保證通過推論統(tǒng)計便能夠預(yù)測一個數(shù)據(jù)點具有一個特定的價值。
當玩家在《魔獸世界》中挑戰(zhàn)任務(wù)時,唯一可以確定的只有死亡,稅金以及不可能找到最后的Yeti Hide。所以玩家只需要接受這些事實并勇往直前便可。
濫用
我在之前提過,統(tǒng)計是一種邪惡的技能。為了更好地解釋原因,我寫下了這篇彈頭式愛情詩:
十四行詩1325:美好的統(tǒng)計,讓我細數(shù)下我濫用你的每種方式:
1.誤解
2.未明確置信區(qū)間
3.只因為不喜歡而丟棄了有效的結(jié)論
4.基于有缺陷的數(shù)據(jù)而做出總結(jié)
5.體育實況轉(zhuǎn)播員的失誤——混淆了概率和統(tǒng)計錯誤
6.基于一些不相干元素做出總結(jié)
誤解
人們一直在誤解統(tǒng)計報表。我知道,這一點讓人難以置信。
未明確置信區(qū)間或誤差
置信區(qū)間和誤差是信息中非常重要的組成部分。在過去30天內(nèi)有43%的PC擁有者購買了一款可下載的游戲(誤差為40%)與同樣的陳述但存在2%的誤差具有巨大的差別。而如果遺漏了誤差,便只會出現(xiàn)最糟糕的情況。我們需要始終牢記,小樣本=高誤差。
只因為偏見而丟棄了有效的結(jié)論
操作得當?shù)脑挘y(tǒng)計數(shù)據(jù)是不會撒謊的。但是人們卻一直在欺騙自己。我們經(jīng)常在政治領(lǐng)域看到這類情況的出現(xiàn),人們總是因為結(jié)論不符合自己預(yù)期的要求而忽視統(tǒng)計數(shù)據(jù)。在焦點小組中亦是如此。當然了,政治領(lǐng)域中也常常出現(xiàn)濫用統(tǒng)計結(jié)論的現(xiàn)象。
基于有缺陷的數(shù)據(jù)而做出總結(jié)
這種情況真是屢見不鮮,特別是在市場調(diào)查領(lǐng)域。你的統(tǒng)計結(jié)果總是會受到你所獲得的數(shù)據(jù)的影響。如果你的數(shù)據(jù)存在缺陷,那么你所獲得的結(jié)果便不會有多少價值。得到有缺陷的數(shù)據(jù)的原因多種多樣,包括失誤和嚴重的操作問題等。提出含沙射影式問題便是引出能夠支持各種結(jié)論(就像你所希望的那樣)的缺陷數(shù)據(jù)的一種簡單方法。“你比較喜歡產(chǎn)品X,還是糟糕的產(chǎn)品Y?”將快速引出反彈式回答,如“95%的費者會選擇產(chǎn)品X!”
體育實況轉(zhuǎn)播員的失誤
體育實況轉(zhuǎn)播員可以說是當今時代的巫醫(yī)。他們會收集各種統(tǒng)計,概率以及情感,然后將其混合在一起而創(chuàng)造出一些糟糕的結(jié)果。如果你想看一些圍繞著沒有根據(jù)的結(jié)論的統(tǒng)計,你只要去觀看一款足球比賽便可。
例如一個廣播員會說“A隊在最后5局游戲中并未阻止B隊的進攻。”這種模糊的結(jié)論是關(guān)于A隊不大可能阻止B隊的進攻,而不是他們在最后5局游戲中成功阻攔了B隊。但是你也可以反過來說——也許他們將會這么做,因為他們之前從未阻擋過任何對手。
但是事實卻在于根本不存在足夠的信息能夠支持任何一種說法。也許這更多地取決于一種概率。阻擋進攻的機會是否就取決于一方在之前的游戲中是否這么做過?它們也許是兩種相互獨立事件,除非彼此間存在著互相影響的因素。
但是這并不是說所有體育運動的結(jié)論都存在著缺陷。就像對于棒球來說統(tǒng)計數(shù)據(jù)便非常重要。有時候統(tǒng)計分析也將影響著球的投射線或者擊球點等元素。
最終還是取決于數(shù)據(jù):當你擁有足夠的數(shù)據(jù)時,你便能夠獲得更好的統(tǒng)計結(jié)論。棒球便能夠提供各種數(shù)據(jù):每一賽季大約會進行2百多場比賽。但是足球比賽的場次卻相對地少了很多。所以我們最終所獲得的誤差也會較大。但是我并不會說統(tǒng)計對于足球來說一點用處都沒有,只是我們很難去挖掘一些與背景相關(guān)的有用數(shù)據(jù)。
基于一些不相干元素做出總結(jié)
人們始終都在誤解統(tǒng)計報表。比起使用對照關(guān)系,我們總是更容易推斷出一些并不存在的深層次的關(guān)系。我最喜歡的一個例子便是著名的飛行面條怪物信仰(游戲邦注:是諷刺性的虛構(gòu)宗教)的《Open Letter to the Kansas School Board》中的“海盜vs.全球變暖”圖表:
venganza.org/about/open-letter/
我們是否能夠開始解答問題了?
問題1的答案—-關(guān)卡時間
這一問題的答案很簡單:你未能獲得足夠的信息去估算平均值。因為在1:24與2:32范圍中波動的價值并不意味著它們的平均值就是2分鐘。(單看這兩個數(shù)值的平均值是1.97分鐘,但是我們卻不能忽視其它18個結(jié)果!)你必須掌握了所有的20個結(jié)果才能估算平均值,除此之外你還需要估算標準偏差值。
問題2的答案—-后續(xù)關(guān)卡時間
這時候你可能不會感到滿足,因為標準偏差值過高了,超過平均值的40%。如此看來你的關(guān)卡中存在著過多變量。同時這里也存在著一些可利用的潛在元素,并且技能型玩家能夠發(fā)揮其優(yōu)勢而造福自己。或者,你也可以嚴厲懲罰那些缺少技能的玩家。而作為游戲設(shè)計師,你最終需要做的便是判斷這些結(jié)果(居于高度變量)是否符合預(yù)期要求。
問題2的答案—-標準偏差值
統(tǒng)計只是你所采用的一種方法,你同時還需要懂得如何進行游戲設(shè)計。如此,過于接近的計數(shù)分組使得我們總是能夠獲得一個較低的標準偏差值(500/52000=1%),這就意味著你所獲得的分數(shù)幾乎沒有任何差別,也就是說在最終游戲結(jié)果中玩家的不同技能并不會起到任何影響作用。而當玩家發(fā)現(xiàn)自己技能的提高并不會影響游戲分數(shù)的發(fā)展時,便會選擇退出游戲。
所以在這種情況下你更希望看到較高的標準偏差,如此游戲分數(shù)才能隨著技能的提高而提高。
問題3的答案—-游戲時間
可以說這是一個很難獲取的數(shù)值,不過它卻說明了數(shù)據(jù)收集中的一個要點:你需要警惕那些看起來是錯誤的數(shù)據(jù)。就像0.2小時看起來就有問題。也許這是排印錯誤,或者是設(shè)備故障所造成的,誰知道呢。但是不管怎樣在進行各種計算之前你都需要堅定不移地說服自己0.2小時是一個有效數(shù)據(jù),或者你也可以選擇將其丟棄而基于剩下的數(shù)據(jù)點進行估算。
其它有趣的內(nèi)容
為了控制本文篇幅,我不得不略過許多有趣的主題。我只要在此強調(diào)理解統(tǒng)計不僅能夠幫助你更好地進行游戲設(shè)計,同時也能夠幫助你做出消費者決策,投票決策或者財政決策等。我敢下23.4%的賭注保證我所說的內(nèi)容中至少有40%的內(nèi)容是正確的。
對于設(shè)計師而言,統(tǒng)計能夠幫助他們獲取來自有記錄的游戲過程(樣本)的相關(guān)數(shù)據(jù),并幫助他們?yōu)楦蟮奈从涗浀挠螒蜻^程(人口統(tǒng)計)做出總結(jié)。
在實踐中學(xué)習(xí)
例如在我剛完成的游戲中,我便是通過記錄游戲過程的相關(guān)數(shù)據(jù),并圍繞著源自這些數(shù)據(jù)的平均值和標準偏差去設(shè)定游戲挑戰(zhàn)關(guān)卡。我們將中等難度等同于平均值,較容易的等同于平均值減去一定量的標準偏差,而較困難的等同于平均值加上一定量的標準偏差。如果我們能夠收集到盡可能多的數(shù)據(jù),我們的統(tǒng)計便會越精準。
就像概率論一樣,當你的項目范圍變得越來越大時,統(tǒng)計也會變得越來越有幫助。很多時候你可以通過自己的方法進行摸索,而無需使用任何形式理論。但是隨著游戲變大,用戶群體的壯大以及預(yù)算的擴大,你便需要做好面對一個不平衡,且完全憑直覺的游戲設(shè)計中存在固有缺陷的準備。
關(guān)鍵詞: 醫(yī)學(xué)碩士;學(xué)位論文;數(shù)理統(tǒng)計;調(diào)查
摘 要:目的 分析醫(yī)學(xué)碩士研究生學(xué)位論文中數(shù)理統(tǒng)計應(yīng)用情況. 方法 隨機抽取2000/2001年100位河南醫(yī)科大學(xué)應(yīng)屆醫(yī)學(xué)碩士學(xué)位論文初稿,對其中數(shù)理統(tǒng)計應(yīng)用情況進行統(tǒng)計分析. 結(jié)果 論文中采用單因素設(shè)計者占94.0%,多因素設(shè)計占6.0%,應(yīng)用正確率為96.6%;論文中使用經(jīng)典基本數(shù)理統(tǒng)計方法為97.9%,統(tǒng)計學(xué)方法的正確應(yīng)用率為75.7%;應(yīng)用參數(shù)統(tǒng)計時出現(xiàn)的主要問題是未進行適用條件判斷,而應(yīng)用非參數(shù)統(tǒng)計時出現(xiàn)的主要問題則是推斷結(jié)論有誤. 結(jié)論 應(yīng)加強碩士學(xué)位論文的數(shù)理統(tǒng)計設(shè)計和審查工作.
Keywords:medical master graduates;thesis;statistics;in-vestigation
Abstract:AIM Analysis case of using statistical theory in the thesis of2000~2001master graduates.METHODS 100thesis of this year’s medical master graduates in Henan Medi-cal University were taken out randomly.Their theoretical scores and practical application of health statistics in their thesis were analyzed.RESULTS Master graduate has grasped the theory of health statistics preferably.The abso-lute majority,namely97.9%of the total students,have used the basic statistic method in their thesis,75.7percent could use statistic method correctly.The main problem arising in using parametric test is that they hadn’t judged the applying condition,while in non-parametric test is that the conclusion is wrong.CONCLUSION Ought to strengthen checkup health statistical in the thesis of master graduates.
0 引言
數(shù)理統(tǒng)計的應(yīng)用正確與否是論文科學(xué)性的重要標志.近年在醫(yī)學(xué)學(xué)術(shù)期刊(包括國內(nèi)著名的核心期刊)上發(fā)表的論著,數(shù)理統(tǒng)計方面還存在問題,甚至導(dǎo)出錯誤的結(jié)論[1-4] .數(shù)理統(tǒng)計作為一門應(yīng)用學(xué)科已成為醫(yī)學(xué)碩士研究生學(xué)位課程的主要內(nèi)容之一,越來越受到碩士研究生的重視.為了解醫(yī)學(xué)碩士生學(xué)位論文中數(shù)理統(tǒng)計的應(yīng)用情況,為課題的統(tǒng)計設(shè)計和論文審查提供科學(xué)依據(jù),為教學(xué)改革提供參考,作者隨機抽取河南醫(yī)科大學(xué)應(yīng)屆碩士學(xué)位論文100篇,對其數(shù)理統(tǒng)計應(yīng)用情況進行分析.
1 材料和方法
2000/2001年河南醫(yī)科大學(xué)共有醫(yī)學(xué)碩士研究畢業(yè)生222人,應(yīng)用隨機數(shù)表隨機抽取100名碩士研究生學(xué)位論文的初稿作為研究對象,對實驗設(shè)計類型、使用的統(tǒng)計學(xué)分析方法及使用的統(tǒng)計學(xué)工具,存在的問題等進行調(diào)查.結(jié)果推斷利用SAS(6.12)統(tǒng)計分析系統(tǒng)進行分析.
2 結(jié)果
2.1 實驗設(shè)計類型 碩士學(xué)位論文中采用單因素設(shè)計的比重較大,占94.0%,統(tǒng)計學(xué)設(shè)計正確率較高(Tab1).
2.2 統(tǒng)計學(xué)方法 論文中使用經(jīng)典的基本統(tǒng)計學(xué)方法的占絕對多數(shù),為97.9%(856/874),統(tǒng)計學(xué)方法的正確應(yīng)用率為75.7%,且不同的統(tǒng)計學(xué)方法之間的正確應(yīng)用率存在著差別.應(yīng)用參數(shù)統(tǒng)計方法者518次,應(yīng)用正確者357次,正確應(yīng)用率為68.9%;應(yīng)用非參數(shù)統(tǒng)計方法者346次,應(yīng)用正確者305次,正確應(yīng)用率為88.1%.對參數(shù)統(tǒng)計方法的正確應(yīng)用率低于非參數(shù)統(tǒng)計方法(χ2 =35.8,P
表1 碩士論文的實驗設(shè)計類型及正確應(yīng)用情況 略
表2 論文中應(yīng)用的統(tǒng)計學(xué)方法分布及正確應(yīng)用情況 略
表3 獲取結(jié)果時使用的計算工具 略
2.3 數(shù)理統(tǒng)計問題 論文中存在的問題在參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計中的構(gòu)成不同,應(yīng)用參數(shù)統(tǒng)計時出現(xiàn)的問題是未進行使用條件判斷者159次,未正確應(yīng)用統(tǒng)計方法者9次,推斷結(jié)論有誤者19次;而應(yīng)用非參數(shù)統(tǒng)計時出現(xiàn)問題是未進行使用條件判斷者8次,未正確應(yīng)用統(tǒng)計方法者14次,推斷結(jié)論有誤者21次(兩者相比χ2 =48.31,P
3 討論
在碩士研究生的基礎(chǔ)理論教學(xué)中,開設(shè)數(shù)理統(tǒng)計學(xué)的主要目的是為了指導(dǎo)研究生正確地應(yīng)用統(tǒng)計學(xué)的原理與方法,解決醫(yī)學(xué)研究中如何科學(xué)地進行科研資料的搜集、整理和分析推斷問題.傳統(tǒng)的經(jīng)典的和基本的統(tǒng)計學(xué)理論與方法仍然是當前碩士研究生進 行科研工作的統(tǒng)計學(xué)方面的主要工具.論文中采用的完全隨機、配對及配伍等單因素設(shè)計的比重較大占94.0%,多因素設(shè)計占的比重較少為6.0%,總的來說,其統(tǒng)計學(xué)設(shè)計的正確率是比較高的.說明學(xué)生對統(tǒng)計學(xué)設(shè)計理論比較重視并能正確應(yīng)用.論文中使用經(jīng)典的基本統(tǒng)計學(xué)方法占絕對多數(shù)為97.9%(856/874),主要為t檢驗、F檢驗、χ2 檢驗及秩和檢驗等,這與這些方法成熟、簡單明了且實用性極強有很大關(guān)系,而近些年來新發(fā)展的比較前沿的統(tǒng)計學(xué)分析方法[5-12] ,由于對設(shè)計要求嚴格,使用過程復(fù)雜,非專業(yè)人員在短時間內(nèi)難以掌握而實際應(yīng)用較少.這提示在今后的研究生教學(xué)過程中,除應(yīng)繼續(xù)進行基礎(chǔ)部分內(nèi)容的學(xué)習(xí)外,還應(yīng)加強新的統(tǒng)計學(xué)方法和使用條件的教學(xué)力度.
論文中以基本的經(jīng)典的統(tǒng)計學(xué)方法為主,但實際應(yīng)用時的正確應(yīng)用率僅為75.7%,且不同的統(tǒng)計學(xué)方法之間的正確應(yīng)用率存在著差別,對參數(shù)統(tǒng)計方法的正確應(yīng)用率低于非參數(shù)統(tǒng)計方法.經(jīng)進一步分析,應(yīng)用參數(shù)統(tǒng)計時出現(xiàn)的主要問題是未進行適用條件判斷,而應(yīng)用非參數(shù)統(tǒng)計時出現(xiàn)的主要問題則是推斷結(jié)論有誤.作為一門應(yīng)用學(xué)科,數(shù)理統(tǒng)計學(xué)有著其獨特的邏輯性,概念多、公式多且連貫性強,眾多的公式和分析方法既有聯(lián)系又有區(qū)別,同時有著嚴格的適用條件.傳統(tǒng)的教材編寫和教學(xué)重點是統(tǒng)計學(xué)方法的計算技巧,其結(jié)果容易將學(xué)生引導(dǎo)到僅注重學(xué)習(xí)統(tǒng)計計算方法上,忽略了各種方法的適用條件和對資料的綜合分析.所以t檢驗、F檢驗等經(jīng)典的統(tǒng)計方法雖看似簡單,但要正確應(yīng)用到實際工作中,對學(xué)生來說仍有相當難度.秩和檢驗等非參數(shù)統(tǒng)計由于其適用條件較參數(shù)統(tǒng)計寬松,使得其正確應(yīng)用率高于參數(shù)檢驗,而并非學(xué)生對非參數(shù)檢驗掌握的比參數(shù)檢驗更好.
隨著計算機技術(shù)和統(tǒng)計軟件的完善與普及,各種復(fù)雜的統(tǒng)計計算不必再用手工計算.本次研究表明大部分人(91.0%)通過應(yīng)用著名的統(tǒng)計分析軟件SPSS及SAS獲取結(jié)果,這些結(jié)果比手工計算的更準確、更規(guī)范,所以各種統(tǒng)計方法的計算過程大可不必細致介紹,而要重點介紹各種數(shù)理統(tǒng)計方法的使用條件,加強資料分析實踐,提高碩士生解決實際問題的能力.
參考文獻
[1]Wang GS,Qian GS,Yang XJ,Huang CJ,Wei H.The statis-tics of application of laboratory animals in clinical research pa-pers in China [J].Di-san Junyi Daxue Xuebao(Acta Acad Med Militaris Tertiae),1997;19(2):163-165.
[2]Chen P,Zu SX.The analysis of statistical techniques used in the Chinese journal of clinical medicine [J].Anhui Yike Daxue Xue-bao(Acta Univ Med Anhui),1998;33(2):108-110.
[3]Fang JQ,Ling L,Zhang MR.Frequently appearing statistical mistakes in recent medical articles and relevant suggestions [J].Zhongshan Yike Daxue Xuebao(Acad J Sun Yat-sen Univ Med Sci),1999;20(4):314-318.
[4]Wang Q,Zhang BH.Current use of statistical methods in five core Chinese medical journals [J].Zhonghua Yixue Zazhi(Natl Med J China),1998;78(3):230-233.
[5]Zhang GK,Yao C,Xu YY.Contrast between two schools of thought on hypothesis test [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(2):85-87.
[6]Shang L,Xu YY,Hou RL,Zhang SP,Zhou YR,Chen CS.Comparison of different approaches of fitting centile curves for growth standard [J].Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ),2000;21(6):676-678.
[7]Li XS,Ni ZZ.On the problems of fitting linear regression mo-dels for hierachically structured data in medical research [J].Huaxi YikeDaxueXuebao(J WestChina Univ Med Sci),1999;30(1):59-62.
[8]Li XS,Zhang WT,Ni ZZ.Multilevel models in analysis of crossover design [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(5):273-275.
[9]Li XS,Liu QY,Ni ZZ.Meta analysis using multilevel models [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999:16(3):133-135.
[10]Sun XW,F(xiàn)ang JQ,Yang XF.Number-theoretic method for pa-rameters estimation in multivariate nonlinear regression with ap-plication [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(1):6-7.
1.統(tǒng)計學(xué)與管理的作用
統(tǒng)計在經(jīng)濟與管理領(lǐng)域的作用,主要表現(xiàn)在以下幾個方面:一是能夠反映社會發(fā)展的基本狀況,通常反映的是國家或地區(qū)的資源狀況、發(fā)展階段、主要的經(jīng)濟成果等等指標;二是揭示了社會和經(jīng)濟發(fā)展的性質(zhì),通過分配關(guān)系和所有制關(guān)系的統(tǒng)計資料來說明;三是反映社會、經(jīng)濟現(xiàn)象的發(fā)展規(guī)律,比如兩個現(xiàn)象間的依存關(guān)系、比例關(guān)系、結(jié)構(gòu)變化以及因果關(guān)系。統(tǒng)計信息的充分利用,不僅能對事物本身進行定量和定性的分析,還可以針對不同事物之間的聯(lián)系進行比較的分析,無論從縱向還是橫向,統(tǒng)計學(xué)都有用武之地。
這些企業(yè)的營銷管理中無處不滲透這統(tǒng)計學(xué)的知識。統(tǒng)計學(xué)作為收集信息、處理信息的一門科學(xué),恰能在市場營銷中的市場策劃階段的各個方面發(fā)揮科學(xué)決策的關(guān)鍵作用。
在市場營銷活動中,要想做到策劃準確,必須要廣泛的收集信息,科學(xué)的處理信息,以便結(jié)果準確、決策科學(xué)。統(tǒng)計學(xué)作為一門收集信息、處理信息的科學(xué),無論是在收集信息階段的市場調(diào)查之調(diào)查問卷設(shè)計與調(diào)查樣本的確定,還是在處理信息階段的數(shù)據(jù)甄別和數(shù)據(jù)分析,都可起到十分重要的作用。在市場分析實際操作中,主要包括統(tǒng)計整理與統(tǒng)計分析。
2.統(tǒng)計分析
"統(tǒng)計分析"是將統(tǒng)計調(diào)查和統(tǒng)計整理的結(jié)果通過各種對比,通過動態(tài)數(shù)列,指數(shù)指標分析等方法進行深入的總結(jié),分析。形象的顯露事物變化的規(guī)律。從質(zhì)的角度剖析事物數(shù)量的變動方向和變動程度。通過分析,與既定的指標指數(shù)相對照,從而得出內(nèi)在聯(lián)系或結(jié)論。以此為依據(jù)進行工作調(diào)整,達到統(tǒng)計的最終目的。在市場本文由收集整理營銷之市場策劃活動中,要想做到策劃準確,必須要廣泛的收集信息,科學(xué)的處理信息,以便結(jié)果準確、決策科學(xué)。統(tǒng)計學(xué)作為一門收集信息、處理信息的科學(xué),無論是在收集信息階段的市場調(diào)查之調(diào)查問卷設(shè)計與調(diào)查樣本的確定,還是在處理信息階段的數(shù)據(jù)甄別和數(shù)據(jù)分析,都可起到十分重要的作用。
3.當今的經(jīng)濟管理發(fā)展
當代的經(jīng)濟管理中,提倡以人為本的導(dǎo)向使管理方法進一步由定性向定量方向發(fā)展,而這一切都離不開統(tǒng)計方法的使用。根據(jù)我國的實際情況調(diào)查,我國稅制的綠色化程度近年來是后退的,這就需要國家加大對生態(tài)經(jīng)濟的投入、對環(huán)境的保護也要加強。一個國家的經(jīng)濟發(fā)展和管理是件龐大的事情,國家也不可能把全部的調(diào)查報告放在一起查看,那么如何更清晰、直觀的表達出很長一段時間內(nèi)的經(jīng)濟情況,就需要統(tǒng)計學(xué)的加入。經(jīng)濟管理不是單一程序,這個過程中需要很多不同的因素來共同完成,統(tǒng)計經(jīng)濟學(xué)可以簡潔、清楚的表達出經(jīng)濟的現(xiàn)況,統(tǒng)計分析也是統(tǒng)計學(xué)在經(jīng)濟中的一個很大作用。然而統(tǒng)計科學(xué)就它的實質(zhì)來說,應(yīng)該是應(yīng)用數(shù)學(xué)的一個分支,并且可以認為是被應(yīng)用于觀察資料上的數(shù)學(xué)。同一公式可以同樣地適用于絕對不同類型的具體對象,這是統(tǒng)計學(xué)的一個特征。經(jīng)濟應(yīng)用統(tǒng)計學(xué)研究社會經(jīng)濟現(xiàn)象的數(shù)量特征和數(shù)量關(guān)系,必然要利用數(shù)學(xué)方法。
在經(jīng)濟管理中,經(jīng)濟現(xiàn)狀的分析、隨即現(xiàn)象的概率、每個變量 總體的影響等都與數(shù)學(xué)不可分割。把數(shù)學(xué)有的、嚴密性的特性結(jié)合到統(tǒng)計中,為經(jīng)濟管理提供論證和計量方法。運用好數(shù)學(xué)知識,在一定條件下,對大量事物的觀察數(shù)據(jù)加以綜合匯總、計算各種綜合指標,從而較好的反映出現(xiàn)象的規(guī)律性,可以把管理工作做的更好。隨著經(jīng)濟的發(fā)展,統(tǒng)計學(xué)將會在經(jīng)濟與管理方面發(fā)揮著十分重要的作用。無論是國民經(jīng)濟管理,還是企業(yè)管理以至于個人的生產(chǎn)、經(jīng)營和決策,都要依賴于統(tǒng)計分析的應(yīng)用。經(jīng)濟、管理類在現(xiàn)實中更注重于實際應(yīng)用能力。在工作中通過列表、圖示和加減乘除等初等方法對數(shù)據(jù)進行分析,可以對數(shù)據(jù)表達的總體有直觀的了解,幫助人們解決問題。根據(jù)不同的位置,需要統(tǒng)計的事物也并不相同,所以我們也要靈活的運用統(tǒng)計學(xué)。
[關(guān)鍵詞]應(yīng)用統(tǒng)計學(xué);課堂教學(xué)組織;方差分析
[中圖分類號] G642 [文獻標識碼] A [文章編號] 2095-3437(2016)07-0103-02
隨著新知識經(jīng)濟和網(wǎng)絡(luò)時代的到來,筆者在教學(xué)科研的實踐中,深切地感受到,無論是自然科學(xué)、社會科學(xué)領(lǐng)域的研究,還是國家宏觀管理和企業(yè)生產(chǎn)經(jīng)營管理,甚至人們的日常生活,信息需求量日益增多,信息處理技術(shù)更加復(fù)雜,作為信息技術(shù)支柱的統(tǒng)計方法,越來越廣泛地應(yīng)用于各個領(lǐng)域。[1] [2]應(yīng)用統(tǒng)計學(xué)作為一門應(yīng)用基礎(chǔ)課,其內(nèi)容豐富,應(yīng)用廣泛,幾乎涉及自然科學(xué)和社會科學(xué)的各個領(lǐng)域。對于在校大學(xué)生,無論其學(xué)習(xí)什么專業(yè),這門課程的重要性不言而喻。課堂教學(xué)組織是教師通過協(xié)調(diào)課堂內(nèi)的各種教學(xué)因素以有效地實現(xiàn)預(yù)定教學(xué)目標的過程,積極探索應(yīng)用統(tǒng)計學(xué)課堂教學(xué)組織有助于提高學(xué)生對統(tǒng)計理論與方法的掌握。
一、基本要求
要強調(diào)課程的重要性。統(tǒng)計學(xué)是研究不確定性現(xiàn)象數(shù)量規(guī)律性的一門學(xué)科。有關(guān)如何應(yīng)用數(shù)理統(tǒng)計中的方差分析、回歸分析、多重回歸、過程控制等統(tǒng)計方法來解決實際問題,以及如何解決在實際應(yīng)用中出現(xiàn)的統(tǒng)計計算的問題,對工程技術(shù)人員等實際工作人員來說是非常重要的。學(xué)生明白了該課程的重要性,也就認識到了學(xué)習(xí)的意義,自然就會認真對待這門課。
要培養(yǎng)良好的課堂習(xí)慣。在這一方面主要是通過輔導(dǎo)員課外開展學(xué)生工作、教師課上嚴格課堂紀律來規(guī)范群體行為,使學(xué)生能夠做到“不遲到、不早退、不開機、不耳語、不走動、不堂食”,通過課程開始的提醒、過程中的堅持不懈,逐步形成“課上主動積極求學(xué),課下活潑互助互動”的良好班級學(xué)習(xí)文化。
要建立規(guī)范的教學(xué)流程。為了使每次課堂教學(xué)活動都能達到教學(xué)目標,應(yīng)對每一次課堂教學(xué)流程進行一定的規(guī)范,使每次課堂教學(xué)都包括前講回顧、本講教學(xué)、本課總結(jié)、作業(yè)布置等環(huán)節(jié)。
要開發(fā)學(xué)生的學(xué)習(xí)興趣。為了使學(xué)生全身心投入課堂學(xué)習(xí),除了規(guī)范的教學(xué)流程之外,還應(yīng)采取教師講授式、師生互動式、學(xué)生主導(dǎo)式等教學(xué)方法,提高學(xué)生學(xué)習(xí)的興趣和參與的積極性,使學(xué)生在課堂中能快樂地學(xué)習(xí)。
要把控好課堂時間和教學(xué)內(nèi)容。課堂的教學(xué)時間有限,教師必須在有限的時間內(nèi)按教案完成既定教學(xué)內(nèi)容。因此,教師必須突出教學(xué)重點,把握好教學(xué)節(jié)奏,嚴謹、圓滿完成課堂教學(xué)。
要強調(diào)與計算機的結(jié)合。為著力提高學(xué)生運用統(tǒng)計方法分析解決問題的能力,教材所涉及的統(tǒng)計計算,要求學(xué)生學(xué)會運用目前已有的軟件,如Excel、MINITAB等。尤其是MINITAB軟件,它是專門的質(zhì)量統(tǒng)計軟件,一方面這一軟件包括了幾乎所有的統(tǒng)計方法和功能,另一方面掌握好這一軟件對于后續(xù)質(zhì)量管理與可靠性課程也非常有幫助。[3] [4]
二、前講回顧
安排前講回顧這一環(huán)節(jié)的目的,一方面是為了督促學(xué)生及時復(fù)習(xí)和鞏固已學(xué)理論知識;另一方面是為了承上啟下,在回顧前期理論知識的基礎(chǔ)上引出本次課堂教學(xué)內(nèi)容,使各次教學(xué)內(nèi)容有連貫性和系統(tǒng)性。
為有效達到前講回顧的目的,可以采用不同方法。如可以事先出好每一章的測試題,包含填空和選擇題;也可以采用課堂上隨機抽取同學(xué)回答教師的提問方式;還可以采用課堂隨機提問與不定期測試相結(jié)合的方式。通過前講回顧,可以讓所有的學(xué)生檢查一下自己的知識掌握情況,教師也可以通過學(xué)生的回答和測試情況了解教學(xué)效果。
三、本期內(nèi)容教學(xué)
本期內(nèi)容教學(xué)環(huán)節(jié)是每次課堂教學(xué)的主體環(huán)節(jié)。每次上課教學(xué)內(nèi)容必然有所不同,但教學(xué)過程存在著一定的共性。下面以應(yīng)用統(tǒng)計學(xué)中“方差分析”一章為例說明課堂教學(xué)過程。
(一)提出問題激發(fā)興趣。興趣是最好的老師,如果能夠激發(fā)學(xué)生的學(xué)習(xí)興趣,那么教學(xué)已經(jīng)成功了一大半。筆者所在學(xué)院工業(yè)工程專業(yè)本屆有四個班,大學(xué)擴招以來,高校對學(xué)生的管理非常重視,輔導(dǎo)員和教師都想了解不同班級之間有無差異,希望判斷不同班級對課程的平均成績是否有顯著影響。這就是多總體的均值比較問題,對這類多個正態(tài)總體均值的檢驗,是否可以采用先前學(xué)過的逐一兩兩檢驗總體均值是否相等呢?答案是否定的。因為比較過程將更加復(fù)雜,同時還會導(dǎo)致判定結(jié)果犯第一類錯誤的概率大大增加。而這正是“方差分析”所要解決的問題。通過對四個班級成績差異進行比較,激發(fā)了年輕的大學(xué)生們的競爭欲望和興趣。
(二)講授理論分析問題。在激發(fā)學(xué)生學(xué)習(xí)興趣后,教師可以采用各種教學(xué)方式和方法,通過將這一實際問題抽象成為理論問題,來引導(dǎo)學(xué)生學(xué)習(xí)相應(yīng)的理論知識。很多時候,學(xué)生之所以反感學(xué)理論,一方面是因為不了解理論來自于生產(chǎn)實踐;另一方面是因為不知道這些理論在實踐中如何運用或不知道其適用的情景,從而導(dǎo)致在實踐中不會用或用錯。因此,教師要講清方差分析的理論觀點、假設(shè)前提、運用方法。
(三)實踐應(yīng)用掌握知識。在講授了方差分析所要掌握的理論及前提后,教師這時就要進一步結(jié)合第一階段所提出的班級對成績影響問題,運用第二階段所講授的方差分析理論與方法,進行相應(yīng)問題的分析和解決。在這里一定要結(jié)合質(zhì)量統(tǒng)計軟件MINITAB[5],一方面提高運算效率,另一方面學(xué)生也要掌握MINITAB軟件的功能。筆者在課堂上以第一階段提出的四個班上學(xué)期八門課的平均成績?yōu)槔谡n堂上做了運算,平均成績數(shù)據(jù)如表1。把以上數(shù)據(jù)輸入MINITAB統(tǒng)計軟件,得出運算結(jié)果如表2
從輸出結(jié)果來看,由于值=0.933>0.05,因此無法拒絕原假設(shè)。結(jié)論:四個班級的平均成績沒有顯著差異,說明各水平間即四個班級之間并無顯著差異。如果值
在課堂上并不需要細致講解MINITAB軟件的每一步驟,因為此時重點在于學(xué)生對方差分析理論的掌握以及引起學(xué)生對自身的思考,至于具體的操作步驟需要學(xué)生在統(tǒng)計學(xué)實驗課上上機動手實踐。通過這個例子讓大家明白,對上學(xué)期八門課程平均成績而言,班級之間并無統(tǒng)計學(xué)意義上顯著差異。
實踐證明,用這個例子學(xué)生能較容易掌握方差分析的理論方法,同時也有效調(diào)動了大家學(xué)習(xí)統(tǒng)計學(xué)的興趣。
四、課堂教學(xué)注意事項
在主體內(nèi)容的教學(xué)過程中,除根據(jù)教學(xué)大綱、教材和教案確定具體教學(xué)內(nèi)容,注重教學(xué)環(huán)節(jié)和教學(xué)方法的運用外,為保證教學(xué)效果,還需要注意幾點。
第一要突出教學(xué)重點。針對大學(xué)生的實際情況,教師不應(yīng)該也不可能將所有的課程內(nèi)容都納入課堂教學(xué)中,所以在課堂教學(xué)過程中,要在系統(tǒng)展現(xiàn)該章知識體系的同時,突出重點教學(xué)內(nèi)容。
第二要進行本講總結(jié)。課堂教學(xué)效果并不取決教師講了多少,而取決于學(xué)生學(xué)到了多少,因此課程內(nèi)容寧少不要多,要講透學(xué)透。因此,在每一次課堂教學(xué)結(jié)束時,要及時地組織學(xué)生進行總結(jié),以感知每次的進步,反思依然存在的不足。通過總結(jié),可加強學(xué)生對本次課堂教學(xué)內(nèi)容的印象,從而為課下繼續(xù)鉆研和后續(xù)學(xué)習(xí)奠定良好的基礎(chǔ)。
[ 注 釋 ]
[1] 賈俊平編著.統(tǒng)計學(xué)(第四版)[M].北京:中國人民大學(xué)出版社,2013.
[2] 王庚,管于華,孫瑞博,陶用之編著.現(xiàn)代工業(yè)統(tǒng)計與質(zhì)量管理[M].北京:中國人民大學(xué)出版社,2011.
[3] Douglas C. Montgomery, George C.Runger, Norma Faris Hubele著,代金,魏科萍譯,張波校譯.工程統(tǒng)計學(xué)[M].北京:中國人民大學(xué)出版社,2005.
關(guān)鍵詞:市場經(jīng)濟;統(tǒng)計學(xué);經(jīng)濟管理
中圖分類號:F83
文獻標識碼:A
doi:10.19311/ki.16723198.2016.26.071
統(tǒng)計學(xué)主要應(yīng)用于經(jīng)濟管理,在人力資源管理,財務(wù)管理等多個方面具有積極作用。其中,主要是用來反映經(jīng)濟發(fā)展的基本情況,通過統(tǒng)計可以使管理者正確掌握某一區(qū)域或者某一企業(yè)的發(fā)展狀況與發(fā)展需求,從而制定合理的管理目標與管理方法。并且,統(tǒng)計學(xué)可以使企業(yè)的薪酬、人力分配更加合理。總之,其在經(jīng)濟發(fā)展中具有不可忽視的作用,而如何將其正確應(yīng)用于市場經(jīng)濟中,還需要進一步的探討。
1 統(tǒng)計學(xué)應(yīng)用于企業(yè)市場營銷
市場營銷是企業(yè)獲得利潤的主要途徑,在企業(yè)發(fā)展中,營銷的核心問題就是分析市場需求,獲得真實有效的營銷策略。統(tǒng)計學(xué)中的因素分析與聚類分析等方法可以讓管理者對市場進行正確的劃分,并且統(tǒng)計特性還可以幫助企業(yè)獲得最新的產(chǎn)品需求,以及合理的產(chǎn)品價格定位。統(tǒng)計學(xué)主要以信息的收集和處理為主,在市場營銷的策劃階段,其作用不可忽視。
2 統(tǒng)計學(xué)應(yīng)用于市場分析
市場分析核心為統(tǒng)計整理與統(tǒng)計分析。所謂統(tǒng)計整理就是對經(jīng)濟調(diào)查的相關(guān)數(shù)據(jù)進行整理和分類,最終通過對數(shù)據(jù)的分析來獲得經(jīng)濟發(fā)展的趨勢。統(tǒng)計學(xué)對于這一過程的數(shù)據(jù)科學(xué)分組以及最后的準確計算都具有積極作用。使復(fù)雜且大量的數(shù)據(jù)呈現(xiàn)出規(guī)律性,方便應(yīng)用人員對其進行對比。通過對動態(tài)數(shù)據(jù)的分析,對經(jīng)濟發(fā)展進行質(zhì)的剖析,從而顯示出經(jīng)濟發(fā)展的基本規(guī)律,有利于經(jīng)濟市場的正確分析。在分析過程中,統(tǒng)計學(xué)通過既定的指標的對照來找到數(shù)據(jù)之間的聯(lián)系,對企業(yè)決策中不合理的發(fā)展進行調(diào)整。
3 統(tǒng)計學(xué)應(yīng)用于市場互動
對于市場營銷的活動策劃來說,要使其具有準確性,不但要進行信息的收集,還要注重于市場的互動。統(tǒng)計學(xué)以其廣泛的理論覆蓋了經(jīng)濟發(fā)展的多個方面,利用統(tǒng)計學(xué),可以使樣本的設(shè)計與調(diào)查更加精確與科學(xué),使管理者在經(jīng)濟分析中能夠及時正確的把握經(jīng)濟信息,從而實現(xiàn)與經(jīng)濟的互動采取與市場步調(diào)一致的發(fā)展策略,促進企業(yè)的可持續(xù)發(fā)展。在當下,經(jīng)濟發(fā)展處于新時期,如何用好統(tǒng)計學(xué)能夠幫助企業(yè)走向時代的前沿,能夠使管理者與決策者第一時間掌握最新的動態(tài)的市場信息。另外,對于國家對于企業(yè)的約束作用也十分明顯,相關(guān)數(shù)據(jù)顯示,在企業(yè)發(fā)展過程中,其多種因素是存在相互制約與共同發(fā)展轉(zhuǎn)態(tài)下的,在不同的政策下,企業(yè)的稅收、經(jīng)濟的投入方式是會發(fā)生變化的。統(tǒng)計學(xué)可以對相關(guān)數(shù)據(jù)進行分析,從而得出生態(tài)發(fā)展對于現(xiàn)代企業(yè)的重要性,督促企業(yè)實施改革與轉(zhuǎn)型。
統(tǒng)計學(xué)的理論并不復(fù)雜,并且思路清晰,只有依賴于統(tǒng)計學(xué),才能使政府和企業(yè)能夠進行合理的、有效的調(diào)查,并且使調(diào)查結(jié)果更清晰。可見,統(tǒng)計學(xué)在經(jīng)濟管理中的重要作用,統(tǒng)計學(xué)作為數(shù)學(xué)的分支之一,可以應(yīng)用于不同的領(lǐng)域,以及同一領(lǐng)域的不同方面,同一公式甚至可以應(yīng)用于企業(yè)經(jīng)濟發(fā)展的不同方面。這與經(jīng)濟學(xué)的特點相吻合,經(jīng)濟學(xué)就是研究經(jīng)濟現(xiàn)象之間的數(shù)量關(guān)系,因此統(tǒng)計學(xué)的應(yīng)用就成為一種必然。利用統(tǒng)計學(xué)的嚴謹。綜合的特點,可以很好的反映經(jīng)濟現(xiàn)象與經(jīng)濟規(guī)律,促進經(jīng)濟管理的高效化。其具體過程為,在經(jīng)濟工作中通過簡單的計算方式獲得清晰的統(tǒng)計結(jié)果。在不同的統(tǒng)計事務(wù)中,科根據(jù)統(tǒng)計的目的來選擇不同的統(tǒng)計方法。目前,在經(jīng)濟發(fā)展中,主要應(yīng)用統(tǒng)計學(xué)的圖表統(tǒng)計。數(shù)據(jù)統(tǒng)計等,主要應(yīng)用于營銷、顧客滿意質(zhì)素以及市場的基本需求上。以圖表為例,在市場經(jīng)濟發(fā)展中存在著顧客滿意度低或者是供大于求的現(xiàn)象,此時企業(yè)將處于銷售危機。企業(yè)此時所做的統(tǒng)計不僅要包括市場方面,還要對其人力資源結(jié)構(gòu)進行分析,包括對其經(jīng)濟的發(fā)展的多個影響要素的統(tǒng)計。例如通過統(tǒng)計圖表,顧客不滿意或供過于求時,那么企業(yè)收益會減少;人力資源管理中的統(tǒng)計。企業(yè)管理人員要對員工的滿足度進行分析,從而了解員工的真實需求,減少企業(yè)在發(fā)展中的其他不利因素。
4 統(tǒng)計應(yīng)用于審計
現(xiàn)代企業(yè)離不開審計,審計可以使企業(yè)發(fā)展更加規(guī)范,可以促進企業(yè)的發(fā)展。統(tǒng)計學(xué)應(yīng)用于審計,主要體現(xiàn)在其樣本統(tǒng)計上,審計具有輕重點之分,樣本的重要程度是不同的,在這一過程中,要針對不同程度的概率進行分析,尤其是要注意其抽中概率。審計決定了企業(yè)發(fā)展的合理性,但審計相對復(fù)雜,不通過一定的手段很難直接發(fā)現(xiàn)企業(yè)經(jīng)濟數(shù)據(jù)中存在的問題。統(tǒng)計中的最優(yōu)分層理論和最優(yōu)樣本容量分配理論都能夠幫助審計,使審計的數(shù)據(jù)具有高準確性,從而更好的確保經(jīng)濟審計的進行,促進企業(yè)的發(fā)展。
5 總結(jié)
統(tǒng)計學(xué)是現(xiàn)代企業(yè)應(yīng)用的重要理論之一,統(tǒng)計學(xué)主要是通過對企業(yè)經(jīng)濟現(xiàn)象,相關(guān)影響因素的數(shù)據(jù)整理、分析和處理,來實現(xiàn)通過現(xiàn)象看本質(zhì)的目的。統(tǒng)計學(xué)不僅影響企業(yè)市場營銷,還對企業(yè)的管理與決策具有積極的推動作用,因此對于企業(yè)來說,如何進一步認識統(tǒng)計的意義,并且正確應(yīng)用統(tǒng)計理論是十分重要的。
參考文獻