
巨量資料即將徹底改變教育/《大數據:教育篇》
文/麥爾荀伯格、庫基耶
史丹佛大學資訊工程教授吳恩達
是線上授課公司Coursera的共同創始人
他在網路上開設的機器學習課程
正是巨量資料即將讓教育徹底改變的前兆
老師傅 vs. 新教授
達瓦(Dawa)全神貫注,在筆尖蘸了一點顏料,小心翼翼的畫出一條細細的黑線;然後又蘸了一點顏料,再畫出另一條細細的線。時間慢慢流逝,一幅擁有迷人幾何細節的唐卡(一種絲質的佛教卷軸畫)也漸漸成形。
屋外,白雪皚皚的喜馬拉雅山峰圍繞著不丹王國的首都廷布(Thimphu),山峰在夕陽映照下,閃閃發光。屋內,達瓦和他的同學都大概只有二十多歲,穿著相同的藍色長袍,專心致力於手頭上的精細工作,歲數中年的師傅則在一旁仔細監督。
唐卡藝術家的訓練還是遵循古老傳統,達瓦和他的同學來到這裡的目的,不是接受教育、開拓心靈,而是要從學徒制,學到紀律。這裡的學習方式不是詢問,而是模仿。早從數百年前,就已經有人定下無數的規矩,規定只准在什麼地方、以什麼方式、畫出什麼東西來。
達瓦的師傅就是要確保這些年輕藝術家,完完全全遵照指示,重複做著之前世世代代唐卡繪畫家所做的事。如果膽敢稍稍偏離、或是不符過去的規定,可不只是下次小心一點就好,而會被視為大逆不道。在這裡,所謂最好的畫家,就是要能夠完美複製師傅的作品。師傅會不斷指出各個不完美的地方。雖然學員能夠即時得到師傅的意見回饋,但這種學習方式仍然算是缺少資料和數據的回饋。
相對的,世界上還有一種可說是天差地別的教學方式,譬如史丹佛大學資訊工程教授吳恩達(Andrew Ng),他是在網路上開設「機器學習課程」(machine learning,這是資訊工程的一個分支)。
吳恩達是線上授課公司Coursera的共同創始人,他的這種教學方式,也正是巨量資料(俗稱大數據)即將讓教育徹底改變的前兆。
吳恩達會蒐集一切跟學習活動相關的資料,涵蓋學生的各項作為。這樣一來,他就能知道哪些課程安排的效果最好;而且系統經過仔細設計,能夠自動將結果導回課程中,據以改善教學、提升學生的理解和表現,也能依據每一位學生的個別需求調整教學。
舉例來說,吳恩達會追蹤學生觀看教學影片時的動作,像是他們會不會按暫停、快轉,甚至是提前切掉影片(這等於是一種數位蹺課的行為吧?)。
吳恩達能夠知道:學生是不是同一部影片觀看了很多次,又或是他們會不會回頭觀看某一部先前的教學影片來複習。此外,他也會在教學影片課程之間,放進小考;但這可不是為了測試學生專不專心,課堂秩序這種老掉牙的事完全不在他的考量之中。吳恩達之所以要小考,是真的想知道學生是不是都懂了,而且他還能針對任何一位學生,看看學生是不是在某個地方卡住了、想不通。
吳恩達可以追蹤任何一臺電腦或平板電腦的課後作業和考試結果,所以他能夠判斷某一位學生是否在某個特定課題,需要加強協助。而只要分析全班的所有資料,他也能看出學生整體的學習情形,據以調整課程。甚至,他還可以將今年的學生資料與前幾年、或是其他班級的資料做比較,就知道哪一種教學方式最有效。
關鍵在於巨量資料
吳恩達教授的修課學生人數都有數千、甚至上萬人,所以各種發現在統計上都夠穩健,而不會有一般教學研究計畫只能依靠小規模觀察的問題,這也算是一大好處。但在這裡,最關鍵的要點並不在於修課人數有多少,而是在於巨量資料。
吳恩達教授徹底利用巨量資料,讓巨量資料大顯神威。例如,他追蹤學生觀看教學影片的順序,就發現了一個令人意想不到的反常現象。大部分學生都是依照順序,一部一部往下看,但是過了幾個星期,大約看到第7堂課的時候,學生會跳回第3堂課。這是為什麼呢?
吳恩達進一步調查,發現第7堂課是要求學生用線性代數寫一條公式,而第3堂課則是在幫助學生複習數學。很顯然,許多學生對於自己的數學程度沒那麼有信心。於是,吳恩達就知道應該修改一下課程,在學生覺得壓力太大、有點灰心的時候,用更多的數學複習內容幫他們一把;這正是巨量資料告訴了他,某些學習關卡的時間點。
還有一次,吳恩達看到不少學生反覆觀看某個主題的影片,而且他是真的「看到」了:大約在第75堂課到第80堂課之間,學生觀看教學影片的順序就大亂了,學生會重複觀看,但沒有一定的順序。(吳恩達事先製作了一套讓巨量資料視覺化的程式,只要統計上顯示「使用者觀看影片的順序異於常態的次數大增」,就會從深藍色轉為鮮紅色。)
吳恩達教授的結論是:學生對於理解這些概念有困難,正在努力想要搞懂。於是他意識到,如果教師能知道這些事,就能夠改進、重新錄製那幾堂課的影片;而且接下來,也能夠明確檢核,看看學生的學習情況是不是有好轉。
巨量資料正在進入教育的所有層面
吳恩達教授看到的巨量資料威力,還遠遠不止如此。一般人使用線上論壇的時候,會看的是貼文有多少人已讀,再請讀者對貼文評分、判斷貼文內容是否有幫助。但吳恩達對於自己課程的線上論壇,則是跑了一回很複雜的統計調查,能夠真正看出某篇論壇貼文「有沒有幫助」:他會先找出答錯某個主題相關作業或考題的學生,再看看他們讀過某篇特定的論壇貼文之後,下次碰到同樣問題能夠答對的百分比。
例如,在2011年關於機器學習的課程上,有幾千名學生答錯了「線性迴歸」的一題成本計算題。但只要是後來讀過論壇第830號貼文的同學,下次能夠答對的機率就高達64%。
於是從現在開始,只要是答錯那個主題的習題的同學,系統就會自動把第830號貼文寄給他們。這是一種以巨量資料為墊腳石的教學方式,能夠找出哪些論壇貼文確實有助於學習,而不是只倚賴學生對貼文的主觀評分。
而且,這種使用巨量資料的方式,絕不只是史丹佛大學吳恩達課堂的專利;它已經點出未來的教育大趨勢!巨量資料正在進入教育的所有層面,對於全世界的教學與學習活動,必然會產生深遠的影響。
不只是「我講你聽」
這本《大數據:教育篇》就是要談談巨量資料如何改變教育。巨量資料讓我們擁有前所未見的方式和觀點,能夠看到究竟什麼有用、什麼沒用。我們現在可以看到以前不可能觀察到的學習層面,從而改善學生的學習成效。課程可以依據學生個人的需求,進行調整,有效提升他們的理解和成績。
教師也能夠找出最有效的教學方式:教師的工作不是「被取代」,而是「更有效」,而且很可能也「更有趣」。學校領導者和政府決策人員,也能用更低的成本,提供更多的教育機會,而這正是減少社會貧富差距和社經地位差距的重要因素。史上首次,我們終於擁有了強大、具實證效果的工具,能夠瞭解「怎樣教學」與「如何學習」。
但是請別誤會,這本書要談的並不是「大規模開放式線上課程」(massive open online course, MOOC)而已。吳恩達教授在史丹佛大學開設的MOOC課程,過去幾年已經廣受矚目,多次躍上新聞頭條。MOOC可說是讓人人都有了普及受教的機會,種種可能性讓全球都深深著迷,這無疑是一項美好的發展。然而有時候,MOOC也只是舊教育換個新樣子,仍然是「我講你聽」,只是上課機會更多、求學的門檻降低而已。
然而,MOOC確實有一點是全新而潛力無窮的:它們會產生巨量資料!有了這些巨量資料,我們就能知道什麼教學方式最有效;我們現在已經擁有了犀利的工具,能夠解開過去無法解開的謎團,知道前所未知的祕密。這個犀利工具,就是為了分析巨量資料而發展的種種概念與技術。
※ 本文摘錄自《大數據:教育篇》〈第1章〉