大數據將如何改變我們的學習?
維克托·邁爾被譽為“大數據時代的預言家”。現任牛津大學網絡學院互聯網研究所治理與監管專業教授。主要研究領 域為數據科學、信息安全、信息政策與戰略。曾任哈佛大學肯尼迪政府管理學院信息監管科研項目負責人、哈佛國家電子商務研究中心網絡監管項目負責人、新加坡 國立大學信息政策研究中心主任。曾參與歐盟互聯網官方政策制定。先后擔任過微軟、惠普、IBM 等全球知名企業和機構的信息政策顧問。所著《大數據時代》、《刪除》,皆被認為是最早洞見大數據時代趨勢的開創性作品。
(下文根據演講現場速記整理,有刪節)
很多人都知道,我是一名數據科學研究者。那么,為什么我今天要來到這里,給大家講有關學習和教育的問題呢?因為我認為,學習的未來、教育的未來都是 和我現在所做的工作相關的。也就是說,當我和那些正在學習的人以及研究教育的人坐在一起,可以一起思考如何通過大數據來改變我們的學習方式。這樣,我們或 許就可以改進我們的教學,可以讓教育變得更好。
這里所說的教育,不只是對那些優秀的人而言,而是對所有的人。我有一個觀點,也是我的理想,那就是,所有人都應該獲得配得上他的潛力的學習機會,學習怎樣獲得知識和洞見。我目前想做的,正是如何盡可能地幫助每個人學得更好。而在我看來,利用大數據,我們是可以在這個問題上獲得新進展的。這就是我今天要講的基本觀點。
兩種完全不同的教學方式
人們都贊美Mooc,認為它可以讓全世界獲得學習的機會。但是,Mooc的意義不僅僅在于此。還在于,通過它,可以獲得大量關于人們如何學習的數 據:人們怎樣獲得知識?怎樣獲得洞見?而通過理解并且進一步考察這些數據,我們可以更好地理解人類的學習行為,進而提高人們的學習效率和學習質量。
幾年前,我曾訪問過不丹。那是在中國和印度之間的喜馬拉雅山脈東段南坡上一個非常美麗的國家。近年來,不丹在世界上因“幸福指數最高”而聞名。不丹在商業上有很不錯的發展。其中,當地高超的唐卡描畫技藝給很多前往不丹的人留下非常深刻的印象。
在不丹時,我訪問了一所學校。這所學校正是教授關于唐卡的繪畫技藝的。參觀時,不僅是非常漂亮精致的唐卡圖像給我留下深刻印象,學生們非常專注地描 繪唐卡的狀態更是令我目瞪口呆。最令我感到震撼的是,他們竟然可以做到與他們的老師所做的一模一樣。而他們的老師又和他們上一代的老師、畫家做得一模一 樣。也就是說,幾千年過去了,他們描畫的唐卡是完全一樣的。
那么,教育對他們來講,就是學習如何模仿過去,說得更具體一點,就是如何完全地模仿過去。從中延伸出的一個觀點就是,最好的學生就是不偏離的學生;和過往的優秀畫家所做的一模一樣的,才是最好的學生。我看到這些作品時真是非常驚嘆。我對由他們的作品和創作、傳承的整個過程所折射出的巨大的精確感, 感到非常吃驚。他們所強調的,只是模仿,而不是你自己的思想,不是創造,不是原創,不是創新。
而在差不多的時間,我又遇到了另一個人。他叫吳恩達,現在是斯坦福大學的教授、一個計算機科學家。他在智能機器研究領域頗有成就。吳恩達和另一個合 作伙伴達芙妮·科勒一起開創了一家公司。這家公司表面上和人工智能沒有什么關系,但由這家公司開發出的在線學習平臺“Coursera”已經成為當下最具 代表性的在線學習平臺之一,提供免費的網絡公開課程。
這家公司的緣起就是由吳恩達講授的“機器學習”課程被以免費的方式放到了網上。最后意外地發現,報名人數竟超過了10萬人。而通常,吳教授平均每年 的聽課人數是400人,必須連上250年課才能接觸到10萬名學生。換言之,通過這個在線教育平臺,這門課程可以抵達的學生比吳恩達以往一生可能教到的學 生都多。而如今,他通過一個在線課程就教完了。正是因為這個經歷,使得達芙妮·科勒和吳恩達后來一起合作,創建了Coursera(意為“課程的時代”) 這個在線學習平臺。這個平臺的理念是,它可以提供在線教育材料給全世界的人。
當然,現如今,經過數年的發展,隨著在線教育得到越來越多人的關注,在線的課程越來越多,Coursera已經只是其中的冰山一角了。這一波在線課 程及其背后的在線學習體系被稱為“大規模開放式在線課程”,即Mooc(massive open online courses)。人們都贊美它,認為它可以讓全世界獲得學習的機會。
但是,我想這種關于Mooc的觀念是完全錯誤的。Mooc的意義不僅僅在于讓全世界的人獲得更多的學習機會,還在于,通過它,可以獲得大量關于人們 如何學習的數據:人們怎樣獲得知識?怎樣獲得洞見?而通過理解并且進一步考察這些數據,我們可以更好地理解人類的學習行為,進而提高人們的學習效率和學習 質量。
在線教育最根本的未來在于它將改變我們如何學習。這關乎學習和教育的未來。正是基于這一點,我認為,正進入教育的方方面面的大數據,將對全世界的學習與教育活動產生極為深遠的影響。
大數據如何重塑學習
大數據可以收集足夠多的信息,且覆蓋面廣泛。我們在制作和利用大數據時,需要用個性化的方法把它們組織起來,將其運用于教育領域,進而幫助我們以前 所未有的視角判斷什么可行、什么不可行;展示那些以前不可能觀察到的學習層面,實現學生學業表現的提升;基于學生的需求而非統一的課程標準來定制個性化課 堂,促進理解并提高成績。
現在讓我們想幾秒鐘,人們到底是怎么學習的?
200多年以來,學習一直是學校體系的一部分。但其實在此之前,還沒有現代意義上的學校或者大學,教育基本上是以個人形態存在的。一些富人家的孩子 會獲得一個一對一的導師,但這樣的教育只有少數人才可以享有。現在教育是由普通大眾來獲得,這無論如何都是一個好事,是前進的一大步。但是,目前的這種情 況還是不夠的。
為什么這么說呢?因為,作為學生,其實我們每一個人都有自己獨特的個性、需求和學習上的傾向。但是,目前我們這個教育系統還沒有辦法支持這個個性。 如何才可以改變、完善這個系統?就是要通過對數據的收集和利用。如今一些技術上的進展已經為有關數據的大規模收集和利用創造了條件。在我看來,大數據正是可以從這個意義上重塑學習的三個主要特征,即反饋、個性化和概率預測。
說到這里,我想舉多鄰國(Duolingo)的例子。它的主體是一個語言學習網站,同時提供網頁版和手機應用版。多鄰國也是由一位計算機科學系的教 授創建的,他叫路易斯·馮·安。多鄰國是免費的。通過下載它提供的應用程序,你就可以在手機上學習國外的語言,非常有意思,使用起來也非常輕松。現在已經 有成千上萬的人用這個應用程序來學習語言。
多鄰國的貢獻在于,它是一套數據導向式的教學方式。無論用戶是花幾分鐘還是幾個小時在手機上用這個應用程序學習,他們都可以通過后臺程序來跟蹤收集 大家學習語言的數據。通過學生在應用程序上回答一個個問題,系統和多鄰國的團隊會分析用戶一般會糾結于哪些問題,會犯哪些錯誤。通過分析使用者的互動數 據,分析他們的學習方式,從而再反過來,用這些積累下來的數據去改進整個應用程序。路易斯·馮·安曾說,其實他們對于到底如何學習外語所知不多,但是他們 可以通過對數據的分析來了解學生更容易犯什么樣的錯誤,從而幫助他們更好地學習。比如,他們發現母語為西班牙語的人在學習英語時,有些詞其實應該晚一點再 學。這樣他們在學英語的過程中就會更少碰到障礙,從而更易獲得進步。
而在此之前,我們傳統的教學是怎樣獲得反饋的呢?就是通過考試。考試之后你通常會獲得一個分數,這就是你可以通 過一場考試得到的全部反饋了。但事實上,這個分數可以幫到你的不是很多,它并不能幫助你更好地改善你的學習。它既沒有辦法很好地分析你的學習過程,也不告 訴你究竟該如何來改善你的學習。而事實上,問題很可能并不在于你本身的努力程度,而在于你的學習方式不對、你用的教科書不對、或者你遇到的教學方式可能根 本不適合你。隨著教育的發展,越來越多教育者開始注意到收集反饋的重要性,但憑借既有的方式,他們收集到的正確數據非常有限,或者在量上遠遠未能達到可以 改進教學的規模。
多鄰國的例子可以啟發我們:當通過大數據,收集信息和反饋具備了更好的基礎、更多的可能性,我們不僅更容易收集到數據了,還可能收集到更多可以幫助我們改善學習方法的數據。如 果我們可以更多關注學習的過程,而不僅僅是像以往那樣更多關注學習的成績,我們的學習和教育現狀一定會有所改變。它會找到更好的收集反饋的方式,還能使我 們的教學更適合于每一個個人。當一個學生對他的學習內容并不十分理解時,他可以用一種新的方法學習。他可以慢慢學,不必用同別人一樣的方法來學習。
大數據在這個問題上的優勢在于:它可以收集足夠多的信息,且覆蓋面廣泛。我們在制作和利用大數據時,需要用個性化的方法把它們組織起來,將其運用于 教育領域,進而幫助我們以前所未有的視角判斷什么可行、什么不可行;展示那些以前不可能觀察到的學習層面,實現學生學業表現的提升; 基于學生的需求而非 統一的課程標準來定制個性化課堂,促進理解并提高成績。當然,在這個指導思想下設計出來的課程單,除了根據學生的需求,也會考慮到他們的潛能。類似這樣的 教學項目在現實中已經有所實踐。既然我們可以截取、混合最愛的音樂并將之刻錄到iPod播放器中,那么,為什么不能對我們的學習做出同樣的操作呢?所以, 對于改善人類的教育而言,“個性化”是僅次于“反饋”的第二大要點。
大數據可以重塑學習的第三大要點在于“概率預測”。所謂概率預測,就是通過大數據,我們能夠對人們的整體學習狀況和個體的知識掌握情況產生獨到的見解。然后,基于某種高度的可能性,對個體為提高其學業成績需要實施的行為作出預測。比如,選擇最有效的教材、教學風格和反饋機制。
在由孟加拉裔美國人薩爾曼·可汗創立的可汗學院中就曾遇到這樣一個例子。后臺數據顯示,有一個七年級的女孩一直搞不定數學,然后她就反反復復地學這 幾門課。但突然有一天,她學習了別的課,竟然就開竅了。她對所學內容的反應越來越快,在夏季結束時她成了最好的學生之一。可汗學院研究了一下她這個案例, 發現正是因為她在中途突然改變了學習的內容和方法,才帶來了轉變。
這個例子正揭示了“概率預測”的可用武之地。有時候,我們的學習之所以沒有進展,正是因為課堂的配置出了問題。由此,可汗學院提出了“翻轉課堂”的 理念。“翻轉課堂”提倡的是,你先在課外閱讀材料或者觀看視頻,這些內容通常由世界上最好的老師來講授。然后,你再帶著滿腦子的問題去上課,和你所在學校 的老師進行探討。通過這個方式,你可以找到最合適你的教材和更有針對性的、適合你的教學風格。而面對面的討論,無疑是更好的反饋機制得以產生的基礎。
未來的學習會怎樣
現在的學校是一個學生接受信息的空間,但是在未來,學生們將在家里通過觀看網上視頻等形式接受信息,然后到學校去和老師、同學就自己學習的內容進行 討論。學校將變成一個社會性的場所,是一個互相討論、互相學習的所在。而與此相適應的是,老師在整個學習過程中的功能會發生改變。
有人肯定會說,這下問題來了:未來還需要像我們這樣的學校嗎?學校會成為私立的公司嗎?誰會贏?這些問題沒有標準答案。但我認為,能夠從未來的學習競爭中獲得勝利的,一定是那些能夠駕馭大數據并且通過這種駕馭能力改善我們每一個人的學習的人。
就我個人的觀點,未來的學校不會完全轉移到線上,仍舊會有物理性的存在,但是,學校的功能將發生重大改變。現在的學校是一個學生接受信息的空間,但是在未來,學生們將在家里通過觀看網上視頻等形式接收信息,然后到學校去和老師、同學就自己學習的內容進行討論。學校將變成一個社會性的場所,是一個互相討論、互相學習的所在。而與此相適應的是,老師在整個學習過程中的功能會發生改變。以前照本宣科的傳授、宣講知識的技能,要讓位于組織學生討論的技能、讓位于從數據中獲取學生學習信息的技能、讓位于根據數據對學生進行個別引導的技能。
在此過程中,大數據可以是老師的好幫手。以前,老師不知道哪些部分的內容是學生面臨困難的、哪些學習材料是學生感興趣的、接下來的教授重點有多少種 教案以外的新可能,大數據可以幫助他們提供這些信息,從而更深入地了解學生的學習興趣和學習風格。這個過程一定會遇到一些困難,但如果老師們掌握了這些技 能,學校將比現在變得更美好。
隨著數據處理技術獲得極大的發展,老師會被替代掉嗎?我的回答是:不會!有兩個理由。一是數據可以篩選、排序、組合內容,但無法生成內容。即使是“翻轉課堂”,視頻中教授知識的也仍是老師。第二個原因,學習是一個社會性的過程,面對面的人際溝通與面對書本的學習是可以互補的,卻不能相互替代。兩者一起配合好,教學才能變得更好。
當然,大數據一方面有很多好處,但是如果這些數據被濫用到不恰當的地方上,也意味著巨大的風險和挑戰。具體到教育領域來說,與大數據同行,會帶來兩大方面的風險。我把它們概括為“永久的過去”和“決定了的未來”。
所謂“永久的過去”,是指我們作為個人會不斷地成長、發展、變化,而那些多年來收集的全面的教育數據卻始終保持不變。想象一下,假使某個學生的活動 記錄被存儲下來,并在25年后他找工作的時候被提供給未來的雇主,這將會是怎樣的情形?因此,全面教育數據帶來的首個重大威脅,并不是信息的發布不當,而 是束縛我們的過去,否定我們進步、成長和改變的能力。目前能夠抵御這一威脅的可靠措施大概只有法律。我認為,應該對大數據的使用立法,明確規定哪些數據可 以收集和使用,哪些數據不能收集和使用;哪些數據可以在哪些領域中加以使用,等等。
所謂“決定了的未來”是指,將以所有人為對象收集到的全面教育數據,用于對未來進行預測。比如,系統預測某個學生不太可能在一個學科領域(如生物信 息學)取得良好成績,于是引導他轉入護理之類的其他專業,我們應該如何看待這一決策?又如,大學可以很容易利用大數據選拔出學習能力最強的學生。但是,畢 竟教育最聰明的10個學生是相對容易的,而提高普通學生的成績卻難得多,也有意義得多。也就是說,大數據可能會導致部分學生成為量化評估的受害者而非受益 者,存在導致老師、學校只愿意接收天資聰穎的學生的可能,加劇教育的不平等。
而在我看來,大數據運用于教育的價值,正在于教育工作者能夠借此幫助參差不齊的學生挖掘自己的潛能,而非淘汰那些被定義為“不聰明”的學生。大數據蘊含的巨大潛力應當被用于推進個性化學習、改善教材和教學、最終提高學生的成績。它應該被用于促進教育改良的反饋,而不是作為對產品使用者進行簡單評價的依據。
我們已經開始了一個新的大時代。如果做好了,那這個成果將是意義重大的,教育的性質將從根本上發生改變。很希望在座的學生有能力真正促成這樣的改革。也希望我們能夠通過對大數據的利用,用一個更好的教學方式,讓所有人都能夠得到一個更好的學習體驗。謝謝大家!



