《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 大數據在MOOC中的應用分析
大數據在MOOC中的應用分析
2015年微型機與應用第11期
葉 斌,余 陽,王 會,黃文富
(成都東軟學院 信息技術與商務管理系,四川 成都 611844)
摘要: 大數據作為下一個生產力的前沿技術在教育領域廣泛應用,將給教育產業產生積極的推動作用。分析當前MOOC網絡教育發展狀況,及大數據在MOOC網絡教育中的存在方式;研究大數據對MOOC教育產生的積極作用,及大數據與MOOC網絡教育融合過程中的收集、存儲、計算及應用的技術路線;總結大數據為網絡教育服務所要解決的問題。
關鍵詞: 大數據 MOOC 網絡
Abstract:
Key words :

  葉 斌,余 陽,王 會,黃文富

  (成都東軟學院 信息技術與商務管理系,四川 成都 611844)

  摘  要大數據作為下一個生產力的前沿技術在教育領域廣泛應用,將給教育產業產生積極的推動作用。分析當前MOOC網絡教育發展狀況,及大數據在MOOC網絡教育中的存在方式;研究大數據對MOOC教育產生的積極作用,及大數據與MOOC網絡教育融合過程中的收集、存儲、計算及應用的技術路線;總結大數據為網絡教育服務所要解決的問題。

  關鍵詞: 大數據;MOOC;網絡

0 引言

  2008~2012年國家財政性教育經費支出五年累計7.79萬億元,年均增長21.58%,占國內生產總值比例達到4%[1]。顯然,這是歷史性的,但也必須清醒認識到,這是一個遲到12年才達到的目標,而且是較低的水平,與發達國家或是中等發達國家相比,還存在很大的差距。

  因此,我國教育產業還有很大的發展空間。但由于傳統教育的一次性投資大,投資周期長,使得除政府投入以外,民間資本對教育產業的投入還不夠。

  隨著網絡走進千家萬戶,網絡教育相比傳統的全日制教育有投資小、周期短、實施方便等優勢,逐步成為一種新型教育的潮流,成為傳統教育的有力補充。網絡教育成為教育事業引入民資的有效突破口。近年來,大型開放式網絡課程(Massive Open Online Courses,MOOC)發展迅速,給更多學生提供了系統學習的可能,成為網絡教育發展的重大機遇。

  目前,世界上最大的課程提供商有Coursera、Udacity、edX。到現在為止,幾乎所有著名的全球頂尖大學都在Coursera上開設了自己的MOOC課程。在國內,清華大學也在2013年10月發布了中國大陸第一個由高校主導的MOOC平臺——學堂在線。這一新型學習平臺將發布清華大學原創課程以及其他國內外優質的MOOC課程。網易、新浪、過來人等商業機構也和中國大學合作進行MOOC課程的制作。MOOC蓬勃發展的同時,一些新的技術手段,特別是大數據技術逐漸興起并日趨成熟,更為網絡教育提供了一劑“強心針”。

1 MOOC教育產業中的大數據

  1.1 大數據作為教育領域的新動力

  2011年6月,美國咨詢界的翹楚麥肯錫咨詢公司發布了《大數據:下一個競爭、創新和生產力的前沿領域》的研究報告[2]。這份長達150余頁報告的主要觀點囊括了大數據對國民經濟各部門生產效率的推動、大數據的快速增長及IT技術對產能的貢獻率等。自此,大數據逐漸被大家所認識,并應用至各個行業中。而其與網絡密不可分的關系,使大數據在商業智能、公共服務和市場營銷、教育等領域成為首要應用目標。

  大數據的定義在學術界還沒有形成共識,但也有一些大家所共同認可的認識。即大數據是指用現有技術難以在可接受的時間內管理、處理和分析的數據集。廣義上,大數據包含三層內涵:一是數據量巨大、來源多樣和類型多樣的數據集;二是新型的數據管理和分析技術;三是運用數據分析形成新價值。

  1.2 大數據在MOOC教育中的存在方式

  在整個MOOC教育過程中,隨時都會產生大量的數據,這些數據來自于學習者、與學習者相關的家庭成員、朋友、同學、教師以及MOOC教育提供商,甚至學習者的社交網絡等數據源。這些數據只有少量被MOOC教育系統所記錄,而且沒有經過分析、整理,導致數據的價值被浪費。

  這些數據可以大致分為三類:結構化數據、半結構化數據和非結構化數據[3]。結構化數據主要來自于學習者的注冊信息、MOOC系統自動存進數據庫的學習數據表、調查問卷等二維表,這些數據的數據價值密度最高,最有可能被分析利用;半結構化數據主要來自于電郵、網頁,網絡日志等數據;非結構化數據主要是與學習者相關的視頻、音頻、傳感數據等。半結構化數據和非結構化數據價值密度較低,需要借助大數據技術提取和處理,例如FaceBook的Scribe、Apache的Sqoop,以及適合Hadoop處理的Chukwa等。

2 大數據背景下MOOC教育的機遇與挑戰

  2.1 MOOC教育對傳統教育的沖擊

  MOOC教育的產生對傳統教育的沖擊很大,學習者,特別是高層次學習者,不再那么依靠傳統意義上的教師,甚至有些教師擔心由此失業。這種沖擊主要表現在:

  (1)學生-教師比例反轉。傳統教育中,往往是很多學生面對一個教師,享受的教育資源相對較少,而MOOC教育使得這種情況產生了反轉,即一個學生可以面對很多不同教師,得到更充足的教育資源。

  (2)工具資源多元化。MOOC課程可以融合多種社交網絡工具和數字化的學習資源,從而使學習工具更加多樣化,學習資源更加豐富。

  (3)課程更易于使用。由于依托互聯網學習突破時空限制,學習者在家即可學到國內外著名高校課程。

  (4)課程參與自主性。MOOC課程完全由學習者自己決定是否進行學習,何時進行學習,使學習者能更加靈活地安排自己的學習計劃,同時也要求學習者有較強自主學習能力。

  (5)課程受眾面更廣。突破傳統教育中實體教室的限制,能滿足大規模課程學習者學習。

  2.2 當前MOOC教育所面臨的挑戰

  MOOC作為一種新型的教育方式與傳統教育相比,有其得天獨厚的優勢,但也有其劣勢阻礙了它的蓬勃發展。其中,最嚴重的問題是學習者的個性化學習不足。傳統教育中教師與學生面對面,學生的一舉一動、學習情況大部分都被教師所掌控,教師能根據實際情況對學習者的學習進行有針對性的指導,學習者也能根據教師的提醒及時改進學習策略,從而使學習更加有針對性。而MOOC教育雖然也可以用一些網絡技術手段讓學習者與教師面對面,但效果并不理想,教師并不能對學習者的實際情況及時地了解并提出解決措施,也不能了解學習者所需要的課程內容。

  MOOC教育很大程度上依賴于學習者的自主性,從而導致有時候連學習者本身都不清楚自己的學習情況,忽略了一些重要的學習信息,例如學習內容之間的聯系、學習程度、學習進度的安排、階段學習目標、下一步的學習內容等,這些都會導致學習的盲目性。

  2.3 大數據給MOOC教育提供機遇

  大數據使得學習更加個性化。美國教育部一份簡報中指出,大數據在教育領域的應用主要為學習分析(LA)和教育數據挖掘(EDM)[4],而兩者在教育技術領域內的應用最終指向個性化學習和自適應學習環境的研究和開發。以大數據為基礎,LA和EDM能夠更好地分析學習者的需求和特點,從而使得學習更傾向于個性化[5]。

3 大數據在MOOC網絡教育產業的應用路線

  MOOC教育產業要想在激烈的競爭中立于不敗之地,需要用數據驅動產業的發展。大數據在一個新的領域中應用,需要經歷從無意識,到初步了解,再到試驗性階段,出現產業機遇,發生產業變革,最后驅動產業發展這樣一個長期的過程。如下圖1所示。

001.jpg

  大數據在應用過程中,需要與傳統的數據采集、存儲、計算方法結合起來,同時利用最新的大數據技術使得結構化數據、半結構化數據及非結構化數據能被充分利用。

  在數據采集階段,可根據不同的情況采用Flume、Sqoop、Scribe、Chukwa等系統。它們各有優勢,例如,Flume是cloudera于2009年7月開源的日志系統,它內置的各種組件非常齊全,用戶幾乎不必進行任何額外開發即可使用。Scribe是Facebook開源的日志收集系統,在Facebook內部已經得到大量的應用。它能夠從各種日志源上收集日志,存儲到一個中央存儲系統上,以便于進行集中統計分析處理。Sqoop是Apache下用于RDBMS和HDFS互相導數據的工具。作為Apache的一個開源項目文件,Sqoop的源碼可以用于從異構的數據庫導入統一的云計算平臺,操作非常簡單。Chukwa簡單地說是一個數據收集系統,它可以將各種類型的數據收集成適合Hadoop處理的文件并保存在HDFS中供Hadoop進行各種MapReduce操作。Chukwa本身也提供了很多內置的功能用于數據的收集和整理。

  在存儲階段,由于大數據時代的數據數量級發生了很大改變,由原來的GB、TB到了PB、ZB,甚至更大。同時,為了提高處理效率,處理方式由集中式處理擴展為分布式處理。因此,對于不同的數據,既要考慮用傳統的數據庫管理系統,如SQL Server、ORACLE等,也不得不應用最近的數據存儲技術和相應的存儲處理系統,如Hadoop。無論國內還是國外的大公司對于數據都有著無窮無盡的渴望,都會想盡一切辦法收集一切數據,因為通過信息的不對稱性可以不斷變現,而大量的信息是可以通過數據分析得到的。數據的來源途徑非常多,數據的格式也越來越多,越來越復雜,隨著時間的推移數據量也越來越大。因此在數據的存儲和基于數據之上的計算上傳統數據庫很快趨于瓶頸。而Hadoop正是為了解決這樣的問題而誕生[6]。其底層的分布式文件系統具有高拓展性,通過數據冗余保證數據不丟失和提高計算效率,同時可以存儲各種格式的數據。同時其還支持多種計算框架,既可以進行離線計算,也可以進行在線實時計算。

  在數據計算階段,由于采用的存儲方式不同,計算方法也不一樣。結構化二維表數據較為規則,處理比較方便,一般對傳統的結構化數據可進行實時計算,而對于半結構化或非結構化數據不得不先進行匯總分析,再進行處理。

  最后,在數據應用階段,根據不同的應用要求,對計算和匯總分析的結果應用到不同的子系統中。在MOOC教育產業中,客戶個性化分析實際上就是在對學習者個性化分析的基礎上進行個性化的教育,給出個性化學習方案。還可以通過數據計算結果進行課程營銷分析,以及提供客戶統計查詢服務和學習者管理,即客戶管理。數據應用的過程如圖2所示。

002.jpg

4 總結

  大數據在MOOC網絡教育中時時刻刻都在產生,這些數據的價值密度要遠大于社交網的數據,因為它們較有針對性,是針對學習者的學習,所以對這部分數據的價值挖掘非常有必要。同時,與網絡學習相關的網絡結點數據和網絡交互數據,雖然價值密度較低,但對其進行持續的數據收集和數據計算,對學習者的個性化分析也能產生巨大作用。教育領域是大數據應用的首要目標,對于學習者的個性化教育、人才結構優化及個人社會適應度的提高都有很大的幫助。

  在大數據的應用過程中,對學習者隱私信息的保護是大家所關注的重點,但同時也是不可避免的問題,需要教育主管部門結合法律法規制定相關的引導性規定,讓大數據得到合理應用的同時避免產生不必要的法律糾紛;其次,應鼓勵與其他大數據企業合作,得到更多高價值密度數據,為數據分析提供充分的資源;最后,提升大數據收集、分析與處理技術。這些措施是讓大數據在MOOC教育領域持續發揮作用的必要保障。

參考文獻

  [1] 熊丙奇.中國教育欠債還沒完全補上[J].基礎教育論壇,2013(8):4-5.

  [2] 陳響園,張權偉.大數據背景下中國交通廣播的“危”與“機”——以杭州交通經濟廣播91.8為例[J].現代傳播,2014(3):130.

  [3] 謝華成,陳向東.面向云存儲的非結構化數據存取[J].計算機應用,2012,32(7):1924-1928,1942.

  [4] U.S.Department of Education, Office of Educational Technology. Enhancing teaching and learning through educational data mining and learning analytics: an issue brief [EB/OL].(2013-5-20).http://www.ed.gov/edblogs/technology/files/2012/03/edm-la-brief.pdf.

  [5] 祝智庭,管玨琪.“網絡學習空間人人通”建設框架[J].中國電化教育,2013(10):6-12.

  [6] 曹坤.為什么很多公司的大數據相關業務都基于Hadoop方案[EB/OL].(2014-06-25)[2015-02-06].http://bbs.pinggu.org/forum.php mod=viewthread&tid=3104026&page=1.


此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 天天射天天干天天操 | 国产精品午夜久久 | 成年做羞羞免费观看视频网站 | 激情五月婷婷开心 | 国产成人永久免费视频 | 亚洲图片二区 | 日韩欧美久久一区二区 | 亚洲高清国产一区二区三区 | 日皮在线观看 | 最近中文2019字幕第二页 | 九九九热精品 | 1区1区3区4区产品亚洲 | 国产xxxx| 欧美激情国内自拍偷 | 在线观看男女爱视频网站 | 看一级毛片国产一级毛片 | 黄色一极毛片 | 日韩精品亚洲人成在线播放 | 做a视频大全| 国产大臿蕉香蕉大视频女 | 午夜毛片免费看 | 黄网在线观看免费 | 国产高清不卡视频在线播放 | 亚洲欧美中文字幕高清在线一 | 久久久亚洲欧美综合 | 中国一级毛片特级毛片 | 国产精品xxxxbbbb18 | 性夜黄a爽爽免费视频国产 性夜黄 a 爽免费看 | 国产一区免费观看 | 日本欧美久久久久免费播放网 | 国产福利免费观看 | 曰本三级香港三级三级人 | 欧美日韩一区二区三区韩大 | 亚州国产 | 国产 欧美 日韩在线 | 秋霞影视伦理手机在线观看 | 国产午夜毛片v一区二区三区 | 最近在线观看免费完整视频 | 国产在线观看成人 | 国产精品福利影院 | 男女交性过程视频无遮挡在线 |