項目:探究高一各學(xué)科相關(guān)性分析
[項目情境]
在信息化浪潮的推動下,互聯(lián)網(wǎng)技術(shù)不斷發(fā)展,云計算、移動互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能
等新興技術(shù)嶄露頭角。使用數(shù)據(jù)挖掘相關(guān)技術(shù)對中學(xué)教學(xué)活動中產(chǎn)生的數(shù)據(jù)進行收集與處理,獲取有利于教學(xué)的相關(guān)信息,也是推進智慧教育的舉措之一。在教學(xué)過程中,學(xué)科考試成績能夠在一定程度反映學(xué)生的認知發(fā)展水平,某校對高一年級學(xué)生的成績進行數(shù)據(jù)處理,分析各學(xué)科之間的關(guān)聯(lián)度找出優(yōu)勢學(xué)科,對教學(xué)及學(xué)生選科有重要的參考價值。
[項目綜述]
(一) 概述項目目的、方法和過程。根據(jù)要求,回答問題。
(1)數(shù)據(jù)分析需要使用恰當?shù)姆椒ê凸ぞ撸瑢?shù)據(jù)進行各種分析。我們可以通過 關(guān)聯(lián)分析關(guān)聯(lián)分析尋找數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性,可以通過 聚類分析聚類分析在分類標準未知的情況下進行數(shù)據(jù)自動分類,可以根據(jù)分類準則通過 數(shù)據(jù)分類數(shù)據(jù)分類對未知數(shù)據(jù)進行預(yù)測。(選填:數(shù)據(jù)分類、關(guān)聯(lián)分析、聚類分析)
(2)本項目主要通過模擬大數(shù)據(jù)采集與分析方法,采用 關(guān)聯(lián)分析關(guān)聯(lián)分析(選填:數(shù)據(jù)分析、關(guān)聯(lián)分析、聚類分類)的方法進行數(shù)據(jù)分析,試圖分析高一年級學(xué)生各 學(xué)科之間的關(guān)聯(lián)度,找出兩到三門優(yōu)勢學(xué)科,作為指導(dǎo)教學(xué)及學(xué)生選科的重要參考依據(jù)。
(3)確定需要收集的數(shù)據(jù)為歷年高一年級期中期末的各學(xué)科成績,在數(shù)據(jù)收集、發(fā)布、傳播、共享時,為保護學(xué)生的隱私應(yīng)采用 匿名處理匿名處理(選填:數(shù)據(jù)精度處理、人工干擾、匿名處理、訪問控制)等技術(shù)手段。
(4)選用Python語言作為數(shù)據(jù)分析工具,需要通過調(diào)用諸如標準模塊、自定義模塊以及第三方擴展庫的支持,從而高效的完成數(shù)據(jù)采集處理、分析、可視化。數(shù)據(jù)分析步驟有①數(shù)據(jù)呈現(xiàn)②數(shù)據(jù)分類/關(guān)聯(lián)分析/聚類分析③數(shù)據(jù)采集④分析報告⑤數(shù)據(jù)預(yù)處理,正確的順序是 ③⑤②①④③⑤②①④。(寫出序號即可)
[項目實施]
(一)數(shù)據(jù)采集與預(yù)處理
Ⅰ、(24分)圖1-1為記錄歷年高中各科成績的部分文件,圖1-2為獲取所有高一成績并寫人指定文件“高-考試成績總.xlsx“的部分程序代碼。圖1-3為獲取的高一考試成績的部分數(shù)據(jù)內(nèi)容。根據(jù)要求,回答問題。
(1)觀察圖1-2,該程序用 循環(huán)循環(huán)結(jié)構(gòu)嵌套 選擇或分支選擇或分支結(jié)構(gòu)(選填:順序、選擇、循環(huán))描述算法,實現(xiàn)從若干個xlsx文件中篩選出高一成績并保存 為數(shù)據(jù)文件,其中在Python語言中表示判斷數(shù)據(jù)大小關(guān)系的運算符“==”表示 等于等于 ( 選填:不等于等于)。補充程序代碼中缺失的語句,應(yīng)在下橫線處填寫 ”高一””高一”。
(2)對采集的數(shù)據(jù)進行有效存儲,以便對數(shù)據(jù)進行分析和使用。海量的數(shù)據(jù)幾乎包含一切形式的結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化的數(shù)據(jù)。網(wǎng)絡(luò)中的音視頻、圖片、地理位置、網(wǎng)絡(luò)日志等數(shù)據(jù)屬于 非結(jié)構(gòu)化非結(jié)構(gòu)化數(shù)據(jù),如圖1-3,“高一考試成績總.xlsx“中的數(shù)據(jù)屬于 結(jié)構(gòu)化結(jié)構(gòu)化數(shù)據(jù)。(選填:結(jié)構(gòu)化、非結(jié)構(gòu)化)
(3)在數(shù)據(jù)分析之前,需要運用 特征探索特征探索方法(選填:特征探索、關(guān)聯(lián)分析、聚類分析、數(shù)據(jù)分類)對數(shù)據(jù)進行預(yù)處理,發(fā)現(xiàn)和處理缺失值以保證數(shù)據(jù)的完整,還需要對異常數(shù)據(jù)進行清理,分析是否有冗余數(shù)據(jù)等。觀察圖1-3,“201”屬于 異常值異常值數(shù)據(jù),虛線部分屬于 缺失值缺失值數(shù)據(jù)(選填:缺失值、異常值、冗余值),應(yīng)當刪除數(shù)據(jù)所在 行行(選填:行、列)。
(4)觀察圖1-3表格的數(shù)據(jù),在收集數(shù)據(jù)的過程中,你認為哪些數(shù)據(jù)可以不采集?為什么?
(二)數(shù)據(jù)分析與可視化
Ⅱ.(14分)運用Python語言編程進行數(shù)據(jù)分析與可視化表達,分析部分結(jié)果如圖2-1、2-2。根據(jù)要求,回答問題。
(1)觀察圖2-1,該校學(xué)生地理物理生物同時優(yōu)秀的概率最 高高,政治、物理、化學(xué)同時優(yōu)秀的概率較低。
(2)為便于理解數(shù)據(jù)之間的關(guān)系,使用數(shù)據(jù)可視化工具可以圖表形式直觀呈現(xiàn)。如折線圖可以表示關(guān)于 趨勢趨勢的分析、散點圖可以表示關(guān)于 邏輯關(guān)系邏輯關(guān)系的分析、數(shù)據(jù)地圖可以表示關(guān)于 空間關(guān)系空間關(guān)系的分析(選填:邏輯關(guān)系、空間關(guān)系、趨勢)。如圖2-2所示選用 柱形(狀)柱形(狀)圖將數(shù)據(jù)分析可視化呈現(xiàn)。
(3)下列關(guān)于數(shù)據(jù)可視化的描述中,正確的是 ABCDABCD。(多選)
A.可視化也可以將數(shù)據(jù)以地圖、動畫等形式表示
B.可視化可以有效提升數(shù)據(jù)分析的效率
C.可視化可以讓人們快速抓住要點信息
D.可視化可以幫助人們發(fā)現(xiàn)數(shù)據(jù)背后的價值
(三)分析報告
Ⅲ.(7分)在數(shù)據(jù)分析中,使用數(shù)據(jù)可視化工具可以直觀的呈現(xiàn)數(shù)據(jù)之間的關(guān)系,尋找數(shù)據(jù)之間的內(nèi)在規(guī)律,最終實現(xiàn)數(shù)據(jù)的應(yīng)用。
(1)觀察圖2-2,說說你從圖中發(fā)現(xiàn)了什么?挖掘出哪些信息?
(2)結(jié)合自己的學(xué)習和生活,談一談數(shù)據(jù)的重要性。(100字左右)
【答案】關(guān)聯(lián)分析;聚類分析;數(shù)據(jù)分類;關(guān)聯(lián)分析;匿名處理;③⑤②①④;循環(huán);選擇或分支;等于;”高一”;非結(jié)構(gòu)化;結(jié)構(gòu)化;特征探索;異常值;缺失值;行;高;趨勢;邏輯關(guān)系;空間關(guān)系;柱形(狀);ABCD
【解答】
【點評】
聲明:本試題解析著作權(quán)屬菁優(yōu)網(wǎng)所有,未經(jīng)書面同意,不得復(fù)制發(fā)布。
發(fā)布:2024/5/23 20:38:36組卷:4引用:2難度:0.3
把好題分享給你的好友吧~~