“mobike_shanghai.csv“文件存儲(chǔ)了2016年8月份上海某區(qū)域共享單車騎行數(shù)據(jù)。約十萬條記錄,每條記錄有訂單編號(hào)、單車編號(hào)、用戶編號(hào)、開鎖地點(diǎn)、開鎖時(shí)間、關(guān)鎖時(shí)間、騎行耗時(shí)等信息。
請(qǐng)根據(jù)以上情境回答以下問題。
(1)好學(xué)的飛飛同學(xué)想在文件中添加天氣溫度等信息,需要從互聯(lián)網(wǎng)上采集一些數(shù)據(jù),請(qǐng)問可以使用以下哪種方法
C
C
。
A.requests.jye.ai( )
B.requests.jye.ai( ?。?br />C.requests.jye.ai( )
D.requests.jye.ai( ?。?br />(2)飛飛獲取到了網(wǎng)頁源代碼,以下可以用來解析網(wǎng)頁的python函數(shù)庫是 D
D
。
A.requests
B.random
C.HTML
D.BeautifulSoup
飛飛編寫了以下程序,對(duì)下午13時(shí)到18時(shí)的騎行數(shù)據(jù)進(jìn)行統(tǒng)計(jì),并進(jìn)行可視化呈現(xiàn)。
#導(dǎo)入庫 import ① as pd import matplotlib.② as plt #讀取 mobike_shanghai.csv 文件 df=pd.③(“mobike_shanghai,csv“,encoding=“ANSI“) #整理數(shù)據(jù) df.④(keep=“first“,inplace=True) #在篩選數(shù)據(jù) select=⑤ #按單位小時(shí)進(jìn)行頻數(shù)統(tǒng)計(jì) count=select[“time_of_hour“].⑥print (count) #繪制并顯示圖形 plt.⑦(range(1,7),count) plt.jye.ai ( ) |
(3)飛飛想對(duì)csv文本數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,她在上面程序中①處導(dǎo)入的庫為
B
B
。
A.requests
B.pandas
C.csv
D.numpy
(4)上面程序②處導(dǎo)入繪圖庫的語句可以是import matplotlib.______as plt
C
C
。
A.plt
B.plot
C.pyplot
D.numpy
(5)為讀取csv文件,上面程序③處應(yīng)填入的是
B
B
。
A.read_excel
B.read_csv
C.to_excel
D.to_csv
(6)飛飛發(fā)現(xiàn)有些記錄出現(xiàn)如下圖的情況,她通過上面程序④處進(jìn)行數(shù)據(jù)處理的函數(shù)為
D
D
。
A.isnull
B.dropna
C.drop_null
D.drop_duplicates
(7)飛飛想篩選出時(shí)間在13時(shí)到18時(shí)之間的數(shù)據(jù),⑤處可以使用的篩選語句是
C
C
。
A.df[(df['time_of_hour']>=〃13時(shí)〃),(df['time_of_hour']<=〃18時(shí)〃)]
B.df[(df['time_of_hour']>=〃13時(shí)〃)&(df['time_of_hour']<=〃18時(shí)〃)]
C.df[(df['time_of_hour']>=〃13時(shí)〃)and(df['time_of_hour']<=〃18時(shí)〃)]
D.df[(df['time_of_hour']>=〃13時(shí)〃)or(df['time_of_hour']<=〃18時(shí)〃)]
(8)要對(duì)數(shù)據(jù)按單位小時(shí)進(jìn)行頻次統(tǒng)計(jì),結(jié)果如下圖所示,上面程序⑥處應(yīng)填入的是
B
B
。
A.value_counts
B.value_counts( ?。?br />C.sum( )
D.values_count( ?。?br />(9)要繪制下圖所示的圖形,與相應(yīng)數(shù)據(jù)進(jìn)行對(duì)比,上面程序橫線⑦處應(yīng)該填入的是
bar
bar
。