某市普通高中選課數(shù)據(jù)如圖1所示,學(xué)生從地理、化學(xué)、生物等科目中選擇三門作為高考選考科目,“1”表示已選擇的選考科目。使用 Python編程分析每所學(xué)校各科目選考的總?cè)藬?shù)、全市各科選考總?cè)藬?shù)及其占比,經(jīng)過程序處理后,保存結(jié)果如圖2。
實(shí)現(xiàn)上述功能的 Python程序如下:
import pandas as pd
import itertools
#讀數(shù)據(jù)到pandas的 DataFrame結(jié)構(gòu)中
df=① (”xk73.jye.ai”,sep=‘.’,header=‘infer’,encoding=‘utf-8’)
km=[‘物理’,‘化學(xué)’,‘生物’,‘政治’,‘歷史’,‘地理’,‘技術(shù)’]
zrs=len(df.jye.ai)
#按學(xué)校分組計(jì)數(shù)
sc=df.groupby(‘② ’,as_index=False).count( )
#對(duì)分組計(jì)數(shù)結(jié)果進(jìn)行合計(jì),合計(jì)結(jié)果轉(zhuǎn)換為 DF結(jié)構(gòu)并轉(zhuǎn)置為行
df_sum=pd.DataFrame(data=sc.jye.ai ( ?。?T
df_sum[‘學(xué)校代碼’]=‘合計(jì)’
#增加“合計(jì)”行
result=sc.jye.ai(df_sum)
#百分比計(jì)算
df_percent=df_sum
df_percent[‘學(xué)校代碼’]=‘比例’
for k in km:
per=df_percent.at[0,k]/zrs
df_percent[k]=per
#增加“百分比”行
result=result.jye.ai(df_percent)
#刪除“姓名”列
result=③
#修改“學(xué)生編號(hào)”為“總?cè)藬?shù)”
result=result.jye.ai(columns={‘學(xué)生編號(hào)’:‘總?cè)藬?shù)’})
#保存結(jié)果,創(chuàng)建 Excel文件.生成的 Excel文件
result.to_excel(“學(xué)校人數(shù)統(tǒng)計(jì).xlsx”)
(1)請(qǐng)?jiān)跈M線處填入合適的代碼。
①
pd.read_csv
pd.read_csv
②學(xué)校代碼
學(xué)校代碼
③result.jye.ai('姓名',axis=1)
result.jye.ai('姓名',axis=1)
(2)加框處語句的作用是 將總?cè)藬?shù)存儲(chǔ)到變量zrs中
將總?cè)藬?shù)存儲(chǔ)到變量zrs中
。