深度學(xué)習(xí)是人工智能的一種具有代表性的實(shí)現(xiàn)方法,以神經(jīng)網(wǎng)絡(luò)為出發(fā)點(diǎn).在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),需要設(shè)置學(xué)習(xí)率來(lái)控制參數(shù)更新的速度,在模型訓(xùn)練初期,會(huì)使用較大的學(xué)習(xí)率進(jìn)行模型優(yōu)化,隨著迭代次數(shù)增加,學(xué)習(xí)率會(huì)逐漸進(jìn)行減小,保證模型在訓(xùn)練后期不會(huì)有太大的波動(dòng).在神經(jīng)網(wǎng)絡(luò)優(yōu)化中,指數(shù)衰減的學(xué)習(xí)率模型為L(zhǎng)=L0DGG0,其中L表示每一輪優(yōu)化時(shí)使用的學(xué)習(xí)率,L0表示初始學(xué)習(xí)率,D表示衰減系數(shù),G表示訓(xùn)練迭代輪數(shù),G0表示衰減速度.已知某個(gè)知識(shí)衰減的學(xué)習(xí)率模型的初始學(xué)習(xí)率為0.6,衰減速度為12,且當(dāng)訓(xùn)練迭代輪數(shù)為12時(shí),學(xué)習(xí)率衰減為0.3,則學(xué)習(xí)率衰減到0.1以下(不含0.1)所需的訓(xùn)練迭代輪數(shù)至少為(參考數(shù)據(jù):log23≈1.59)( ?。?/h1>
D
G
G
0
【考點(diǎn)】根據(jù)實(shí)際問(wèn)題選擇函數(shù)類型.
【答案】B
【解答】
【點(diǎn)評(píng)】
聲明:本試題解析著作權(quán)屬菁優(yōu)網(wǎng)所有,未經(jīng)書(shū)面同意,不得復(fù)制發(fā)布。
發(fā)布:2024/5/6 8:0:9組卷:120引用:3難度:0.5
相似題
-
1.酒駕是嚴(yán)重危害交通安全的違法行為.為了保障交通安全,國(guó)家有關(guān)規(guī)定:駕駛員血液中的酒精含量大于或等于20mg/100ml,小于80mg/100ml的駕駛行為為酒后駕車,80mg/100ml及以上認(rèn)定為醉酒駕車.假設(shè)某駕駛員喝了一定量的酒后,其血液中的酒精含量上升到了100mg/100ml.如果停止喝酒后,他血液中酒精含量會(huì)以每小時(shí)30%的速度減少,那么他至少經(jīng)過(guò)( ?。┬r(shí)才能駕駛.(參考數(shù)據(jù)lg5≈0.7,lg7≈0.85)
發(fā)布:2024/12/17 6:0:2組卷:25引用:1難度:0.7 -
2.地震震級(jí)根據(jù)地震儀記錄的地震波振幅來(lái)測(cè)定,一般采用里氏震級(jí)標(biāo)準(zhǔn).震級(jí)M用距震中100千米處的標(biāo)準(zhǔn)地震儀所記錄的地震波最大振幅值的對(duì)數(shù)來(lái)表示.里氏震級(jí)的計(jì)算公式為:M=lg
(其中常數(shù)A0是距震中100公里處接收到的0級(jí)地震的地震波的最大振幅;Amax是指我們關(guān)注的這次地震在距震中100公里處接收到的地震波的最大振幅).地震的能量E是指當(dāng)?shù)卣鸢l(fā)生時(shí),以地震波的形式放出的能量.E=104.8×101.5M(單位:焦耳),其中M為地震震級(jí).已知甲地地震產(chǎn)生的能量是乙地地震產(chǎn)生的能量的103倍,若乙地地震在距震中100公里處接收到的地震波的最大振幅為A,則甲地地震在距震中100公里處接收到的地震波的最大振幅為( ?。?/h2>AmaxA0發(fā)布:2024/12/17 5:30:7組卷:203引用:4難度:0.6 -
3.某種雜志原以每本2.5元的價(jià)格銷售,可以售出8萬(wàn)本.據(jù)市場(chǎng)調(diào)查,雜志的單價(jià)每提高0.1元,銷售量就可能減少2000本,若使提價(jià)后的銷售總收入不低于20萬(wàn)元,則提價(jià)后的價(jià)格至多是( ?。?/h2>
發(fā)布:2024/12/18 8:0:9組卷:55引用:4難度:0.8
把好題分享給你的好友吧~~