菁于教,優(yōu)于學(xué)
旗下產(chǎn)品
校本題庫(kù)
菁優(yōu)備課
開(kāi)放平臺(tái)
菁優(yōu)測(cè)評(píng)
菁優(yōu)公式
小優(yōu)同學(xué)
菁優(yōu)App
數(shù)字備考
充值服務(wù)
試卷征集
申請(qǐng)校本題庫(kù)
智能組卷
錯(cuò)題庫(kù)
五大核心功能
組卷功能
資源共享
在線作業(yè)
在線測(cè)評(píng)
試卷加工
游客模式
登錄
試題
試題
試卷
課件
試卷征集
加入會(huì)員
操作視頻
高中數(shù)學(xué)
小學(xué)
數(shù)學(xué)
語(yǔ)文
英語(yǔ)
奧數(shù)
科學(xué)
道德與法治
初中
數(shù)學(xué)
物理
化學(xué)
生物
地理
語(yǔ)文
英語(yǔ)
道德與法治
歷史
科學(xué)
信息技術(shù)
高中
數(shù)學(xué)
物理
化學(xué)
生物
地理
語(yǔ)文
英語(yǔ)
政治
歷史
信息
通用
中職
數(shù)學(xué)
語(yǔ)文
英語(yǔ)
推薦
章節(jié)挑題
知識(shí)點(diǎn)挑題
智能挑題
收藏挑題
試卷中心
匯編專(zhuān)輯
細(xì)目表組卷
組卷圈
當(dāng)前位置:
2023年湖南省郴州市高考數(shù)學(xué)第三次質(zhì)檢試卷
>
試題詳情
chatGPT是由OpenAI開(kāi)發(fā)的一款人工智能機(jī)器人程序,一經(jīng)推出就火遍全球.chatGPT的開(kāi)發(fā)主要采用RLHF(人類(lèi)反饋強(qiáng)化學(xué)習(xí))技術(shù),訓(xùn)練分為以下三個(gè)階段.
第一階段:訓(xùn)練監(jiān)督策略模型.對(duì)抽取的prompt數(shù)據(jù),人工進(jìn)行高質(zhì)量的回答,獲?。紁rompt,answer>數(shù)據(jù)對(duì),幫助數(shù)學(xué)模型GPT-3.5更好地理解指令.
第二階段:訓(xùn)練獎(jiǎng)勵(lì)模型.用上一階段訓(xùn)練好的數(shù)學(xué)模型,生成k個(gè)不同的回答,人工標(biāo)注排名,通過(guò)獎(jiǎng)勵(lì)模型給出不同的數(shù)值,獎(jiǎng)勵(lì)數(shù)值越高越好.獎(jiǎng)勵(lì)數(shù)值可以通過(guò)最小化下面的交叉熵?fù)p失函數(shù)得到:
L
oss
=
-
n
∑
i
=
1
y
i
ln
?
y
i
,其中
y
i
∈
{
0
,
1
}
,
?
y
i
∈
(
0
,
1
)
,且
n
∑
i
=
1
?
y
i
=
1
.
第三階段:實(shí)驗(yàn)與強(qiáng)化模型和算法.通過(guò)調(diào)整模型的參數(shù),使模型得到最大的獎(jiǎng)勵(lì)以符合人工的選擇取向.
參考數(shù)據(jù):ln2≈0.693,ln5≈1.609,ln7≈1.946
(1)若已知某單個(gè)樣本,其真實(shí)分布y=[y
1
,y
2
,?,y
10
]=[0,0,0,0,1,0,0,0,0,0],其預(yù)測(cè)近似分布
?
y
=
[
y
1
,
y
2
,
?
,
y
10
]
=
[
0
,
0
.
2
,
0
,
0
,
0
.
7
,
0
,
0
,
0
.
1
,
0
,
0
]
,計(jì)算該單個(gè)樣本的交叉熵?fù)p失函數(shù)Loss值.
(2)絕對(duì)值誤差MAE也是一種比較常見(jiàn)的損失函數(shù),現(xiàn)已知某n階變量的絕對(duì)值誤差,
MAE
=
1
N
n
∑
i
|
?
y
i
-
y
i
|
,其中
|
?
y
i
-
y
i
|
=
|
?
y
i
1
-
y
i
1
|
+
|
?
y
i
2
-
y
i
2
|
+
…
+
|
?
y
in
-
y
in
|
,N表示變量的階.若已知某個(gè)樣本是一個(gè)三階變量的數(shù)陣
y
=
y
1
y
2
y
3
=
y
11
,
y
12
,
y
13
y
21
,
y
22
,
y
23
y
31
,
y
32
,
y
33
,其真實(shí)分布是
y
=
0
,
0
,
1
0
,
1
,
0
1
,
0
,
0
,現(xiàn)已知其預(yù)測(cè)分布為
?
y
=
a
,
b
,
c
c
,
a
,
b
b
,
c
,
a
,求證:該變量的絕對(duì)值誤差MAE為定值.
(3)在測(cè)試chatGPT時(shí),如果輸入問(wèn)題沒(méi)有語(yǔ)法錯(cuò)誤chatGPT的回答被采納的概率為90%,當(dāng)出現(xiàn)語(yǔ)法錯(cuò)誤時(shí),chatGPT的回答被采納的概率為50%.現(xiàn)已知輸入的問(wèn)題中出現(xiàn)語(yǔ)法錯(cuò)誤的概率為5%,現(xiàn)已知chatGPT的回答被采納,求該問(wèn)題的輸入語(yǔ)法沒(méi)有錯(cuò)誤的概率.
【考點(diǎn)】
條件概率
.
【答案】
見(jiàn)試題解答內(nèi)容
【解答】
【點(diǎn)評(píng)】
聲明:本試題解析著作權(quán)屬菁優(yōu)網(wǎng)所有,未經(jīng)書(shū)面同意,不得復(fù)制發(fā)布。
當(dāng)前模式為游客模式,
立即登錄
查看試卷全部?jī)?nèi)容及下載
發(fā)布:2024/6/27 10:35:59
組卷:215
引用:2
難度:0.6
相似題
1.
甲、乙為完全相同的兩個(gè)不透明袋子,袋內(nèi)均裝有除顏色外完全相同的球.甲袋中裝有5個(gè)白球,7個(gè)紅球,乙袋中裝有4個(gè)白球,2個(gè)紅球.從兩個(gè)袋中隨機(jī)抽取一袋,然后從所抽取的袋中隨機(jī)摸出1球,則摸出的球是紅球的概率為( ?。?/h2>
A.
1
2
B.
11
24
C.
7
12
D.
1
3
發(fā)布:2024/11/19 11:0:1
組卷:350
引用:3
難度:0.7
解析
2.
某校高三年級(jí)要從5名男生和2名女生中任選3名代表參加數(shù)學(xué)競(jìng)賽(每人被選中的機(jī)會(huì)均等),記A為“男生甲被選中”,B為“男生乙和女生丙至少一個(gè)被選中”,則下列結(jié)論中正確的是( ?。?/h2>
A.
P
(
A
)
=
3
7
B.
P
(
B
)
=
2
7
C.
P
(
AB
)
=
9
35
D.
P
(
B
|
A
)
=
3
5
發(fā)布:2024/11/19 5:30:2
組卷:128
引用:6
難度:0.6
解析
3.
在一次對(duì)高三年級(jí)學(xué)生兩次模擬考試數(shù)學(xué)成績(jī)的統(tǒng)計(jì)調(diào)查中發(fā)現(xiàn),兩次成績(jī)均得優(yōu)的學(xué)生占5%,僅第一次得優(yōu)的占7.9%,僅第二次得優(yōu)的占8.9%.則( )
A.已知某學(xué)生第一次得優(yōu),則第二次也得優(yōu)的概率為0.388
B.已知某學(xué)生第一次得優(yōu),則第二次也得優(yōu)的概率為0.139
C.某同學(xué)兩次均未得優(yōu)的概率為0.782
D.某同學(xué)兩次均未得優(yōu)的概率為0.95
發(fā)布:2024/11/18 12:30:1
組卷:201
引用:4
難度:0.8
解析
把好題分享給你的好友吧~~
商務(wù)合作
服務(wù)條款
走進(jìn)菁優(yōu)
幫助中心
兼職招聘
意見(jiàn)反饋
深圳市菁優(yōu)智慧教育股份有限公司
粵ICP備10006842號(hào)
公網(wǎng)安備44030502001846號(hào)
?2010-2024 jyeoo.com 版權(quán)所有
深圳市市場(chǎng)監(jiān)管
主體身份認(rèn)證
APP開(kāi)發(fā)者:深圳市菁優(yōu)智慧教育股份有限公司 | 應(yīng)用名稱(chēng):菁優(yōu)網(wǎng) | 應(yīng)用版本:4.8.2 |
隱私協(xié)議
第三方SDK
用戶(hù)服務(wù)條款
廣播電視節(jié)目制作經(jīng)營(yíng)許可證
出版物經(jīng)營(yíng)許可證
網(wǎng)站地圖
本網(wǎng)部分資源來(lái)源于會(huì)員上傳,除本網(wǎng)組織的資源外,版權(quán)歸原作者所有,如有侵犯版權(quán),請(qǐng)立刻和本網(wǎng)聯(lián)系并提供證據(jù),本網(wǎng)將在三個(gè)工作日內(nèi)改正