久久人妻牲爱视频,亚洲无码视频区,黑人操人妻一区二区,aaa在线视频,日产精品久久久久久久,99熟妇诱惑视频,激情只爱无码,国产精品日韩一区二区,超碰成人三级在线

文心一言,甩開(kāi)GPT-3.5,與GPT-4掰手腕?

原創(chuàng) 收藏 評(píng)論
舉報(bào) 2023-03-27

文|智能相對(duì)論

作者| 葉遠(yuǎn)風(fēng)

“請(qǐng)寫(xiě)一個(gè)肯德基瘋狂星期四的段子。”

“我女朋友的老公應(yīng)該叫我什么?”

“XX微信群的群主與吳彥祖誰(shuí)更帥?”

......

給幾個(gè)搞怪的問(wèn)題,戲耍一下,把答案貼出來(lái),大家嘲諷一番。

在文心一言發(fā)布后,這種玩法直到今天還沒(méi)有停止的意思。

可能連背后的技術(shù)與產(chǎn)品人員都沒(méi)有想到,文心一言會(huì)以這樣的方式火了下去。

作為國(guó)產(chǎn)版ChatGPT,文心一言在發(fā)布后,除了贊譽(yù)的聲音,以各種形式被批判應(yīng)該在意料之中,ChatGPT當(dāng)初也是如此,這是產(chǎn)品不斷進(jìn)化要經(jīng)歷的過(guò)程。

只不過(guò),在沒(méi)有好壞的定論中,到底要給文心一言當(dāng)下的技術(shù)水準(zhǔn)定一個(gè)什么樣的定義,并沒(méi)有客觀的、更加令人信服的結(jié)論。

起碼,這種“戲耍”并不能反映多模態(tài)大模型所具備的能力。

ChatBOT固然可以閑聊,也應(yīng)該支持用戶隨便閑聊,但閑聊互動(dòng)不應(yīng)該成為一款專業(yè)產(chǎn)品能力的最終評(píng)價(jià)標(biāo)準(zhǔn)。

光怪陸離的問(wèn)題,就算去詢問(wèn)一個(gè)人類智者,得到的答案也是光怪陸離的。

現(xiàn)在來(lái)看,以某種更現(xiàn)實(shí)的視角去提出問(wèn)題、實(shí)測(cè)答案,才更能體現(xiàn)出文心一言的能力和價(jià)值。

這種現(xiàn)實(shí)的視角應(yīng)當(dāng)有很多,其中,以企業(yè)信息需求為著眼點(diǎn),會(huì)是其中之一。

這是因?yàn)?,從文心系列大模型走向?qū)υ挳a(chǎn)品“一言”,或者,從GPT-3.5到GPT-4,ChatBOT最后都還是要走向商用、服務(wù)企業(yè),創(chuàng)造專業(yè)價(jià)值的。

GPT-4發(fā)布后并沒(méi)有公布其參數(shù)量,這被認(rèn)為是走向商業(yè)化的準(zhǔn)備,畢竟OpenAI制定的數(shù)億美元營(yíng)收目標(biāo)現(xiàn)在快到4月份了還沒(méi)太大動(dòng)靜。

而服務(wù)企業(yè),要么提供“生產(chǎn)力”價(jià)值,這是ChatBOT場(chǎng)景垂直化后需要探索的內(nèi)容,在各產(chǎn)業(yè)提供具體的工作能力;要么提供信息價(jià)值,通過(guò)類似“上帝之眼”的信息整合與邏輯梳理能力,幫助企業(yè)消除信息不對(duì)稱,獲取需要的信息。

目前ChatBOT的產(chǎn)業(yè)應(yīng)用還未見(jiàn),因此信息價(jià)值就成為可以客觀評(píng)價(jià)的維度。

1.jpg

“智能相對(duì)論”團(tuán)隊(duì)獲得了文心一言的內(nèi)測(cè)賬號(hào),以及ChatGPT普通版本(基于GPT-3.5)與plus版本(基于GPT-4)的測(cè)試資格,嘗試從企業(yè)信息獲取維度,提出六個(gè)關(guān)聯(lián)問(wèn)題,從各答案中對(duì)比出文心一言的實(shí)際能力。

總體上,文心一言甩開(kāi)GPT-3.5不成問(wèn)題,與GPT-4能夠掰手腕做到有來(lái)有回。

具體一個(gè)個(gè)分析,每個(gè)問(wèn)題下,分別是文心一言、ChatGPT普通版、ChatGPT plus版的回答截圖。

01、企業(yè)數(shù)字轉(zhuǎn)型怎么找外部合作伙伴,現(xiàn)在有哪些類型的伙伴可以選擇?

可以看出,在三個(gè)回答中,只有文心一言提到了選擇外部合作伙伴要注意到的幾點(diǎn),然后再例舉可以找哪些類型的合作伙伴。

而ChatGPT普F通版、ChatGPT plus版都只是直接給出了類型。

這顯示出,文心一言在算法上,相較與其他兩個(gè)產(chǎn)品,對(duì)問(wèn)題的潛在需求認(rèn)識(shí)可能更加深刻。

02、企業(yè)應(yīng)該怎樣抓住新的市場(chǎng)機(jī)遇?

在這個(gè)問(wèn)題的回答中,很顯然,條目的多少,基本上決定了答案的質(zhì)量。

對(duì)一個(gè)企業(yè)來(lái)說(shuō),要抓住市場(chǎng)機(jī)遇,就應(yīng)該要找到更多的方法,考驗(yàn)的是ChatBOT整合信息并分門別類的能力。

在這里,文心一言超越GPT-3.5但略遜于GPT-4。

03、企業(yè)怎么招徠優(yōu)質(zhì)人才,有哪些好用的渠道?

與上一個(gè)問(wèn)題類似,條目的多少直觀反映了chatBOT解決需求的能力。

文心一言遠(yuǎn)超GPT-3.5,并超越了GPT-4,再一次掰贏了手腕。

04、員工的工作效率很低,怎么辦?

這一局,相似的判斷標(biāo)準(zhǔn),文心一言繼續(xù)領(lǐng)先GPT-3.5,但沒(méi)有打贏GPT-4。

05、客戶總是不回款,有什么好的辦法?

這個(gè)問(wèn)題,由于各個(gè)回答都涉及了可能破壞企業(yè)與客戶關(guān)系的行動(dòng),因此都進(jìn)行了一次“打補(bǔ)丁”式的追問(wèn)。

基本上,三個(gè)模型都很好地領(lǐng)會(huì)到了追問(wèn)的意圖,對(duì)“不和客戶關(guān)系搞僵”有準(zhǔn)確的認(rèn)知,并提供了對(duì)應(yīng)的答案。

其中GPT-4的表現(xiàn)超越文心一言。(注意ChatGPT有字?jǐn)?shù)限制,plus版限制在700字左右,所以其輸出因?yàn)樽謹(jǐn)?shù)太多最后被中止)

06、企業(yè)資金鏈緊張,但是銀行不肯借錢,怎么辦?

吸取上個(gè)問(wèn)題的教訓(xùn),這個(gè)問(wèn)題直接把限制條件加入到問(wèn)題當(dāng)中。

16.png

類似上一個(gè)問(wèn)題,三個(gè)模型對(duì)“銀行不借錢”情形下企業(yè)資金鏈緊張的應(yīng)對(duì)辦法都有清晰的認(rèn)知,規(guī)避了銀行信貸這一種方式。

其中,文心一言與GPT-4打成了平手,都提供了相同數(shù)量的方法供企業(yè)選擇。

總結(jié)以上,僅就這六個(gè)企業(yè)比較關(guān)心的專業(yè)問(wèn)題而言,文心一言全面勝過(guò)GPT-3.5,對(duì)GPT-4兩勝、兩負(fù)一平,典型的你來(lái)我往掰手腕。

而更進(jìn)一步看,實(shí)際上在回答條目上的勝負(fù),無(wú)關(guān)算法本身的設(shè)計(jì),在技術(shù)上與算法訓(xùn)練的數(shù)據(jù)量和訓(xùn)練時(shí)長(zhǎng)有關(guān)(要給足夠多的食物,也要給足夠多的時(shí)間去吃食物),后續(xù)的競(jìng)逐將仍然在數(shù)據(jù)訓(xùn)練上。

對(duì)文心一言而言,發(fā)布更晚已經(jīng)吃了虧,下一步如何在訓(xùn)練上追趕、趕超(可能意味著巨大的成本投入)是百度要考慮的問(wèn)題。

當(dāng)然,由于文心系列大模型過(guò)去早已具備了豐富的多模態(tài)能力,因此文心一言在發(fā)布時(shí)就自帶有GPT進(jìn)化到“4代”才加入的多模態(tài)能力,這一點(diǎn)也常常為業(yè)界所忽略。

而“智能相對(duì)論”認(rèn)為,未來(lái)ChatBOT的比拼,將很大程度上在多模態(tài)展開(kāi)。

這意味著,當(dāng)下的文本競(jìng)逐,只是一切的開(kāi)始。

現(xiàn)在,任何的結(jié)論,不管是褒揚(yáng)的還是貶低的,可能都為時(shí)尚早。

*本文圖片均來(lái)源于網(wǎng)絡(luò)

此內(nèi)容為【智能相對(duì)論】原創(chuàng),

僅代表個(gè)人觀點(diǎn),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。

部分圖片來(lái)自網(wǎng)絡(luò),且未核實(shí)版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請(qǐng)作者與我們聯(lián)系。

?AI產(chǎn)業(yè)新媒體;

?澎湃新聞科技榜單月度top5;

?文章長(zhǎng)期“霸占”鈦媒體熱門文章排行榜TOP10;

?著有《人工智能 十萬(wàn)個(gè)為什么》

?【重點(diǎn)關(guān)注領(lǐng)域】智能家電(含白電、黑電、智能手機(jī)、無(wú)人機(jī)等AIoT設(shè)備)、智能駕駛、AI+醫(yī)療、機(jī)器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計(jì)算、開(kāi)發(fā)者以及背后的芯片、算法等。


本文系作者授權(quán)數(shù)英發(fā)表,內(nèi)容為作者獨(dú)立觀點(diǎn),不代表數(shù)英立場(chǎng)。
轉(zhuǎn)載請(qǐng)?jiān)谖恼麻_(kāi)頭和結(jié)尾顯眼處標(biāo)注:作者、出處和鏈接。不按規(guī)范轉(zhuǎn)載侵權(quán)必究。
本文系作者授權(quán)數(shù)英發(fā)表,內(nèi)容為作者獨(dú)立觀點(diǎn),不代表數(shù)英立場(chǎng)。
未經(jīng)授權(quán)嚴(yán)禁轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系作者本人,侵權(quán)必究。
本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表數(shù)英立場(chǎng)。
本文禁止轉(zhuǎn)載,侵權(quán)必究。
本文系數(shù)英原創(chuàng),未經(jīng)允許不得轉(zhuǎn)載。
授權(quán)事宜請(qǐng)至數(shù)英微信公眾號(hào)(ID: digitaling) 后臺(tái)授權(quán),侵權(quán)必究。

    評(píng)論

    文明發(fā)言,無(wú)意義評(píng)論將很快被刪除,異常行為可能被禁言
    DIGITALING
    登錄后參與評(píng)論

    評(píng)論

    文明發(fā)言,無(wú)意義評(píng)論將很快被刪除,異常行為可能被禁言
    800

    推薦評(píng)論

    暫無(wú)評(píng)論哦,快來(lái)評(píng)論一下吧!

    全部評(píng)論(0條)

    梁河县| 新巴尔虎右旗| 南川市| 广西| 沧州市| 漠河县| 安平县| 三河市| 吐鲁番市| 大埔区| 都江堰市| 芒康县| 长沙市| 崇仁县| 隆化县| 黑水县| 东明县| 义乌市| 精河县| 黔江区| 太和县| 视频| 甘孜县| 平和县| 宁夏| 长岛县| 巴林右旗| 唐山市| 凤凰县| 南皮县| 双流县| 阿尔山市| 从江县| 黄山市| 乡城县| 海城市| 开平市| 印江| 明光市| 壤塘县| 临江市|