關(guān)注民生 服務(wù)社會 發(fā)掘真相 傳播價值 感謝您瀏覽江蘇蘇訊網(wǎng)。 歡迎投稿:郵箱724922822@qq.com 客服電話:025-86163400 18061633398

大模型“考生”破題全國一卷高考作文,聽聽人工智能專家怎么說

2025-06-10 10:26 來源: 新京報 編輯:玖柒六 瀏覽量:0

又到一年高考季。6月7日上午,首門考試科目語文落幕,話題“高考語文作文”又一次登上網(wǎng)絡(luò)熱搜。接下來,是各AI大模型的“考試”時間,讓市場上主流的大模型來答高考作文,能力如何?新京報記者記者選取了國內(nèi)外有代表性的DeepSeek、百度文心一言、智譜清言、ChatGPT-4o四個大模型進(jìn)行測試,并邀請多位語文名師給AI作文打分、評價。

在語文名師的眼中,AI大模型的寫作能力如何?AI大模型助力寫作能力提升的正確打開方式是什么?如何釋放AI大模型在語文學(xué)科教育教學(xué)中的潛力?有哪些注意事項(xiàng)?多位人工智能專家也對此話題進(jìn)行了探討。

圍繞材料打轉(zhuǎn),大模型作文對材料理解容易表面化

此次測評選取DeepSeek、百度文心一言、智譜清言、ChatGPT-4o均為通用大模型。在試卷選擇上,選擇了覆蓋省份較多的全國一卷。同時,為了防止使用者個人習(xí)慣以及提示詞對大模型生成作文的影響,統(tǒng)一選擇了不加任何額外要求、將作文題目直輸給大模型后生成的第一篇作文。

被眾多網(wǎng)友認(rèn)為“難”的全國一卷作文該如何破題?5個大模型在此次“考試”中,整體表現(xiàn)如何?

全國著名語文特級教師王大績提到,艾青和穆旦的材料都來自于教材,都寫于抗日戰(zhàn)爭時期;老舍的《鼓書藝人》出現(xiàn)在試卷的閱讀文章中,也是反映抗日戰(zhàn)爭的事情,“指向性很明確,就是要圍繞抗戰(zhàn)勝利80周年來思考?!睆倪@個角度上來講,智譜清言、百度文心一言的作文都在寫作中提到了這一要素,DeepSeek與ChatGPT-4o則顯然脫離了這一背景。

不過,王大績也提到,如果在破題時聯(lián)想提高一個層面,那主題也可以是“答案是豐富多彩的,心靈的選擇、轉(zhuǎn)折、生活在發(fā)展?!?/p>

北京市特級、正高級教師何郁提到,作文要切題不僅要理解好三個材料,更要把握好三個材料背后的時代背景及其共同體現(xiàn)的價值觀。賀老師同樣認(rèn)為,寫好作文的前提是破好題,要讀懂命題者的命題思路,“三個材料是有內(nèi)在的邏輯關(guān)系的、不是割裂的,需要把三個材料背后的邏輯關(guān)系弄清楚,提煉出一個主題來?!?/p>

語文名師賀老師提到,綜合來看,DeepSeek、智譜清言、ChatGPT-4o三個“考生”的表現(xiàn)略差,“沒有把材料吃透,只是圍繞著材料在‘打轉(zhuǎn)’。正常的作文是破題之后,要跳出材料,提煉出自己的觀點(diǎn),并展開論證?!?/p>

“大模型雖然語言材料很豐富,但是在客觀、科學(xué)地分析材料建立自己的邏輯層次和理性思考上就會比較弱?!痹诤斡艨磥恚竽P驮趯懽髯h論文時雖然可以按照三段式的邏輯來進(jìn)行論證,但容易陷入“新八股文”的思路,難以進(jìn)行真正的層層遞進(jìn)式的有邏輯的寫作,“這對大模型來說是很有挑戰(zhàn)的?!?/p>

與此同時,三位老師也提到了此次大模型寫作中普遍出現(xiàn)的問題,“AI味兒”、內(nèi)容空洞、缺少針對性以及素材案例缺乏。

賀老師提到,大模型寫的作文很容易將重心都放在解釋材料上,并不能真正理解三個材料之間的聯(lián)系和命題人的意圖,“寫得長了就容易翻來覆去胡說八道,看著像百科全書一樣,其實(shí)就是解釋、回答問題,沒有獨(dú)特的個性化的思考?!?/p>

何郁也認(rèn)為大模型寫作文對材料的理解會比較表面化,多是泛泛而談。大模型在寫作文時,能建構(gòu)一定的層次、按照一定的邏輯思路寫作,但語句表達(dá)比較偏向于抒情,最欠缺的是思想認(rèn)識和思辨能力,幾乎沒有針對題目作出獨(dú)立的思考和判斷。

王大績提出,雖然有的大模型“考生”在寫作中提到了抗戰(zhàn),但是作文中幾乎沒有抗日戰(zhàn)爭期間的事例素材。

四家大模型寫高考作文,誰的表現(xiàn)更勝一籌?

是否切題、語言表達(dá)、邏輯結(jié)構(gòu)、認(rèn)知匹配等是此次大模型作文評判的重要關(guān)注內(nèi)容。記者將全國一卷作文拋給了四家大模型,它們的答案以及各位教師的打分、點(diǎn)評如下:

第一篇:

沉默與歌唱:論苦難中的聲音表達(dá)(DeepSeek)

點(diǎn)評:

何郁給DeepSeek寫的這篇作文打了50分。在其看來,這篇作文突出了“論”,體現(xiàn)了文體特征,同時材料豐富、能夠很自然地融入文章之中,有一定可讀性。這也是四篇作文中最能體現(xiàn)大模型材料豐富特點(diǎn)的一篇。不過,這篇作文在理解題意上有偏差,對“沉默”“表達(dá)”“聲音”等關(guān)鍵詞的理解,不完全符合題意。

王大績認(rèn)為這篇作文得分有可能沖擊滿分作文。雖然并沒有圍繞抗戰(zhàn)展開,但是聚焦如何對待苦難進(jìn)行了表達(dá),寓意比較深刻、思路很清楚。

第二篇:

嘶啞亦能成歌,擔(dān)當(dāng)鑄就力量(智譜清言)

點(diǎn)評:

何郁為這篇作文打了42分。在其看來,這篇作文語言表達(dá)通順,內(nèi)容層次分明,有局部精彩。缺點(diǎn)就在于理解題意有偏差,表達(dá)比較表面化,碎片化解讀題目。

賀老師也打了42分?!斑@篇作文開篇就是在解釋三個材料,始終在這里面打轉(zhuǎn)。”賀老師表示,大模型顯然沒有了解新高考作文的特點(diǎn)。

第三篇

以歌為刃,破繭前行(百度文心一言)

點(diǎn)評:

賀老師給這篇作文打了46分。在其看來,這篇作文從體例上看最符合議論文的要求,有論點(diǎn)“以歌為刃”,也有三個分論點(diǎn),同時在論據(jù)中列舉了嫦娥5號、5G等發(fā)展成果。不足在于缺乏更多現(xiàn)實(shí)的新鮮的素材和個性化的表達(dá),“沒有結(jié)合當(dāng)下我們的現(xiàn)實(shí)情況,缺乏一種家國情懷、大格局。倒數(shù)第二段是硬傷?!?/p>

何郁給出了48分,“由歌聲關(guān)聯(lián)困境、民族、時代,關(guān)聯(lián)民族危亡,關(guān)聯(lián)砥礪奮進(jìn),比較符合題旨?!钡@篇作文采用的是三段論式的論證,顯八股味道,深刻性、思辨性還是欠缺。標(biāo)題不好,略顯俗套。論述性有所欠缺。

第四篇:

沉默與吶喊之間:個體良知的覺醒(ChatGPT-4o)

點(diǎn)評:

何郁給ChatGPT-4o寫的作文打了40分。雖然這篇作文語言基本通順,層次比較清楚,能聯(lián)系現(xiàn)實(shí),但是對原材料的理解偏差較大。何郁分析,其第一句話停留在表面,第二句不太準(zhǔn)確,第三句一般化。“覺醒”應(yīng)該是對的,雖然這些“覺醒”是由個體發(fā)出的,但指向“個體”有失偏頗。

專家點(diǎn)評大模型寫作:體例完整、邏輯性強(qiáng)但情感不足

當(dāng)前,各大AI大模型的寫作能力如何?

清華大學(xué)新聞與傳播學(xué)院、清華大學(xué)人工智能學(xué)院雙聘教授沈陽表示,AI大模型的寫作能力涉及兩種類型,一種是AI快生,即輸入一句話大模型給出一篇作文,這代表了大模型的基本能力,“現(xiàn)在大部分大模型的基本能力已經(jīng)不錯了。”第二種是人機(jī)優(yōu)生,即使用者給出一定的提示詞并經(jīng)過長期使用之后大模型表現(xiàn)出來的能力,“這里面不僅包括了大模型的基本能力,也包括了使用者長期跟它對話之后形成的某種風(fēng)格。這樣的情況下,AI大模型生成作文的能力是非常強(qiáng)的,接近甚至超過了一般的網(wǎng)絡(luò)寫手?!?/p>

北京教育科學(xué)研究院信息中心副主任唐亮表示,大模型在文本的學(xué)習(xí)、訓(xùn)練和應(yīng)用方面有其獨(dú)到之處,在通過海量的語言文字學(xué)習(xí)之后,基本上都能達(dá)到語法正確、文本流暢的水平,而且可以在文本寫作中靈活應(yīng)用語料庫中的各種素材、典故、詩詞、名言名句等等,“同時在體例結(jié)構(gòu)、邏輯結(jié)構(gòu)方面來看,大模型也已經(jīng)達(dá)到了較好水平。”

AI大模型在不同文體上的寫作表現(xiàn)如何?在沈陽看來,“評論類邏輯性比較強(qiáng)的文體,大模型表現(xiàn)非常好,但是長一些的文章或者情感比較豐富的記敘文,大模型在主體一致性、描述的縝密性上就會顯現(xiàn)出很多瑕疵?!?/p>

北京郵電大學(xué)計算機(jī)學(xué)院副教授、中國人工智能學(xué)會智能服務(wù)專業(yè)委員會副秘書長王曉茹同樣認(rèn)為,AI大模型寫出的高考作文邏輯性比較嚴(yán)謹(jǐn)、論據(jù)也比較充分,但是在文學(xué)性表達(dá)能力、創(chuàng)新性以及深度上仍與人類寫作的作文有距離,“相比于議論文,大模型寫記敘文的時候機(jī)器味兒更重?!迸c此同時,AI大模型在寫作中也有“短板”,“沒有情感,或者說情感表達(dá)能力很薄弱。可能大模型會很快寫出一篇超過大多數(shù)人寫作水平的作文來,但是受限于現(xiàn)在的算法,它是沒有辦法真正‘讀懂’訓(xùn)練的文章,盡管可以利用海量語料庫的訓(xùn)練生成一定的情感,但文學(xué)性不足。”

王曉茹分析,影響大模型能力的主要是算力、數(shù)據(jù)以及算法模型三大因素,在現(xiàn)在算力勢均力敵的情況下,數(shù)據(jù)也就是語料庫以及算法模型是影響其能力的關(guān)鍵?!案骷乙矔诨镜恼Z料投喂之后,有針對性地進(jìn)行微調(diào),這個微調(diào)就跟投喂的語料庫有關(guān)系了。比如有的大模型會偏重于編程創(chuàng)作,有的會偏重于文學(xué)藝術(shù),有的會偏重于問題解答等等?!?/p>

唐亮認(rèn)為,大模型訓(xùn)練的邏輯本質(zhì)上仍然是基于海量文本和語料數(shù)據(jù)進(jìn)行模仿和重組,“已有的信息,不管是體例結(jié)構(gòu)、語言風(fēng)格還是思維模式上,都是在模仿,短時間內(nèi)很難進(jìn)行開創(chuàng)性的風(fēng)格或者思維方式、邏輯方式的呈現(xiàn),所以耳目一新的閱讀體驗(yàn)跟優(yōu)秀的作文相比還是有一定差距。”同時,唐亮提出,優(yōu)秀作文也與寫作者本身的經(jīng)歷、思考和情感有關(guān),這是作為模仿性、學(xué)習(xí)型大模型難以企及的地方,“總體來說就是可以形似但是難以神似,在思想深度、原創(chuàng)性、藝術(shù)性和情感性方面,跟真正優(yōu)秀的作文還很難相提并論。”

要善于利用大模型提升寫作能力,也要避免過于依賴

專家一致認(rèn)為,AI大模型在語文教育教學(xué)中大有可為。

在唐亮看來,AI大模型可以促進(jìn)教育公平,只要有網(wǎng)絡(luò)有終端的地方都可以零門檻使用大模型,讓更多人了解接觸匯集人類智慧的知識寶庫。“也會推動教師角色的轉(zhuǎn)變,從傳統(tǒng)意義的知識傳授者變成學(xué)習(xí)過程的引導(dǎo)者、設(shè)計者和評估者,更注重提升學(xué)生的判斷力、批判力、思維能力和創(chuàng)新能力。同時,也會推動學(xué)習(xí)方式變革,讓學(xué)生更加主動學(xué)習(xí)?!?/p>

在使用中,AI大模型可以助力拓展知識,“它打破了課堂的空間邊界和書本的載體邊界,大家通過網(wǎng)絡(luò)通過APP就可以連接到匯集人類整體知識的巨大知識庫,可以獲取很多課堂上、書本上獲取不到的知識?!蓖瑫r,大模型還可以幫助學(xué)生輔助閱讀,“一篇文章從不同的視角來分析來解讀,有哪些修辭手法、文章結(jié)構(gòu)如何等等,大模型都可以輔助。”同時,使用大模型進(jìn)行輔助寫作評判,可以及時提供語法、句式、邏輯性等不同維度的反饋,甚至可以提供很多素材,“更重要的是,大模型的介入可以提供個性化的學(xué)習(xí)輔導(dǎo)。每個學(xué)生的寫作水平能力和偏好是不同的,利用大模型可以提供更多個性化的訓(xùn)練寫作反饋。”

AI味兒太濃、素材陳舊沒有創(chuàng)造性……在提及AI大模型寫作時,不少公眾會有這樣的觀感。

沈陽認(rèn)為,目前公眾存在一個認(rèn)知誤區(qū),即AI大模型不會創(chuàng)造,也就不具備創(chuàng)新能力。沈陽表示,創(chuàng)新可以分為組合創(chuàng)新、融合創(chuàng)新和顛覆式創(chuàng)新,目前AI大模型基本處于組合創(chuàng)新階段,即單純地把兩個東西組合在一起,“融合創(chuàng)新是兩個東西組合在一起之后,還要給它加一些屬性要素,或者做某些調(diào)整,讓你看不出新東西是從哪里來的。AI大模型做融合創(chuàng)新的能力其實(shí)不高,這個過程是需要人去篩選把關(guān)的?!倍衽nD提出微積分、愛因斯坦提出廣義相對論一樣的顛覆式創(chuàng)新,AI大模型能做到的概率極低。

在沈陽看來,“選擇即創(chuàng)新”,“AI大模型生成內(nèi)容太容易了,比如畫畫,AI大模型作畫之后,我來挑選。每一次的標(biāo)注、挑選都是在幫助大模型進(jìn)行迭代和優(yōu)化。”

唐亮則認(rèn)為,創(chuàng)造性可以分為從無到有的原創(chuàng)性、由表及里的深刻性和不落窠臼的突破性,“大模型在模仿和組合層面的創(chuàng)造性已經(jīng)達(dá)到一定的高度了。但是在深刻洞察、理解層面以及突破性層面的創(chuàng)造性,我覺得還是有很長的路要走?!?/p>

王曉茹也表示不用太在意大模型寫作的“AI味兒”,而更應(yīng)該關(guān)注大模型寫作的思維鏈。“大模型寫作最大的特點(diǎn)是沒有語法錯誤、邏輯十分嚴(yán)謹(jǐn),而且由于語料庫豐富,案例也會十分豐富?!蓖鯐匀惚硎?,學(xué)生可以向大模型學(xué)習(xí)如何扣題、如何搭建合理的作文結(jié)構(gòu),“大模型的短板的確是情感,但是這一部分是中學(xué)生可以通過自己的閱歷、在生活中的觀察和思考彌補(bǔ),可以在大模型的作文中加入自己的情感和生活經(jīng)驗(yàn)以及思考,就會不斷提升自己的寫作能力。”

沈陽表示,學(xué)生可以自己寫讓AI大模型修改,可以讓AI大模型寫自己修改,也可以讓AI生成作文之后用給定提示詞的方式不斷調(diào)整至最佳狀態(tài),“這三種方式都可以鍛煉提升使用AI大模型的能力。”

不過,唐亮也提出,無論是教育教學(xué)還是家庭教育中,大模型使用都要慎重?!按竽P秃苤悄?,但是特別注意對學(xué)生尤其是對未成年學(xué)生的影響,避免過度依賴產(chǎn)生認(rèn)知外包。”同時,還要避免完全照搬和抄襲、注意大模型的認(rèn)知幻覺等,“老師要在教學(xué)中正確引導(dǎo)學(xué)生如何正確使用大模型。

新京報記者 楊菲菲

編輯 繆晨霞 校對 陳荻雁

原文地址:https://www.bjnews.com.cn/detail/1749521847168751.html
江蘇蘇訊網(wǎng)客服:025-86163400
【責(zé)任編輯:陸超】

江蘇蘇訊網(wǎng)版權(quán)及免責(zé)聲明:凡本網(wǎng)注明“來源:XXX(非江蘇蘇訊網(wǎng))”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。 如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,本網(wǎng)按規(guī)定給予一定的稿費(fèi)或要求直接刪除,請致電025-86163400 ,聯(lián)系郵箱:724922822@qq.com。

圖片新聞
熱點(diǎn)資訊
熱點(diǎn)聚焦