大模型“考生”破題全國一卷高考作文，聽聽人工智能專家怎么說

2025-06-10 10:26　來源：新京報編輯：玖柒六瀏覽量：0

又到一年高考季。6月7日上午，首門考試科目語文落幕，話題“高考語文作文”又一次登上網(wǎng)絡(luò)熱搜。接下來，是各AI大模型的“考試”時間，讓市場上主流的大模型來答高考作文，能力如何?新京報記者記者選取了國內(nèi)外有代表性的DeepSeek、百度文心一言、智譜清言、ChatGPT-4o四個大模型進(jìn)行測試，并邀請多位語文名師給AI作文打分、評價。

在語文名師的眼中，AI大模型的寫作能力如何?AI大模型助力寫作能力提升的正確打開方式是什么?如何釋放AI大模型在語文學(xué)科教育教學(xué)中的潛力?有哪些注意事項?多位人工智能專家也對此話題進(jìn)行了探討。

圍繞材料打轉(zhuǎn)，大模型作文對材料理解容易表面化

此次測評選取DeepSeek、百度文心一言、智譜清言、ChatGPT-4o均為通用大模型。在試卷選擇上，選擇了覆蓋省份較多的全國一卷。同時，為了防止使用者個人習(xí)慣以及提示詞對大模型生成作文的影響，統(tǒng)一選擇了不加任何額外要求、將作文題目直輸給大模型后生成的第一篇作文。

被眾多網(wǎng)友認(rèn)為“難”的全國一卷作文該如何破題?5個大模型在此次“考試”中，整體表現(xiàn)如何?

全國著名語文特級教師王大績提到，艾青和穆旦的材料都來自于教材，都寫于抗日戰(zhàn)爭時期;老舍的《鼓書藝人》出現(xiàn)在試卷的閱讀文章中，也是反映抗日戰(zhàn)爭的事情，“指向性很明確，就是要圍繞抗戰(zhàn)勝利80周年來思考?！睆倪@個角度上來講，智譜清言、百度文心一言的作文都在寫作中提到了這一要素，DeepSeek與ChatGPT-4o則顯然脫離了這一背景。

不過，王大績也提到，如果在破題時聯(lián)想提高一個層面，那主題也可以是“答案是豐富多彩的，心靈的選擇、轉(zhuǎn)折、生活在發(fā)展?！?/p>

北京市特級、正高級教師何郁提到，作文要切題不僅要理解好三個材料，更要把握好三個材料背后的時代背景及其共同體現(xiàn)的價值觀。賀老師同樣認(rèn)為，寫好作文的前提是破好題，要讀懂命題者的命題思路，“三個材料是有內(nèi)在的邏輯關(guān)系的、不是割裂的，需要把三個材料背后的邏輯關(guān)系弄清楚，提煉出一個主題來。”

語文名師賀老師提到，綜合來看，DeepSeek、智譜清言、ChatGPT-4o三個“考生”的表現(xiàn)略差，“沒有把材料吃透，只是圍繞著材料在‘打轉(zhuǎn)’。正常的作文是破題之后，要跳出材料，提煉出自己的觀點，并展開論證?！?/p>

“大模型雖然語言材料很豐富，但是在客觀、科學(xué)地分析材料建立自己的邏輯層次和理性思考上就會比較弱?！痹诤斡艨磥?，大模型在寫作議論文時雖然可以按照三段式的邏輯來進(jìn)行論證，但容易陷入“新八股文”的思路，難以進(jìn)行真正的層層遞進(jìn)式的有邏輯的寫作，“這對大模型來說是很有挑戰(zhàn)的。”

與此同時，三位老師也提到了此次大模型寫作中普遍出現(xiàn)的問題，“AI味兒”、內(nèi)容空洞、缺少針對性以及素材案例缺乏。

賀老師提到，大模型寫的作文很容易將重心都放在解釋材料上，并不能真正理解三個材料之間的聯(lián)系和命題人的意圖，“寫得長了就容易翻來覆去胡說八道，看著像百科全書一樣，其實就是解釋、回答問題，沒有獨特的個性化的思考?！?/p>

何郁也認(rèn)為大模型寫作文對材料的理解會比較表面化，多是泛泛而談。大模型在寫作文時，能建構(gòu)一定的層次、按照一定的邏輯思路寫作，但語句表達(dá)比較偏向于抒情，最欠缺的是思想認(rèn)識和思辨能力，幾乎沒有針對題目作出獨立的思考和判斷。

王大績提出，雖然有的大模型“考生”在寫作中提到了抗戰(zhàn)，但是作文中幾乎沒有抗日戰(zhàn)爭期間的事例素材。

四家大模型寫高考作文，誰的表現(xiàn)更勝一籌?

是否切題、語言表達(dá)、邏輯結(jié)構(gòu)、認(rèn)知匹配等是此次大模型作文評判的重要關(guān)注內(nèi)容。記者將全國一卷作文拋給了四家大模型，它們的答案以及各位教師的打分、點評如下：

第一篇：

沉默與歌唱：論苦難中的聲音表達(dá)(DeepSeek)

點評：

何郁給DeepSeek寫的這篇作文打了50分。在其看來，這篇作文突出了“論”，體現(xiàn)了文體特征，同時材料豐富、能夠很自然地融入文章之中，有一定可讀性。這也是四篇作文中最能體現(xiàn)大模型材料豐富特點的一篇。不過，這篇作文在理解題意上有偏差，對“沉默”“表達(dá)”“聲音”等關(guān)鍵詞的理解，不完全符合題意。

王大績認(rèn)為這篇作文得分有可能沖擊滿分作文。雖然并沒有圍繞抗戰(zhàn)展開，但是聚焦如何對待苦難進(jìn)行了表達(dá)，寓意比較深刻、思路很清楚。

第二篇：

嘶啞亦能成歌，擔(dān)當(dāng)鑄就力量(智譜清言)

點評：

何郁為這篇作文打了42分。在其看來，這篇作文語言表達(dá)通順，內(nèi)容層次分明，有局部精彩。缺點就在于理解題意有偏差，表達(dá)比較表面化，碎片化解讀題目。

賀老師也打了42分?！斑@篇作文開篇就是在解釋三個材料，始終在這里面打轉(zhuǎn)?！辟R老師表示，大模型顯然沒有了解新高考作文的特點。

第三篇

以歌為刃，破繭前行(百度文心一言)

點評：

賀老師給這篇作文打了46分。在其看來，這篇作文從體例上看最符合議論文的要求，有論點“以歌為刃”，也有三個分論點，同時在論據(jù)中列舉了嫦娥5號、5G等發(fā)展成果。不足在于缺乏更多現(xiàn)實的新鮮的素材和個性化的表達(dá)，“沒有結(jié)合當(dāng)下我們的現(xiàn)實情況，缺乏一種家國情懷、大格局。倒數(shù)第二段是硬傷?！?/p>

何郁給出了48分，“由歌聲關(guān)聯(lián)困境、民族、時代，關(guān)聯(lián)民族危亡，關(guān)聯(lián)砥礪奮進(jìn)，比較符合題旨?！钡@篇作文采用的是三段論式的論證，顯八股味道，深刻性、思辨性還是欠缺。標(biāo)題不好，略顯俗套。論述性有所欠缺。

第四篇：

沉默與吶喊之間：個體良知的覺醒(ChatGPT-4o)

點評：

何郁給ChatGPT-4o寫的作文打了40分。雖然這篇作文語言基本通順，層次比較清楚，能聯(lián)系現(xiàn)實，但是對原材料的理解偏差較大。何郁分析，其第一句話停留在表面，第二句不太準(zhǔn)確，第三句一般化。“覺醒”應(yīng)該是對的，雖然這些“覺醒”是由個體發(fā)出的，但指向“個體”有失偏頗。

專家點評大模型寫作：體例完整、邏輯性強(qiáng)但情感不足

當(dāng)前，各大AI大模型的寫作能力如何?

清華大學(xué)新聞與傳播學(xué)院、清華大學(xué)人工智能學(xué)院雙聘教授沈陽表示，AI大模型的寫作能力涉及兩種類型，一種是AI快生，即輸入一句話大模型給出一篇作文，這代表了大模型的基本能力，“現(xiàn)在大部分大模型的基本能力已經(jīng)不錯了。”第二種是人機(jī)優(yōu)生，即使用者給出一定的提示詞并經(jīng)過長期使用之后大模型表現(xiàn)出來的能力，“這里面不僅包括了大模型的基本能力，也包括了使用者長期跟它對話之后形成的某種風(fēng)格。這樣的情況下，AI大模型生成作文的能力是非常強(qiáng)的，接近甚至超過了一般的網(wǎng)絡(luò)寫手?！?/p>

北京教育科學(xué)研究院信息中心副主任唐亮表示，大模型在文本的學(xué)習(xí)、訓(xùn)練和應(yīng)用方面有其獨到之處，在通過海量的語言文字學(xué)習(xí)之后，基本上都能達(dá)到語法正確、文本流暢的水平，而且可以在文本寫作中靈活應(yīng)用語料庫中的各種素材、典故、詩詞、名言名句等等，“同時在體例結(jié)構(gòu)、邏輯結(jié)構(gòu)方面來看，大模型也已經(jīng)達(dá)到了較好水平。”

AI大模型在不同文體上的寫作表現(xiàn)如何?在沈陽看來，“評論類邏輯性比較強(qiáng)的文體，大模型表現(xiàn)非常好，但是長一些的文章或者情感比較豐富的記敘文，大模型在主體一致性、描述的縝密性上就會顯現(xiàn)出很多瑕疵?！?/p>

北京郵電大學(xué)計算機(jī)學(xué)院副教授、中國人工智能學(xué)會智能服務(wù)專業(yè)委員會副秘書長王曉茹同樣認(rèn)為，AI大模型寫出的高考作文邏輯性比較嚴(yán)謹(jǐn)、論據(jù)也比較充分，但是在文學(xué)性表達(dá)能力、創(chuàng)新性以及深度上仍與人類寫作的作文有距離，“相比于議論文，大模型寫記敘文的時候機(jī)器味兒更重?！迸c此同時，AI大模型在寫作中也有“短板”，“沒有情感，或者說情感表達(dá)能力很薄弱?？赡艽竽Ｐ蜁芸鞂懗鲆黄^大多數(shù)人寫作水平的作文來，但是受限于現(xiàn)在的算法，它是沒有辦法真正‘讀懂’訓(xùn)練的文章，盡管可以利用海量語料庫的訓(xùn)練生成一定的情感，但文學(xué)性不足。”

王曉茹分析，影響大模型能力的主要是算力、數(shù)據(jù)以及算法模型三大因素，在現(xiàn)在算力勢均力敵的情況下，數(shù)據(jù)也就是語料庫以及算法模型是影響其能力的關(guān)鍵?！案骷乙矔诨镜恼Z料投喂之后，有針對性地進(jìn)行微調(diào)，這個微調(diào)就跟投喂的語料庫有關(guān)系了。比如有的大模型會偏重于編程創(chuàng)作，有的會偏重于文學(xué)藝術(shù)，有的會偏重于問題解答等等?！?/p>

唐亮認(rèn)為，大模型訓(xùn)練的邏輯本質(zhì)上仍然是基于海量文本和語料數(shù)據(jù)進(jìn)行模仿和重組，“已有的信息，不管是體例結(jié)構(gòu)、語言風(fēng)格還是思維模式上，都是在模仿，短時間內(nèi)很難進(jìn)行開創(chuàng)性的風(fēng)格或者思維方式、邏輯方式的呈現(xiàn)，所以耳目一新的閱讀體驗跟優(yōu)秀的作文相比還是有一定差距?！蓖瑫r，唐亮提出，優(yōu)秀作文也與寫作者本身的經(jīng)歷、思考和情感有關(guān)，這是作為模仿性、學(xué)習(xí)型大模型難以企及的地方，“總體來說就是可以形似但是難以神似，在思想深度、原創(chuàng)性、藝術(shù)性和情感性方面，跟真正優(yōu)秀的作文還很難相提并論?！?/p>

要善于利用大模型提升寫作能力，也要避免過于依賴

專家一致認(rèn)為，AI大模型在語文教育教學(xué)中大有可為。

在唐亮看來，AI大模型可以促進(jìn)教育公平，只要有網(wǎng)絡(luò)有終端的地方都可以零門檻使用大模型，讓更多人了解接觸匯集人類智慧的知識寶庫。“也會推動教師角色的轉(zhuǎn)變，從傳統(tǒng)意義的知識傳授者變成學(xué)習(xí)過程的引導(dǎo)者、設(shè)計者和評估者，更注重提升學(xué)生的判斷力、批判力、思維能力和創(chuàng)新能力。同時，也會推動學(xué)習(xí)方式變革，讓學(xué)生更加主動學(xué)習(xí)?！?/p>

在使用中，AI大模型可以助力拓展知識，“它打破了課堂的空間邊界和書本的載體邊界，大家通過網(wǎng)絡(luò)通過APP就可以連接到匯集人類整體知識的巨大知識庫，可以獲取很多課堂上、書本上獲取不到的知識?！蓖瑫r，大模型還可以幫助學(xué)生輔助閱讀，“一篇文章從不同的視角來分析來解讀，有哪些修辭手法、文章結(jié)構(gòu)如何等等，大模型都可以輔助?！蓖瑫r，使用大模型進(jìn)行輔助寫作評判，可以及時提供語法、句式、邏輯性等不同維度的反饋，甚至可以提供很多素材，“更重要的是，大模型的介入可以提供個性化的學(xué)習(xí)輔導(dǎo)。每個學(xué)生的寫作水平能力和偏好是不同的，利用大模型可以提供更多個性化的訓(xùn)練寫作反饋。”

AI味兒太濃、素材陳舊沒有創(chuàng)造性……在提及AI大模型寫作時，不少公眾會有這樣的觀感。

沈陽認(rèn)為，目前公眾存在一個認(rèn)知誤區(qū)，即AI大模型不會創(chuàng)造，也就不具備創(chuàng)新能力。沈陽表示，創(chuàng)新可以分為組合創(chuàng)新、融合創(chuàng)新和顛覆式創(chuàng)新，目前AI大模型基本處于組合創(chuàng)新階段，即單純地把兩個東西組合在一起，“融合創(chuàng)新是兩個東西組合在一起之后，還要給它加一些屬性要素，或者做某些調(diào)整，讓你看不出新東西是從哪里來的。AI大模型做融合創(chuàng)新的能力其實不高，這個過程是需要人去篩選把關(guān)的?！倍衽ｎD提出微積分、愛因斯坦提出廣義相對論一樣的顛覆式創(chuàng)新，AI大模型能做到的概率極低。

在沈陽看來，“選擇即創(chuàng)新”，“AI大模型生成內(nèi)容太容易了，比如畫畫，AI大模型作畫之后，我來挑選。每一次的標(biāo)注、挑選都是在幫助大模型進(jìn)行迭代和優(yōu)化?！?/p>

唐亮則認(rèn)為，創(chuàng)造性可以分為從無到有的原創(chuàng)性、由表及里的深刻性和不落窠臼的突破性，“大模型在模仿和組合層面的創(chuàng)造性已經(jīng)達(dá)到一定的高度了。但是在深刻洞察、理解層面以及突破性層面的創(chuàng)造性，我覺得還是有很長的路要走?！?/p>

王曉茹也表示不用太在意大模型寫作的“AI味兒”，而更應(yīng)該關(guān)注大模型寫作的思維鏈。“大模型寫作最大的特點是沒有語法錯誤、邏輯十分嚴(yán)謹(jǐn)，而且由于語料庫豐富，案例也會十分豐富?！蓖鯐匀惚硎?，學(xué)生可以向大模型學(xué)習(xí)如何扣題、如何搭建合理的作文結(jié)構(gòu)，“大模型的短板的確是情感，但是這一部分是中學(xué)生可以通過自己的閱歷、在生活中的觀察和思考彌補(bǔ)，可以在大模型的作文中加入自己的情感和生活經(jīng)驗以及思考，就會不斷提升自己的寫作能力?！?/p>

沈陽表示，學(xué)生可以自己寫讓AI大模型修改，可以讓AI大模型寫自己修改，也可以讓AI生成作文之后用給定提示詞的方式不斷調(diào)整至最佳狀態(tài)，“這三種方式都可以鍛煉提升使用AI大模型的能力?！?/p>

不過，唐亮也提出，無論是教育教學(xué)還是家庭教育中，大模型使用都要慎重?！按竽Ｐ秃苤悄埽翘貏e注意對學(xué)生尤其是對未成年學(xué)生的影響，避免過度依賴產(chǎn)生認(rèn)知外包。”同時，還要避免完全照搬和抄襲、注意大模型的認(rèn)知幻覺等，“老師要在教學(xué)中正確引導(dǎo)學(xué)生如何正確使用大模型。

新京報記者楊菲菲

編輯繆晨霞校對陳荻雁

原文地址：https://www.bjnews.com.cn/detail/1749521847168751.html

江蘇蘇訊網(wǎng)客服：025-86163400

【責(zé)任編輯：陸超】

江蘇蘇訊網(wǎng)版權(quán)及免責(zé)聲明：凡本網(wǎng)注明“來源：XXX（非江蘇蘇訊網(wǎng)）”的作品，均轉(zhuǎn)載自其它媒體，轉(zhuǎn)載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的，本網(wǎng)按規(guī)定給予一定的稿費或要求直接刪除，請致電025-86163400 ，聯(lián)系郵箱：724922822@qq.com。

大模型“考生”破題全國一卷高考作文，聽聽人工智能專家怎么說

相關(guān)文章