國內(nèi)首個輸出分步式講解推理模型“子曰-o1”正式發(fā)布,消費(fèi)級顯卡即可部署
供稿 / 2025-01-22 11:48136082025開年,AI行業(yè)掀起大模型“推理潮”,自O(shè)penAI發(fā)布o(jì)1后,各式推理模型不斷涌現(xiàn),模型的高階推理能力迎來爆發(fā)增強(qiáng),其應(yīng)用價值也愈發(fā)獲得業(yè)界的廣泛關(guān)注。
1月22日,網(wǎng)易有道正式推出國內(nèi)首個輸出分步式講解的推理模型“子曰-o1”。作為14B輕量級單模型,子曰-o1支持在消費(fèi)級顯卡上進(jìn)行部署,采用思維鏈技術(shù),能夠提供細(xì)致解題過程,以強(qiáng)邏輯和推理能力,實現(xiàn)更高的解題準(zhǔn)確性,并提供中文邏輯推理。據(jù)悉,子曰-o1正式對外開源,將助力教育領(lǐng)域推理模型的廣泛應(yīng)用及創(chuàng)新。
著眼當(dāng)前的“推理潮”,以更長的思維鏈路實現(xiàn)更強(qiáng)的邏輯及推理能力,成為推理模型的主要技術(shù)思路,在此引導(dǎo)下,特性不同的模型層出不窮。這其中,可供應(yīng)用的開源模型卻不多,且參數(shù)規(guī)模較大,無法在低顯存的消費(fèi)級顯卡上運(yùn)行,即使是采用了低比特量化技術(shù),使其能夠在單卡上部署,但相應(yīng)也為長思維鏈的運(yùn)行帶來了不穩(wěn)定性。
針對這一問題,子曰-o1開源模型選擇了較小參數(shù)規(guī)模的基礎(chǔ)模型,能夠進(jìn)行單卡部署并具備更強(qiáng)的數(shù)學(xué)能力。在此基礎(chǔ)上,子曰-o1開源模型進(jìn)一步實現(xiàn)了輕量化,能夠在消費(fèi)級顯卡上運(yùn)行,并且提供與云端部署質(zhì)量相媲美的模型質(zhì)量。
在規(guī)模“壓縮”的同時,子曰-o1采用思維鏈技術(shù),打造了國內(nèi)首個輸出分步式講題的思維鏈模型,以14B小參數(shù)規(guī)模可復(fù)現(xiàn)OpenAI o1的單模型推理能力。據(jù)悉,子曰-o1在解題時會形成較長的思維鏈條,使其運(yùn)行思路更接近于人類的思考方式,通過“自言自語”、自行糾錯的方式,提供分步解題過程及最終結(jié)果。作為教育垂類模型,子曰-o1的這一特性也與教育應(yīng)用產(chǎn)品更為適配,通過清晰呈現(xiàn)有條理的解題過程,以啟發(fā)式講解引導(dǎo)學(xué)生實現(xiàn)自主思考能力提升。
不僅如此,面向教育領(lǐng)域應(yīng)用,子曰-o1在長思維鏈所實現(xiàn)的高準(zhǔn)確度上,進(jìn)一步從數(shù)據(jù)篩選、訓(xùn)練指令等方面優(yōu)化。通過應(yīng)用有道自研的自動化評估方式,子曰-o1不僅對最終答案的正確性進(jìn)行評估,同時還覆蓋了整個講解過程,確保學(xué)習(xí)數(shù)據(jù)的高質(zhì)量。
在訓(xùn)練指令選擇上,基于有道多年來在教育領(lǐng)域的數(shù)據(jù)資源積累,子曰-o1使用了大量的教育領(lǐng)域?qū)W生試卷習(xí)題為訓(xùn)練樣本,從而提升教育場景應(yīng)用的準(zhǔn)確性。
當(dāng)前,子曰-o1已在網(wǎng)易有道旗下的AI全科學(xué)習(xí)助手“有道小P”中落地應(yīng)用,支持其實現(xiàn)“先提供解析思路、再提供答案”的答疑過程,引導(dǎo)學(xué)生用戶主動思考、調(diào)用知識儲備自主解決問題,從而實現(xiàn)真正把知識學(xué)透。在輕量化、輸出分步式講解、中文邏輯推理等多元優(yōu)勢的加持下,子曰-o1能夠進(jìn)一步賦能國內(nèi)AI教育應(yīng)用提質(zhì)增效,以更低的落地門檻撬動更高的應(yīng)用價值。
作為教育垂類的推理模型,子曰-o1的推出也進(jìn)一步夯實了網(wǎng)易有道在教育大模型領(lǐng)域內(nèi)的先發(fā)地位。在2023年7月,網(wǎng)易有道推出國內(nèi)首個教育大模型“子曰”,并在一年內(nèi)推出了10余個應(yīng)用,覆蓋了翻譯、作文批改、語法精講、句子解析、體育教育、口語練習(xí)、家庭輔導(dǎo)等多個細(xì)分場景。2023年11月,有道子曰教育大模型順利通過雙新評估,成為首批通過完整國家備案的教育大模型。 2024年7月,有道子曰教育大模型成功通過中國信息通信研究院的教育大模型評估,榮獲4+級證書,成為國內(nèi)首批通過該項評估,并獲得當(dāng)前最高評級的企業(yè)。
堅持“場景為先”,有道子曰教育大模型作為教育垂類大模型,已經(jīng)擁有較通用大模型更為專業(yè)的預(yù)訓(xùn)練語料,可以依據(jù)用戶在學(xué)習(xí)場景下的需求,幫助用戶答疑解惑。伴隨著推理模型的賽道持續(xù)擴(kuò)大,網(wǎng)易有道在教育垂直領(lǐng)域內(nèi)的深耕沉淀,也將賦能其在教育垂類模型的深入探索,以子曰-o1為起點,持續(xù)釋放推理模型在教育領(lǐng)域內(nèi)的應(yīng)用價值。
國內(nèi)首個輸出分步式講解推理模型“子曰-o1”正式發(fā)布,消費(fèi)級顯卡即可部署














滬公網(wǎng)安備 31010702005758號
發(fā)表評論注冊|登錄