“中國創(chuàng)業(yè)者在移動互聯(lián)網(wǎng)時代是最會做應(yīng)用的?!?/p>
文|《中國企業(yè)家》記者 趙東山
“國內(nèi)好的大模型應(yīng)用目前還是太少了,2023年大家都使勁做大模型,反倒在應(yīng)用方面沒有大的突破?!边@是網(wǎng)易有道CEO周楓投身大模型一年后最大的感受。
在他看來,2024年大模型應(yīng)用即將迎來爆發(fā),“咱們中國創(chuàng)業(yè)者在移動互聯(lián)網(wǎng)時代可是最會做應(yīng)用的”。2023年,周楓去美國轉(zhuǎn)了一圈,他發(fā)現(xiàn)那邊的創(chuàng)業(yè)活力非常強,大家都在各個層級上創(chuàng)新,他意識到國內(nèi)需要再次加速,尤其在應(yīng)用層。
過去一年,不同于百川智能創(chuàng)始人王小川、智譜CEO張鵬等清華大學(xué)校友研發(fā)超大規(guī)模大模型,周楓帶領(lǐng)團(tuán)隊研發(fā)出“子曰”教育大模型之后,就快速投入到大模型原生應(yīng)用的開發(fā)中,業(yè)務(wù)被逼著進(jìn)入一種快速迭代的狀態(tài),周楓參與業(yè)務(wù)會議的頻率從月會變成了周會,他形容當(dāng)時的團(tuán)隊狀態(tài)是“應(yīng)用團(tuán)隊和模型團(tuán)隊互相逼”。
截至目前,基于“子曰”教育大模型,有道已推出10多款學(xué)習(xí)類AI原生應(yīng)用和功能,成為國內(nèi)開發(fā)AI原生應(yīng)用最多的大模型企業(yè)之一。而基于大模型對原有業(yè)務(wù)的重構(gòu),有道的業(yè)績變化也真實地體現(xiàn)在公司的經(jīng)營數(shù)據(jù)中。
根據(jù)有道2023年第三季度的財報,網(wǎng)易有道該季凈收入15.4億元,毛利率上升至55.9%,達(dá)到近兩年新高;季度經(jīng)營虧損同比收窄73.7%,總運營費用也同比下降,經(jīng)營效率進(jìn)一步提升。
在具體產(chǎn)品和業(yè)務(wù)上,受益于大模型的助力,AI Box的升級以及AI寫作功能的推出,帶動有道詞典及有道翻譯第三季度會員費同比增長160%以上,在線營銷服務(wù)凈收入較2022年同期增長113.5%。
“搭載了子曰大模型的產(chǎn)品,比同期發(fā)布的未搭載大模型應(yīng)用的產(chǎn)品,在用戶使用頻率上要高出50%以上?!敝軛鞲嬖V《中國企業(yè)家》。
從2006年網(wǎng)易有道成立,周楓相繼做了有道搜索、有道詞典、有道云筆記、有道精品課、有道詞典筆等業(yè)務(wù),業(yè)務(wù)范圍覆蓋K12教育、成人教育、素質(zhì)教育、智能硬件等領(lǐng)域,這讓大模型的應(yīng)用落地有了眾多的場景。
雖然有道并非大模型企業(yè)中規(guī)模最大的一家,但周楓采取的“小快靈”AI應(yīng)用開發(fā)路線,很顯然已率先在商業(yè)模式上奏效。當(dāng)外界在追問大模型到底給企業(yè)帶來哪些增量時,有道已經(jīng)在各業(yè)務(wù)的用戶反饋中得到了答案。
“做企業(yè)最重要的是挑什么仗去打?!敝軛髡f道,“如果你告訴團(tuán)隊去打根本不可能贏的仗,那不是害大家嗎?”
把重心轉(zhuǎn)移到應(yīng)用上
時間回到2022年11月底,ChatGPT發(fā)布之后,周楓試用后感到非常震撼。他跟算法團(tuán)隊來來回回地用,測試它的能力底線,在公司內(nèi)部評測模型不同能力的細(xì)節(jié)。為了了解更多技術(shù)細(xì)節(jié),周楓把從GPT-2開始的所有語言模型相關(guān)的論文全部讀了一遍。
2023年1月,有道內(nèi)部召開年度戰(zhàn)略會,這是公司每年的傳統(tǒng),周楓把總監(jiān)以上的團(tuán)隊集中在一起連續(xù)開三天會。不同于往年,2023年周楓讓有道首席科學(xué)家段亦濤講了一個多小時GPT相關(guān)的技術(shù),讓大家做了充分的討論。
最終的結(jié)論是,大模型是一個革命性的技術(shù),如果有道不迅速入局,革新和顛覆自己,就連起家的詞典和翻譯業(yè)務(wù)就也別干了。當(dāng)時,周楓和團(tuán)隊一直在思考,ChatGPT、大模型跟有道到底有沒有關(guān)系?有道到底要做什么?有沒有合作方可以調(diào)用?
“我們從第一天開始就決定要做一批應(yīng)用,而不是說我要訓(xùn)個模型出來,然后看怎么辦?我不是這個想法,只是當(dāng)時找了一圈都沒有可調(diào)用的大模型,只能自己訓(xùn)練。我覺得你把大模型弄出來,卻搞不明白用來干什么的話,自己做大模型的意義就不大了?!敝軛鞲嬖V《中國企業(yè)家》。
其實,當(dāng)時美國可汗學(xué)院等教育公司已經(jīng)開始嘗試接入GPT-3.5,做一些教育服務(wù)嘗試,但國內(nèi)還沒有能力綜合又非常成熟的可以接入的模型,周楓必須得自己做。
很快,周楓就和團(tuán)隊達(dá)成兩個共識:第一,有道團(tuán)隊一定要自己做大模型,如果自己不做是很難完全摸清楚門道的,公司的動作就會變得很慢,做什么都落在別人后面,成為一個跟隨者;第二,做開源大模型肯定打不過專門做超大規(guī)模大模型的公司,必須把重心轉(zhuǎn)移到應(yīng)用上。
作為資深技術(shù)從業(yè)者,周楓過去20年見證了好幾輪技術(shù)變革浪潮,歷史經(jīng)驗告訴他,每一次大的浪潮里,機會不僅僅在于基礎(chǔ)技術(shù)。就像互聯(lián)網(wǎng)發(fā)展之初,做服務(wù)器和路由器的公司最賺錢,但大家很快就發(fā)現(xiàn)互聯(lián)網(wǎng)的精髓不在路由器,而是在互聯(lián)網(wǎng)應(yīng)用上。
他認(rèn)為,如果中國的創(chuàng)業(yè)者眼睛全盯著要去做大模型,就會像移動互聯(lián)網(wǎng)時代那樣,整天盯著怎么做手機而忽視了微信、淘寶、抖音等應(yīng)用的機會。
不做1000億參數(shù)以上大模型
截至目前,有道大模型團(tuán)隊超過100人,且大多數(shù)都是從原來的團(tuán)隊轉(zhuǎn)過來,他們中很多都有人工智能領(lǐng)域的相關(guān)研發(fā)經(jīng)驗。
除了人才外,有道在AI方面也有深厚的積累。早在2008年,有道成為國內(nèi)第一家提供統(tǒng)計機器翻譯模型的公司;2017年,有道從機器翻譯引擎升級成神經(jīng)網(wǎng)絡(luò)翻譯引擎,隨后又升級到現(xiàn)在主流的Transformer技術(shù)。因此,在做大模型的時候,有道團(tuán)隊過往很多積累都可以用上。
但即便有技術(shù)積累和人才優(yōu)勢,周楓給團(tuán)隊設(shè)定的邊界是:堅決不會做1000億參數(shù)以上的模型。
在周楓看來,大模型目前可分為三個層級——1000億參數(shù)以上的超大模型、100億參數(shù)~1000億參數(shù)的中間模型和100億參數(shù)以下的小模型。每個層級都定位不同的實用場景,其中超大模型提供最佳質(zhì)量,具備較強數(shù)理推理能力;中間的模型具備知識的能力,且因為成本較低,但效果不錯,可以廣泛應(yīng)用;而小模型則是放到設(shè)備里,具備語言能力和情緒能力。
“我們基本上相對早期的時候就琢磨明白這件事兒了,超大規(guī)模的模型應(yīng)該留給專門以大模型為全部工作的公司去做,一方面太貴了,另一方面市場也不需要重復(fù)建設(shè)。”周楓告訴《中國企業(yè)家》。
在他看來,有道作為教育科技企業(yè),核心的差異應(yīng)該來自于中間和底下兩個模型。而這其中,要求開發(fā)者對不同層級的模型能力有深刻的理解,且能將產(chǎn)品需求和能力模型匹配。
在結(jié)合過往業(yè)務(wù)尋找落地場景應(yīng)用的過程中,周楓確立了兩個原則:第一,解決用戶在教育場景的需要;第二,能快速變現(xiàn),有足夠的商業(yè)空間。而虛擬人口語教練Hi Echo、AI家庭教師小P老師等應(yīng)用和功能,都是他認(rèn)為既能滿足用戶學(xué)習(xí)需求,又能實現(xiàn)商業(yè)化變現(xiàn)。
教育缺的是辦法
2019年10月,有道在美股上市時,周楓就曾拿用AI技術(shù)批改作文這一場景舉例?!暗?dāng)時的確效果一般。”周楓告訴《中國企業(yè)家》。
2023年,借助AI大模型,有道再次推出AI作文指導(dǎo),目前已經(jīng)批改了幾十萬篇作文。周楓發(fā)現(xiàn)用戶需求沒變,但當(dāng)需求能被很好地解決的時候,產(chǎn)品使用量或者活躍度就會快速上升,滿意度也明顯提升。
2023年一年,周楓深刻地意識到,其實教育從來都不缺用戶需求,缺的都是辦法。除了AI作文批改被使用頻次變高之外,他發(fā)現(xiàn)有道硬件詞典筆中,以前用戶都是掃一個詞,而現(xiàn)在則是掃一行句子,而有道的業(yè)務(wù)正是在這些細(xì)微的變化中被重構(gòu)。
在周楓看來,教育科技是個巨大的市場,很多剛性需求下的細(xì)分場景都是巨大的業(yè)務(wù)盤。而大模型提供一個很大的機會,讓用戶以相對廉價的方式能買到不錯的教育服務(wù)。
2022年全國教育經(jīng)費執(zhí)行情況統(tǒng)計公告顯示:2022年全國教育經(jīng)費總投入為61329.14億元,首次超過6萬億元,比上年增長5.97%。
除了直接面向C端用戶外,2023年有道與杭州拱墅區(qū)智慧教育達(dá)成了合作,有道團(tuán)隊直接把應(yīng)用內(nèi)置到智慧教育系統(tǒng)中,這里的學(xué)生每天在學(xué)校就可以練15分鐘口語。
研發(fā)和推廣大模型應(yīng)用這一年,周楓也總結(jié)了一些經(jīng)驗:
第一,即便大模型已經(jīng)在媒體上變成一個熱詞,但其實大部分中國人還沒有用過大模型產(chǎn)品,所以當(dāng)開發(fā)者產(chǎn)品做得非常精致,完成度非常高時,用戶的接受度也非常高。
第二,英語口語類產(chǎn)品,虛擬人非常有用。在此之前,有道曾開發(fā)出一版無虛擬人的口語教練產(chǎn)品,但發(fā)現(xiàn)效果一般,最終有道決定聯(lián)合網(wǎng)易游戲團(tuán)隊在產(chǎn)品中加入虛擬人形象。
第三,交互式的追問,以及基于語音和聊天的學(xué)習(xí)產(chǎn)品形態(tài),用戶非常需要,他們天然就喜歡這樣的產(chǎn)品形式。
大模型是個10年的事兒
除了是一名教育科技創(chuàng)業(yè)者外,周楓還是兩個孩子的父親。在ChatGPT和大模型火了之后,他現(xiàn)在逢家長就問,你孩子學(xué)編程沒有,學(xué)計算機沒有?
在周楓看來,如果小學(xué)二三四年級的學(xué)生,逐漸開始能接受計算機時,真的應(yīng)該去體驗一下編程?!斑^去50年,社會所有行業(yè)中間給人類社會發(fā)展帶來最大震撼的,基本就是信息產(chǎn)業(yè),它不斷帶來驚喜,每10年都有一個巨大變化?!敝軛鞅硎?。
與此同時,他也開始培養(yǎng)孩子的創(chuàng)造力和提問的軟能力,他認(rèn)為在未來這對每個孩子來說都是越來越重要的。他也正逐漸將這樣的育兒觀念帶入到有道的產(chǎn)品中,比如堅決杜絕孩子們用AI工具作為抄作業(yè)的手段,保護(hù)孩子自主學(xué)習(xí)的精神。
在周楓看來,大模型是個長達(dá)10年的事兒,就像移動互聯(lián)網(wǎng)是10年的事兒一樣。“雖然2007年就已經(jīng)出現(xiàn)iPhone,但直到2016年才出現(xiàn)抖音。”周楓強調(diào)。
他認(rèn)為,2024年大模型相關(guān)領(lǐng)域?qū)腥髾C會點:第一,超大模型肯定會成為一個國內(nèi)大模型廠商爭奪的焦點;第二,國內(nèi)將會涌現(xiàn)一大批大模型原生應(yīng)用;第三,端側(cè)將會得到廣泛應(yīng)用。
相關(guān)稿件