■原題:算法訓練幾乎0成本!梧桐大模型讓首批用戶吃上“螃蟹”
■記者:思文
行業大(da)模(mo)(mo)型(xing)(xing)正(zheng)在爆炸式集(ji)中推出,關注大(da)模(mo)(mo)型(xing)(xing)的(de)人士都知道了行業大(da)模(mo)(mo)型(xing)(xing)的(de)簡(jian)單公式,通(tong)用大(da)模(mo)(mo)型(xing)(xing)+行業場景+訓(xun)練調優(you)=行業大(da)模(mo)(mo)型(xing)(xing),因此(ci)訓(xun)練調優(you)是企業自研大(da)模(mo)(mo)型(xing)(xing)不可避開(kai)的(de)重要環(huan)節(jie)。
然在其他企(qi)業還在觀(guan)望,推出,演示或者調優的(de)當下,宇視作為(wei)推出AIoT行(xing)業大(da)模型(xing)的(de)第(di)一人,6月9號,其小范圍召開了(le)大(da)模型(xing)“梧桐”種子(zi)合作伙伴(ban)簽約(yue)會并公開了(le)“梧桐”未(wei)來的(de)規劃(hua)。
目前“梧桐”針對需求計劃細化出三種不同模型:
l CV(計算機視覺)行業大模型
提供AI訓練、AI在線學(xue)習(xi)等服(fu)務(wu),預(yu)計將在7月底上線,現階(jie)段已經(jing)在小范(fan)圍(wei)測試。
l NLP(自然語言處理)行業大模型
提供資料中心、大數據平(ping)臺、代(dai)碼開(kai)發等服務,這是一款自用行(xing)業大模型,目前階段只(zhi)在宇視內部(bu)使用,主(zhu)要用在內部(bu)生(sheng)產,精準度要求更高。
l MM(多模態)行業大模型
提供Vlog等服務,目前已在樂園景區、鄉村(cun)振興等場景的(de)視頻宣(xuan)傳(chuan)上有豐富的(de)落(luo)地案例。
那打出“AIGC平權”旗幟的宇視將怎么把技術平權和知識平權真正融進中小型企業業務里?
CPS中安網(wang)作為特邀媒體就此(ci)疑問與部分(fen)宇視核(he)心高管(guan)面對面進行了“圓桌對話”。
1、大模型趨勢下
中小型企業怎么用好數據?
中小(xiao)(xiao)(xiao)企(qi)(qi)業(ye)(ye)作(zuo)為(wei)中國(guo)經濟發展(zhan)的重要主體(ti)之一,據(ju)工信部公布的數據(ju),2022年我(wo)國(guo)日均(jun)新設企(qi)(qi)業(ye)(ye)達2.38萬戶,中小(xiao)(xiao)(xiao)微企(qi)(qi)業(ye)(ye)數量已超過5200萬戶,在如今大模型熱(re)潮下,不少中小(xiao)(xiao)(xiao)企(qi)(qi)業(ye)(ye)都在關注(zhu)行業(ye)(ye)大模型將會如何為(wei)自身企(qi)(qi)業(ye)(ye)真正做到降(jiang)本(ben)增效。
雖然數字化轉型理念愈來愈普及,不少中小企業都想搭上“高效”這趟車,但“數據怎么用?”“花費多少成本?”這兩(liang)大疑慮把大部分(fen)中小企業攔在了(le)車門(men)外。
除(chu)此之外,雖(sui)說行業(ye)都在(zai)認(ren)可“ALL in AI”這一現狀,但不少中(zhong)小型(xing)企業(ye)對于AI的理解(jie)可能仍(reng)局(ju)限(xian)性停留在(zai)人臉識別。
宇(yu)視(shi)云(yun)智(zhi)能(neng)產品部(bu)部(bu)長湯利波(bo)告(gao)訴CPS中安網,作為直(zhi)接接觸到市場(chang)動向脈搏的(de)(de)(de)中小型企業(ye),其完全可(ke)以(yi)利用數據(ju)針(zhen)對性(xing)訓練(lian)一些細分(fen)業(ye)務場(chang)景(jing)的(de)(de)(de)算法(fa)。“通過場(chang)景(jing)化算法(fa)指標能(neng)力的(de)(de)(de)提升(sheng)(sheng),有機會(hui)去提升(sheng)(sheng)解決方案(an)的(de)(de)(de)增(zeng)(zeng)值性(xing),包括服務收(shou)益的(de)(de)(de)增(zeng)(zeng)值性(xing)。”
舉個(ge)簡(jian)單的例(li)子,在(zai)游樂(le)園娛樂(le)等(deng)場所,大(da)部分人可能認為攝像(xiang)頭只是(shi)起到(dao)安全防控的作(zuo)用(yong),但(dan)假設負責這個(ge)場景業(ye)務(wu)的企業(ye),愿(yuan)意讓攝像(xiang)頭搭載上提前訓練好(hao)的大(da)模型,訓練好(hao)的大(da)模型經(jing)過推理后,將其視頻數(shu)據進(jin)(jin)行自動分割、自動識別、剪輯(ji)美(mei)化,游樂(le)園就能從原有的出售游客圖(tu)片(pian)的業(ye)務(wu)升級到(dao)游客專屬vlog,這便讓原本(ben)只是(shi)躺在(zai)存儲里的數(shu)據得到(dao)了進(jin)(jin)一(yi)步(bu)調動應用(yong)。
可以明顯看到,在大模型趨勢下(xia),對于中小(xiao)型企業而言,其如何通過(guo)大模型利(li)用數據達到降本(ben)增效的作用,結果還是開源或(huo)(huo)者節流(liu),省(sheng)下(xia)人力(li)(li)、時間、精力(li)(li)成本(ben)的同時對現有業務(wu)進行升級賦能,將(jiang)服務(wu)收益最(zui)大化或(huo)(huo)許才是正解。
基(ji)于(yu)(yu)此,對(dui)于(yu)(yu)判斷市場上任意一(yi)項(xiang)新技術或者新產(chan)品(pin)是(shi)否值得應用,中小型企業往(wang)往(wang)更加在意實際投入(ru)成本幾何(he)。關于(yu)(yu)成本問(wen)題,會上,宇(yu)視的大模型也給出(chu)了(le)階段性(xing)答案(an)。
2、幾乎0成本訓練
梧桐CV行業大模型將上線
“我們需要更(geng)多的(de)(de)渠道(dao)能夠有這(zhe)種能力,更(geng)好的(de)(de)和宇視合作,而不(bu)是(shi)只有幾家壟斷的(de)(de)市場。”宇視CPO朱(zhu)兵說(shuo)。
具體來說,宇(yu)視(shi)的賦能之(zhi)道是(shi),在訓練側上,用戶企(qi)業(ye)(ye)可以遠程(cheng)通過(guo)互(hu)聯網(wang)訪問之(zhi)后來訓練算法,宇(yu)視(shi)會(hui)承(cheng)擔云的租用費用,為用戶企(qi)業(ye)(ye)省(sheng)去前(qian)期訓練需要的成本(ben),企(qi)業(ye)(ye)可以幾乎(hu)0成本(ben)獲得宇(yu)視(shi)開通的大模型訓練賬(zhang)號,在訓練過(guo)程(cheng)中,會(hui)有宇(yu)視(shi)專門的技術團隊進行支持。
在(zai)推理側上(shang),宇(yu)視通(tong)過將(jiang)場景(jing)化的(de)算(suan)(suan)法進行(xing)剝離,也就(jiu)是將(jiang)相對(dui)小模型的(de)算(suan)(suan)法部署到宇(yu)視邊(bian)緣端的(de)設備上(shang),一定程度上(shang)避免合作伙伴(ban)為(wei)此(ci)額外部署一個幾千萬起步的(de)超算(suan)(suan)機房。
此外,算(suan)(suan)法拓展在目前階(jie)段仍屬(shu)于(yu)煙囪式,即使用戶需求(qiu)很相(xiang)近,但由于(yu)對(dui)象的不同還是(shi)需要重新生成算(suan)(suan)法,容(rong)易(yi)導致投入產出比和(he)客戶需求(qiu)之(zhi)間的矛盾(dun),而預計(ji)7月底正(zheng)式上線的“梧桐CV行業大模型(xing)”可以(yi)較好解決這個(ge)問題。
舉個(ge)例子,假設現在有(you)60多(duo)(duo)萬個(ge)體育(yu)館(guan)(guan),300多(duo)(duo)萬套器(qi)材(cai)(cai),這60多(duo)(duo)萬個(ge)體育(yu)館(guan)(guan)的器(qi)材(cai)(cai)放置(zhi)地(di)(di)點(dian)都不同,此時(shi)項目方需(xu)要(yao)知道所有(you)館(guan)(guan)的器(qi)材(cai)(cai)的使(shi)用頻率和大眾(zhong)愿意使(shi)用哪類健身器(qi)材(cai)(cai),這時(shi)候如果用小(xiao)模(mo)型就需(xu)要(yao)采集各個(ge)體育(yu)館(guan)(guan)的數(shu)據進行對(dui)(dui)比(bi)再針對(dui)(dui)性地(di)(di)多(duo)(duo)次訓練(lian),而“梧桐CV行業大模(mo)型”卻能(neng)在比(bi)較小(xiao)的數(shu)據量情(qing)況(kuang)下,做到泛(fan)化識別(bie)和推理,即使(shi)器(qi)材(cai)(cai)對(dui)(dui)象千差萬別(bie),但省去(qu)了二次訓練(lian)、學習的環節。
場景多(duo)N倍,算(suan)(suan)法(fa)獲得率(lv)提升80%,算(suan)(suan)法(fa)精準度(du)從85%提升至95%,讓(rang)IT工(gong)程訓練師訓練算(suan)(suan)法(fa),更容易解決(jue)行業Know-How問題(ti),入(ru)門(men)門(men)檻更低(di),大模(mo)型梧桐的優勢也由此(ci)凸(tu)顯,
目前“梧桐CV行業大模型”已經和第一批合作伙伴完成落地計劃的簽約,率先在體育、教育、交通、零售等領域進行首發落地。
相信在未來,大模型(xing)的“訓練”“推理”兩個(ge)關(guan)鍵詞優勢將會日益凸顯,據了解,為(wei)保障大模型(xing)的順利運行,宇視目前部(bu)署(shu)在云邊(bian)端芯片款型(xing)超過50款,支持的算法(fa)種類超過1000個(ge),模型(xing)數過萬,產(chan)品(pin)款型(xing)過千。
前期成本宇視承擔,合作伙伴幾乎0成本接入,這么大的支持力度,相信業內人士都會十分好奇,宇視到底靠梧桐大模型怎么實現盈利?
3、瞄準生態價值
力爭高效落地
傳統意義上(shang),做了一個軟(ruan)件,投入(ru)100萬,就要力爭賣到(dao)200萬,最后賺100萬,光明正(zheng)大的追求利(li)潤是(shi)企業繞(rao)不(bu)開(kai)的話題。
但(dan)這次,宇視并沒(mei)有打算使用傳(chuan)統的(de)(de)賣軟件直(zhi)接獲利(li)策略,而是通過讓(rang)(rang)利(li)給合(he)作伙(huo)伴,讓(rang)(rang)合(he)作伙(huo)伴通過使用“梧桐”得到多(duo)個專屬(shu)的(de)(de)“行業軟件工(gong)程師”。“讓(rang)(rang)宇視的(de)(de)渠道盈(ying)利(li),讓(rang)(rang)他(ta)們有進入一些新的(de)(de)業務(wu)模式的(de)(de)可(ke)能。”朱兵說道。
在這個平權時代,支撐宇視此次這么大膽的行徑的信心和念想究竟來自哪里?
“平權(quan)時(shi)(shi)代(dai),最大的(de)競爭力在(zai)于你的(de)效(xiao)率,在(zai)于公司(si)看清(qing)楚自(zi)己的(de)定位(wei)之后能夠第一時(shi)(shi)間全力撲上去(qu)做(zuo)。”
2012年,宇視捕捉到人工智能的(de)發(fa)展趨勢,同年便開始在深度學習領域進行(xing)投入,2016年,宇視推出初代基(ji)于DL的(de)AIoT產品,如今來到大模型(xing)爆炸(zha)階段,宇視又成(cheng)為(wei)第一個推出“AIoT行(xing)業大模型(xing)”的(de)第一人。
2023年,宇視這次對于“梧桐”大模型的定位到底是什么?
沒錯,就是落地化,工程化。正如微軟將GPT-4對接Office、金山將其大(da)模型(xing)產品(pin)“WPS AI”接入WPS,大(da)模型(xing)最(zui)終(zhong)的落地還得是(shi)在硬件(jian)上。
那宇視怎么(me)快(kuai)速落地(di)實現工(gong)程化?總結為(wei)以下(xia)幾點:
1、原有的深度學習積累和產品工程化落地可繼承
2、站在通用大模型的肩膀上開發自己的行業大模型
3、通過“剪枝”和“蒸餾”等技術,實現行業大模型的邊緣側部署
4、開放能力(li)給合作伙伴(ban),同時有(you)專門(men)的培訓和技術服務體系保障(zhang)
也許正如(ru)此(ci)次宇(yu)(yu)(yu)(yu)視(shi)簽(qian)約種子伙(huo)伴之一(yi)(yi)的(de)萬店(dian)掌(zhang)所言,眾(zhong)多(duo)行業大模型中為(wei)(wei)什么選(xuan)擇宇(yu)(yu)(yu)(yu)視(shi),其實占比(bi)很大一(yi)(yi)部(bu)分原因(yin)是其本身已經和(he)宇(yu)(yu)(yu)(yu)視(shi)有過(guo)合作,對(dui)宇(yu)(yu)(yu)(yu)視(shi)這個(ge)品牌已經存在(zai)一(yi)(yi)定的(de)認(ren)知力和(he)認(ren)可度,剛好宇(yu)(yu)(yu)(yu)視(shi)在(zai)這個(ge)階段推出了大模型就相(xiang)當于為(wei)(wei)合作伙(huo)伴提供了一(yi)(yi)條龍服務,省去(qu)了對(dui)其他(ta)新(xin)品牌的(de)學(xue)習、切換成本,選(xuan)擇宇(yu)(yu)(yu)(yu)視(shi)會適配度更高。
當然(ran),在這個(ge)數據量爆炸(zha)的時代下,不少(shao)企業(ye)還是(shi)會十分(fen)在意保密(mi)性,而(er)目前由于大(da)部分(fen)中(zhong)小企業(ye)不具備(bei)私(si)有云的部署(shu)能力,因此(ci)愿意上云的企業(ye)的數據會相對(dui)集中(zhong)在公有云上,一旦拿出來訓練是(shi)否(fou)會產生泄漏(lou)的風險?
“我們前期在(zai)接觸合(he)作(zuo)伙伴過程中,也有客戶有安(an)全性(xing)的疑慮,主要疑慮在(zai)原有數據是否外(wai)泄和(he)訓(xun)練成果收否會被無償(chang)占用兩方面”湯(tang)利波(bo)說(shuo)道。而宇視“梧桐”也將通過相關技術進行(xing)分(fen)權、分(fen)域,建(jian)立(li)完善的權限管(guan)理和(he)安(an)全管(guan)控(kong)制(zhi)度,融合(he)等方式保證訓(xun)練成果的安(an)全性(xing)和(he)獨(du)享(xiang)性(xing)。
4、大模型戰場已開局
是開始還是結束?
風起(qi)于青萍之末,浪成于微瀾之間。
相對(dui)之前企業(ye)(ye)(ye)(ye)拼(pin)(pin)數(shu)據(ju)樣本,拼(pin)(pin)私(si)有(you)的訓練平臺,拼(pin)(pin)技術架構的小模型(xing)AI時(shi)代,如今隨著大(da)(da)模型(xing)相繼開源后(hou),有(you)基礎的企業(ye)(ye)(ye)(ye)大(da)(da)都可以基于開源組件進行(xing)自身大(da)(da)模型(xing)的自研,先用通(tong)用大(da)(da)模型(xing)把原始(shi)的大(da)(da)量行(xing)業(ye)(ye)(ye)(ye)場景的知識數(shu)據(ju)清洗一遍,再把顯(xian)著目標值(zhi)給(gei)提(ti)取(qu)出(chu)來(lai),去重后(hou)形(xing)成行(xing)業(ye)(ye)(ye)(ye)數(shu)據(ju)庫(ku),最終(zhong)投喂給(gei)通(tong)用大(da)(da)模型(xing)訓練出(chu)一個行(xing)業(ye)(ye)(ye)(ye)大(da)(da)模型(xing)。
Open AI用了上萬塊(kuai)英偉達GPU喂出了一個ChatGPT,浪潮(chao)掀到中(zhong)國(guo),國(guo)內千模大戰已拉開,行業大模型或將是未來(lai)各個領域都會去追尋的(de)模式。
縱觀安防行(xing)業幾十年的(de)(de)發(fa)展,從模擬階(jie)段(duan)的(de)(de)爭奪攝像頭代理(li)權,到(dao)(dao)網絡數字階(jie)段(duan)的(de)(de)系(xi)統業務成焦(jiao)點,再(zai)到(dao)(dao)智能化階(jie)段(duan)的(de)(de)ALL in AI,如(ru)今已到(dao)(dao)大模型卷入(ru)階(jie)段(duan),或許正如(ru)宇視CEO張鵬國曾在深(shen)圳安博會(hui)舉辦期間抒發(fa)的(de)(de)經典語錄所言:“意(yi)識到(dao)(dao)這(zhe)是場戰爭的(de)(de)時候,戰爭已經結(jie)束了,機會(hui)不會(hui)等待后(hou)知后(hou)覺的(de)(de)傲(ao)慢(man)。”
[出處] 思文, 算法(fa)訓練(lian)幾(ji)乎0成本!梧桐大模(mo)型讓首批用戶吃上“螃蟹”.CPS中安網, 2024-06-14