【IBM咨詢2026深耕者系列談】將邀請(qǐng)IBM咨詢的各行業(yè)領(lǐng)軍者,不只談?dòng)^點(diǎn),更傳遞一線實(shí)干經(jīng)驗(yàn),分享在行業(yè)變革中解決最為復(fù)雜難題的真功夫。深耕者,是懂技術(shù)、能實(shí)戰(zhàn),與企業(yè)一道在場、并肩成長的同行伙伴。
北京2026年4月11日 /美通社/ -- OpenClaw("龍蝦")火了。
2026年初,DeepSeek的余溫尚未散去,龍蝦的火辣開場又席卷全球。這一次,AI不再只是"更會(huì)聊天",而是展示了一種全新的可能性:你給它一個(gè)目標(biāo),它自己想辦法完成——自己規(guī)劃路徑、選擇工具、處理異常,不用你一步步指揮。"讓AI自己干活",一夜之間成了企業(yè)AI討論里最熱的敘事。
興奮之余,一個(gè)更現(xiàn)實(shí)的問題浮出水面。對(duì)于需要處理采購訂單、審批流程、客戶承諾的企業(yè)來說,"AI自己干活"聽上去誘人,但緊接著的追問是:它干錯(cuò)了怎么辦?它碰了不該碰的數(shù)據(jù)怎么辦?它做了一個(gè)涉及資金的決定但沒人審批怎么辦?
自主到什么程度才是對(duì)的?邊界畫在哪里?這恐怕是龍蝦熱潮留給每一家企業(yè)最值得認(rèn)真回答的問題。圍繞這一話題,IBM大中華區(qū)AI咨詢服務(wù)總經(jīng)理葉劍與技術(shù)總監(jiān)陸子睿,分別從業(yè)務(wù)判斷和技術(shù)實(shí)現(xiàn)兩個(gè)維度,闡述IBM的觀點(diǎn)。
葉劍從"為什么是L3"以及"圍欄該畫在哪里"的角度出發(fā)——這是戰(zhàn)略層的選擇;陸子睿則回答了"技術(shù)上如何讓AI懂業(yè)務(wù)"以及"如何給智能體加上韁繩"——這是工程層的落地。兩者合在一起,才構(gòu)成企業(yè)從"想明白"到"做得到"的完整路徑。
做L3,不急L4!
龍蝦很好,它打開了一扇門。但企業(yè)今天真正要解決的問題,不是"AI能不能自己干",而是"它懂不懂你在干什么"。自主是手段,融入業(yè)務(wù)才是目的。
這個(gè)判斷來自IBM自身的實(shí)踐。我們?cè)趦?nèi)部推行"零號(hào)客戶"計(jì)劃,先拿自己當(dāng)試驗(yàn)田——在HR、財(cái)務(wù)、銷售、供應(yīng)鏈等九個(gè)業(yè)務(wù)領(lǐng)域做了115個(gè)AI應(yīng)用,一年省下來45億美元運(yùn)營成本。做下來最大的體會(huì)是:AI的價(jià)值不取決于它多自主,取決于它嵌入業(yè)務(wù)有多深、被管理得有多好。
要討論"自主到什么程度合適"?目前,大家為AI的發(fā)展定義了L1到L4的能力分級(jí)——從聊天、推理、執(zhí)行任務(wù),到成為一個(gè)創(chuàng)新者。L1和L2比較好理解——L1就是固定流程里加上AI做內(nèi)容識(shí)別,比如自動(dòng)提取發(fā)票信息;L2是AI幫你在預(yù)設(shè)的幾條路里選一條走,比如客服工單自動(dòng)分流。這兩級(jí)大多數(shù)企業(yè)已經(jīng)在做了,確定性強(qiáng),風(fēng)險(xiǎn)可控。
真正要討論的是L3和L4的區(qū)別
L4是龍蝦所代表的方向:你給它一個(gè)目標(biāo)——比如"優(yōu)化下季度華東區(qū)供應(yīng)鏈成本"——它自己去拉數(shù)據(jù)、分析問題、擬方案、協(xié)調(diào)執(zhí)行。沒有預(yù)設(shè)的路徑,沒有預(yù)設(shè)的邊界。這個(gè)能力是真實(shí)的,也是令人振奮的。
但L4當(dāng)然值得關(guān)注,今天大多數(shù)企業(yè)先別急著追那個(gè)終局。我們做了不少項(xiàng)目,發(fā)現(xiàn)真正卡住落地的,往往不是AI的自主能力不夠,而是企業(yè)本身還沒準(zhǔn)備好讓AI這么自主。我更建議企業(yè)聚焦L3——有限自主。
L3是什么?AI可以自己規(guī)劃怎么完成一個(gè)任務(wù)——比如做一次采購決策輔助,它自己去查供應(yīng)商、比價(jià)格、評(píng)估交期風(fēng)險(xiǎn)、寫推薦報(bào)告——但到了"下單"這一步,必須由采購經(jīng)理點(diǎn)頭。再比如設(shè)備維修排程,AI可以根據(jù)運(yùn)行數(shù)據(jù)和備件庫存自己排方案,但涉及停機(jī),得交給生產(chǎn)主管決定。
可以把L3想象成:給AI一個(gè)足夠大的操場,讓它自己跑,但圍欄的位置是你定的。哪些工具能用、每次最多做幾步、什么級(jí)別的動(dòng)作必須等人審——這些圍欄畫清楚了,AI的自主性才真正可用。
AI不懂你的生意,給它再多自主權(quán)也沒用
很多企業(yè)第一反應(yīng)是先看模型大小、看Agent框架,但我們做下來發(fā)現(xiàn),真正卡住落地的往往不是這個(gè)。這里舉兩個(gè)場景:
第一個(gè)是供應(yīng)鏈。一家零部件供應(yīng)商著了火,你需要AI能馬上告訴你:哪些原料受影響、哪幾條產(chǎn)線的排產(chǎn)要調(diào)、哪些客戶的交付承諾兌現(xiàn)不了、該啟動(dòng)哪一級(jí)應(yīng)急響應(yīng)。這些判斷的前提是什么?是AI知道"供應(yīng)商"、"原料"、"產(chǎn)線"、"排產(chǎn)計(jì)劃"、"客戶訂單"之間的關(guān)系。它不知道這些關(guān)系,就算給它最強(qiáng)的模型,它也只能給你一堆泛泛而談的建議。
第二個(gè)是財(cái)務(wù)。一家礦業(yè)企業(yè)做損益分析,利潤波動(dòng)了,原因是什么?要沿著"礦種→礦山→產(chǎn)量→國際大宗商品價(jià)格→匯率"一路往下追,每一層的關(guān)系都要對(duì)。大模型什么都能聊兩句,但它不知道"銅礦"的產(chǎn)量跟"LME銅價(jià)"跟"澳元匯率"之間到底怎么聯(lián)動(dòng)。
AI進(jìn)流程,這是入場券,能體現(xiàn)價(jià)值。但AI要真正發(fā)揮價(jià)值,它得懂你的業(yè)務(wù)。龍蝦讓"自主規(guī)劃"不再是瓶頸了,但"懂業(yè)務(wù)"和"嵌入流程"才是企業(yè)AI落地的勝負(fù)手。
圍欄怎么建,L4什么時(shí)候能做?
圍欄畫在哪里?我認(rèn)為有四條線。
第一條是權(quán)限。AI能調(diào)哪些工具、能碰哪些數(shù)據(jù),有白名單。每次任務(wù)最多做幾步,有上限。超了就自動(dòng)停下來等人介入。
第二條是角色。這不是彈一個(gè)確認(rèn)框那么簡單。在企業(yè)里,什么人能批什么事是有規(guī)矩的——操作員能確認(rèn)的事、經(jīng)理能確認(rèn)的事、風(fēng)控能確認(rèn)的事,層級(jí)分明。AI的審批流也得照著這套規(guī)矩來,本質(zhì)上就是把企業(yè)原有的授權(quán)體系延伸到了AI執(zhí)行層。
第三條是可追溯。AI每一步用了什么工具、看了什么數(shù)據(jù)、做了什么判斷,都得有記錄。不是出了事再去補(bǔ)日志,而是執(zhí)行過程中就實(shí)時(shí)留痕。
第四條是評(píng)估。不能只看準(zhǔn)確率。任務(wù)完成了沒有、中間退回了幾次、出了多少異常、每次任務(wù)到底幫公司省了錢還是添了麻煩——這些要有數(shù)。沒有這套評(píng)估,就不知道L3這個(gè)圍欄該縮還是該擴(kuò)。
L4什么時(shí)候能做?不是幻想,但有硬前提。管理制度和審批流程得全面數(shù)字化;核心業(yè)務(wù)流程得面向AI重新設(shè)計(jì)過;企業(yè)內(nèi)部的各種業(yè)務(wù)系統(tǒng)得能被AI調(diào)用。說白了,只有企業(yè)內(nèi)部的業(yè)務(wù)變得"全面可計(jì)算"——流程是數(shù)字化的、服務(wù)是API化的、數(shù)據(jù)接口是標(biāo)準(zhǔn)的、工作流是可編排的——L4才有基礎(chǔ)。否則放一個(gè)L4級(jí)別的智能體進(jìn)去,它連內(nèi)部審批該找誰都不知道。
IBM商業(yè)價(jià)值研究院的數(shù)據(jù)也佐證了這一點(diǎn):79%的高管預(yù)期AI到2030年能顯著貢獻(xiàn)收入,但只有24%說得清楚錢從哪來。這個(gè)落差不是技術(shù)問題,是路徑問題。
2026年是一個(gè)分水嶺。企業(yè)要從做Demo變成真正運(yùn)營AI。三件事需要一起干:
L3不是L4的將就。它是今天企業(yè)AI最扎實(shí)的立足點(diǎn)。把L3做透了,同時(shí)一步步推動(dòng)業(yè)務(wù)的"全面可計(jì)算",L4自然水到渠成,別反過來。
讓AI懂業(yè)務(wù):把隱性的業(yè)務(wù)邏輯變成機(jī)器可推理的結(jié)構(gòu)
當(dāng)前多數(shù)企業(yè)AI項(xiàng)目的技術(shù)路徑是接入RAG、調(diào)優(yōu)Prompt、選擇模型,但往往忽略了一個(gè)前置問題:AI并不天然理解一家企業(yè)的業(yè)務(wù)邏輯。供應(yīng)商供應(yīng)哪些物料、物料適配哪些產(chǎn)線、每個(gè)供應(yīng)商的資質(zhì)認(rèn)證狀態(tài)、不同訂單類型的交付承諾周期、一張工單從創(chuàng)建到完工要經(jīng)過哪些狀態(tài)節(jié)點(diǎn)和審批角色——這些信息分散在ERP、MES、SRM等多個(gè)系統(tǒng)中,大量以隱性知識(shí)的形態(tài)存在于業(yè)務(wù)專家的經(jīng)驗(yàn)里。
企業(yè)需要做的,是把這些隱性的業(yè)務(wù)對(duì)象、關(guān)系和約束規(guī)則,轉(zhuǎn)化為一套機(jī)器可查詢、可推理的結(jié)構(gòu)化模型。業(yè)界通常稱之為業(yè)務(wù)本體或領(lǐng)域模型。它的作用,類似于數(shù)字孿生之于物理世界——不是復(fù)制一個(gè)業(yè)務(wù)系統(tǒng),而是為AI構(gòu)建一層可計(jì)算的業(yè)務(wù)語義層,使智能體在規(guī)劃和執(zhí)行時(shí)能夠基于真實(shí)的業(yè)務(wù)關(guān)系做推理,而不是基于語言模式做猜測。
企業(yè)級(jí)智能體平臺(tái)需要補(bǔ)齊的管控能力
企業(yè)對(duì)智能體的治理,除了關(guān)注它生成的內(nèi)容是否準(zhǔn)確可靠,更要關(guān)注它的行為鏈條——調(diào)用了哪些工具、訪問了哪些數(shù)據(jù)、在什么節(jié)點(diǎn)做出了什么決策、最終觸發(fā)了哪些業(yè)務(wù)動(dòng)作。當(dāng)智能體開始執(zhí)行業(yè)務(wù)操作而非僅僅回答問題時(shí),行為鏈條的管控就成為治理的核心。龍蝦類框架的推理循環(huán)和工具調(diào)用能力已經(jīng)相當(dāng)成熟,但其設(shè)計(jì)假設(shè)是單用戶、無權(quán)限邊界、無審計(jì)要求。企業(yè)需要在這個(gè)能力內(nèi)核之上,補(bǔ)齊一層完整的運(yùn)營管控機(jī)制:
第一,技能注冊(cè)與權(quán)限矩陣。智能體可調(diào)用的每一個(gè)工具在平臺(tái)上注冊(cè)并標(biāo)注風(fēng)險(xiǎn)等級(jí),同時(shí)建立角色-工具權(quán)限矩陣,與企業(yè)現(xiàn)有的組織授權(quán)體系對(duì)齊,確保不同崗位的AI助手擁有差異化的工具訪問范圍。
第二,動(dòng)作門控與步數(shù)預(yù)算。每次任務(wù)設(shè)定動(dòng)作步數(shù)上限以防止無限循環(huán)。按動(dòng)作影響程度分級(jí)管控:只讀查詢自動(dòng)放行,涉及資金、客戶承諾或合規(guī)判斷的高影響動(dòng)作,根據(jù)動(dòng)作類型和金額閾值動(dòng)態(tài)路由至企業(yè)審批鏈中對(duì)應(yīng)的審批節(jié)點(diǎn)。
第三,結(jié)構(gòu)化推理日志。區(qū)別于普通文本日志,每一步執(zhí)行記錄包含工具調(diào)用、參數(shù)傳遞、返回結(jié)果以及AI選擇下一步的推理依據(jù),支持全鏈路回放和定位。同時(shí),這些日志可供評(píng)估流水線消費(fèi)——統(tǒng)計(jì)各環(huán)節(jié)耗時(shí)、異常率和通過率——為智能體的持續(xù)優(yōu)化提供量化依據(jù)。
第四,熔斷與降級(jí)。當(dāng)出現(xiàn)外部接口超時(shí)、返回格式異?;蜻B續(xù)推理邏輯矛盾時(shí),系統(tǒng)自動(dòng)暫停任務(wù)、保存執(zhí)行現(xiàn)場并通知運(yùn)營人員介入。在個(gè)人場景中AI出錯(cuò)影響有限,但在企業(yè)場景中,異常狀態(tài)下的繼續(xù)執(zhí)行可能直接觸發(fā)錯(cuò)誤的業(yè)務(wù)操作。
技能注冊(cè)、權(quán)限矩陣、動(dòng)作門控、推理日志、熔斷降級(jí)——我們把這套能力統(tǒng)稱為智能體的Harness工程,即給智能體加上"韁繩"的系統(tǒng)性工程。它不是限制AI的能力,而是讓AI的能力在企業(yè)環(huán)境中可控地釋放。這是企業(yè)級(jí)智能體平臺(tái)與個(gè)人Agent框架之間的本質(zhì)差異。
寫在最后
龍蝦打開了一扇門,讓我們看到了AI智能體自主規(guī)劃、自主執(zhí)行的巨大潛力。但對(duì)于企業(yè)而言,穿過這扇門之后面對(duì)的不是一條直道,而是一個(gè)需要邊界感的新世界。
葉劍和陸子睿兩位專家從不同角度給出了同一個(gè)判斷:企業(yè)AI智能體的規(guī)?;涞兀P(guān)鍵不在于追求最高級(jí)別的自主性,而在于找到自主能力與業(yè)務(wù)管控之間的平衡點(diǎn)。L3——有限自主——正是這個(gè)平衡點(diǎn)所在。在L3的圍欄內(nèi),讓AI充分發(fā)揮自主規(guī)劃的價(jià)值;在圍欄之外,保持企業(yè)對(duì)關(guān)鍵決策的控制權(quán)。同時(shí),持續(xù)投入業(yè)務(wù)語義建模和智能體Harness工程建設(shè),為最終走向L4積累條件。
在一個(gè)AI能力日新月異的時(shí)代,比追新更重要的,或許是想清楚一個(gè)問題:什么該交給AI,什么必須留在人手里。畫好這條線,企業(yè)才能真正放開手腳。
媒體聯(lián)絡(luò)人
李波
libole@cn.ibm.com
IBM中國