"龍蝦"開門之后，企業(yè)AI智能體落地的平衡點(diǎn)，藏在L3的"圍欄"里

IBM China

2026-04-11 02:30 2932

【IBM咨詢2026深耕者系列談】將邀請(qǐng)IBM咨詢的各行業(yè)領(lǐng)軍者，不只談?dòng)^點(diǎn)，更傳遞一線實(shí)干經(jīng)驗(yàn)，分享在行業(yè)變革中解決最為復(fù)雜難題的真功夫。深耕者，是懂技術(shù)、能實(shí)戰(zhàn)，與企業(yè)一道在場、并肩成長的同行伙伴。

北京2026年4月11日 /美通社/ -- OpenClaw（"龍蝦"）火了。

2026年初，DeepSeek的余溫尚未散去，龍蝦的火辣開場又席卷全球。這一次，AI不再只是"更會(huì)聊天"，而是展示了一種全新的可能性：你給它一個(gè)目標(biāo)，它自己想辦法完成——自己規(guī)劃路徑、選擇工具、處理異常，不用你一步步指揮。"讓AI自己干活"，一夜之間成了企業(yè)AI討論里最熱的敘事。

興奮之余，一個(gè)更現(xiàn)實(shí)的問題浮出水面。對(duì)于需要處理采購訂單、審批流程、客戶承諾的企業(yè)來說，"AI自己干活"聽上去誘人，但緊接著的追問是：它干錯(cuò)了怎么辦？它碰了不該碰的數(shù)據(jù)怎么辦？它做了一個(gè)涉及資金的決定但沒人審批怎么辦？

自主到什么程度才是對(duì)的？邊界畫在哪里？這恐怕是龍蝦熱潮留給每一家企業(yè)最值得認(rèn)真回答的問題。圍繞這一話題，IBM大中華區(qū)AI咨詢服務(wù)總經(jīng)理葉劍與技術(shù)總監(jiān)陸子睿，分別從業(yè)務(wù)判斷和技術(shù)實(shí)現(xiàn)兩個(gè)維度，闡述IBM的觀點(diǎn)。

葉劍從"為什么是L3"以及"圍欄該畫在哪里"的角度出發(fā)——這是戰(zhàn)略層的選擇；陸子睿則回答了"技術(shù)上如何讓AI懂業(yè)務(wù)"以及"如何給智能體加上韁繩"——這是工程層的落地。兩者合在一起，才構(gòu)成企業(yè)從"想明白"到"做得到"的完整路徑。

葉劍 IBM大中華區(qū) AI 咨詢服務(wù)總經(jīng)理

做L3，不急L4！

龍蝦很好，它打開了一扇門。但企業(yè)今天真正要解決的問題，不是"AI能不能自己干"，而是"它懂不懂你在干什么"。自主是手段，融入業(yè)務(wù)才是目的。

這個(gè)判斷來自IBM自身的實(shí)踐。我們?cè)趦?nèi)部推行"零號(hào)客戶"計(jì)劃，先拿自己當(dāng)試驗(yàn)田——在HR、財(cái)務(wù)、銷售、供應(yīng)鏈等九個(gè)業(yè)務(wù)領(lǐng)域做了115個(gè)AI應(yīng)用，一年省下來45億美元運(yùn)營成本。做下來最大的體會(huì)是：AI的價(jià)值不取決于它多自主，取決于它嵌入業(yè)務(wù)有多深、被管理得有多好。

要討論"自主到什么程度合適"？目前，大家為AI的發(fā)展定義了L1到L4的能力分級(jí)——從聊天、推理、執(zhí)行任務(wù)，到成為一個(gè)創(chuàng)新者。L1和L2比較好理解——L1就是固定流程里加上AI做內(nèi)容識(shí)別，比如自動(dòng)提取發(fā)票信息；L2是AI幫你在預(yù)設(shè)的幾條路里選一條走，比如客服工單自動(dòng)分流。這兩級(jí)大多數(shù)企業(yè)已經(jīng)在做了，確定性強(qiáng)，風(fēng)險(xiǎn)可控。

真正要討論的是L3和L4的區(qū)別

L4是龍蝦所代表的方向：你給它一個(gè)目標(biāo)——比如"優(yōu)化下季度華東區(qū)供應(yīng)鏈成本"——它自己去拉數(shù)據(jù)、分析問題、擬方案、協(xié)調(diào)執(zhí)行。沒有預(yù)設(shè)的路徑，沒有預(yù)設(shè)的邊界。這個(gè)能力是真實(shí)的，也是令人振奮的。

但L4當(dāng)然值得關(guān)注，今天大多數(shù)企業(yè)先別急著追那個(gè)終局。我們做了不少項(xiàng)目，發(fā)現(xiàn)真正卡住落地的，往往不是AI的自主能力不夠，而是企業(yè)本身還沒準(zhǔn)備好讓AI這么自主。我更建議企業(yè)聚焦L3——有限自主。

L3是什么？AI可以自己規(guī)劃怎么完成一個(gè)任務(wù)——比如做一次采購決策輔助，它自己去查供應(yīng)商、比價(jià)格、評(píng)估交期風(fēng)險(xiǎn)、寫推薦報(bào)告——但到了"下單"這一步，必須由采購經(jīng)理點(diǎn)頭。再比如設(shè)備維修排程，AI可以根據(jù)運(yùn)行數(shù)據(jù)和備件庫存自己排方案，但涉及停機(jī)，得交給生產(chǎn)主管決定。

可以把L3想象成：給AI一個(gè)足夠大的操場，讓它自己跑，但圍欄的位置是你定的。哪些工具能用、每次最多做幾步、什么級(jí)別的動(dòng)作必須等人審——這些圍欄畫清楚了，AI的自主性才真正可用。

AI不懂你的生意，給它再多自主權(quán)也沒用

很多企業(yè)第一反應(yīng)是先看模型大小、看Agent框架，但我們做下來發(fā)現(xiàn)，真正卡住落地的往往不是這個(gè)。這里舉兩個(gè)場景：

第一個(gè)是供應(yīng)鏈。一家零部件供應(yīng)商著了火，你需要AI能馬上告訴你：哪些原料受影響、哪幾條產(chǎn)線的排產(chǎn)要調(diào)、哪些客戶的交付承諾兌現(xiàn)不了、該啟動(dòng)哪一級(jí)應(yīng)急響應(yīng)。這些判斷的前提是什么？是AI知道"供應(yīng)商"、"原料"、"產(chǎn)線"、"排產(chǎn)計(jì)劃"、"客戶訂單"之間的關(guān)系。它不知道這些關(guān)系，就算給它最強(qiáng)的模型，它也只能給你一堆泛泛而談的建議。

第二個(gè)是財(cái)務(wù)。一家礦業(yè)企業(yè)做損益分析，利潤波動(dòng)了，原因是什么？要沿著"礦種→礦山→產(chǎn)量→國際大宗商品價(jià)格→匯率"一路往下追，每一層的關(guān)系都要對(duì)。大模型什么都能聊兩句，但它不知道"銅礦"的產(chǎn)量跟"LME銅價(jià)"跟"澳元匯率"之間到底怎么聯(lián)動(dòng)。

AI進(jìn)流程，這是入場券，能體現(xiàn)價(jià)值。但AI要真正發(fā)揮價(jià)值，它得懂你的業(yè)務(wù)。龍蝦讓"自主規(guī)劃"不再是瓶頸了，但"懂業(yè)務(wù)"和"嵌入流程"才是企業(yè)AI落地的勝負(fù)手。

圍欄怎么建，L4什么時(shí)候能做？

圍欄畫在哪里？我認(rèn)為有四條線。

第一條是權(quán)限。AI能調(diào)哪些工具、能碰哪些數(shù)據(jù)，有白名單。每次任務(wù)最多做幾步，有上限。超了就自動(dòng)停下來等人介入。

第二條是角色。這不是彈一個(gè)確認(rèn)框那么簡單。在企業(yè)里，什么人能批什么事是有規(guī)矩的——操作員能確認(rèn)的事、經(jīng)理能確認(rèn)的事、風(fēng)控能確認(rèn)的事，層級(jí)分明。AI的審批流也得照著這套規(guī)矩來，本質(zhì)上就是把企業(yè)原有的授權(quán)體系延伸到了AI執(zhí)行層。

第三條是可追溯。AI每一步用了什么工具、看了什么數(shù)據(jù)、做了什么判斷，都得有記錄。不是出了事再去補(bǔ)日志，而是執(zhí)行過程中就實(shí)時(shí)留痕。

第四條是評(píng)估。不能只看準(zhǔn)確率。任務(wù)完成了沒有、中間退回了幾次、出了多少異常、每次任務(wù)到底幫公司省了錢還是添了麻煩——這些要有數(shù)。沒有這套評(píng)估，就不知道L3這個(gè)圍欄該縮還是該擴(kuò)。

L4什么時(shí)候能做？不是幻想，但有硬前提。管理制度和審批流程得全面數(shù)字化；核心業(yè)務(wù)流程得面向AI重新設(shè)計(jì)過；企業(yè)內(nèi)部的各種業(yè)務(wù)系統(tǒng)得能被AI調(diào)用。說白了，只有企業(yè)內(nèi)部的業(yè)務(wù)變得"全面可計(jì)算"——流程是數(shù)字化的、服務(wù)是API化的、數(shù)據(jù)接口是標(biāo)準(zhǔn)的、工作流是可編排的——L4才有基礎(chǔ)。否則放一個(gè)L4級(jí)別的智能體進(jìn)去，它連內(nèi)部審批該找誰都不知道。

IBM商業(yè)價(jià)值研究院的數(shù)據(jù)也佐證了這一點(diǎn)：79%的高管預(yù)期AI到2030年能顯著貢獻(xiàn)收入，但只有24%說得清楚錢從哪來。這個(gè)落差不是技術(shù)問題，是路徑問題。

2026年是一個(gè)分水嶺。企業(yè)要從做Demo變成真正運(yùn)營AI。三件事需要一起干：

把業(yè)務(wù)對(duì)象和規(guī)則建出來，讓AI懂你的生意；
把治理體系搭起來，讓L3的圍欄第一天就立??；
把AI運(yùn)營能力建起來，別光追求跑通一次，要能持續(xù)、穩(wěn)定地跑下去。

L3不是L4的將就。它是今天企業(yè)AI最扎實(shí)的立足點(diǎn)。把L3做透了，同時(shí)一步步推動(dòng)業(yè)務(wù)的"全面可計(jì)算"，L4自然水到渠成，別反過來。

陸子睿 IBM大中華區(qū) AI 咨詢服務(wù)技術(shù)總監(jiān)

讓AI懂業(yè)務(wù)：把隱性的業(yè)務(wù)邏輯變成機(jī)器可推理的結(jié)構(gòu)

當(dāng)前多數(shù)企業(yè)AI項(xiàng)目的技術(shù)路徑是接入RAG、調(diào)優(yōu)Prompt、選擇模型，但往往忽略了一個(gè)前置問題：AI并不天然理解一家企業(yè)的業(yè)務(wù)邏輯。供應(yīng)商供應(yīng)哪些物料、物料適配哪些產(chǎn)線、每個(gè)供應(yīng)商的資質(zhì)認(rèn)證狀態(tài)、不同訂單類型的交付承諾周期、一張工單從創(chuàng)建到完工要經(jīng)過哪些狀態(tài)節(jié)點(diǎn)和審批角色——這些信息分散在ERP、MES、SRM等多個(gè)系統(tǒng)中，大量以隱性知識(shí)的形態(tài)存在于業(yè)務(wù)專家的經(jīng)驗(yàn)里。

企業(yè)需要做的，是把這些隱性的業(yè)務(wù)對(duì)象、關(guān)系和約束規(guī)則，轉(zhuǎn)化為一套機(jī)器可查詢、可推理的結(jié)構(gòu)化模型。業(yè)界通常稱之為業(yè)務(wù)本體或領(lǐng)域模型。它的作用，類似于數(shù)字孿生之于物理世界——不是復(fù)制一個(gè)業(yè)務(wù)系統(tǒng)，而是為AI構(gòu)建一層可計(jì)算的業(yè)務(wù)語義層，使智能體在規(guī)劃和執(zhí)行時(shí)能夠基于真實(shí)的業(yè)務(wù)關(guān)系做推理，而不是基于語言模式做猜測。

企業(yè)級(jí)智能體平臺(tái)需要補(bǔ)齊的管控能力

企業(yè)對(duì)智能體的治理，除了關(guān)注它生成的內(nèi)容是否準(zhǔn)確可靠，更要關(guān)注它的行為鏈條——調(diào)用了哪些工具、訪問了哪些數(shù)據(jù)、在什么節(jié)點(diǎn)做出了什么決策、最終觸發(fā)了哪些業(yè)務(wù)動(dòng)作。當(dāng)智能體開始執(zhí)行業(yè)務(wù)操作而非僅僅回答問題時(shí)，行為鏈條的管控就成為治理的核心。龍蝦類框架的推理循環(huán)和工具調(diào)用能力已經(jīng)相當(dāng)成熟，但其設(shè)計(jì)假設(shè)是單用戶、無權(quán)限邊界、無審計(jì)要求。企業(yè)需要在這個(gè)能力內(nèi)核之上，補(bǔ)齊一層完整的運(yùn)營管控機(jī)制：

第一，技能注冊(cè)與權(quán)限矩陣。智能體可調(diào)用的每一個(gè)工具在平臺(tái)上注冊(cè)并標(biāo)注風(fēng)險(xiǎn)等級(jí)，同時(shí)建立角色-工具權(quán)限矩陣，與企業(yè)現(xiàn)有的組織授權(quán)體系對(duì)齊，確保不同崗位的AI助手擁有差異化的工具訪問范圍。

第二，動(dòng)作門控與步數(shù)預(yù)算。每次任務(wù)設(shè)定動(dòng)作步數(shù)上限以防止無限循環(huán)。按動(dòng)作影響程度分級(jí)管控：只讀查詢自動(dòng)放行，涉及資金、客戶承諾或合規(guī)判斷的高影響動(dòng)作，根據(jù)動(dòng)作類型和金額閾值動(dòng)態(tài)路由至企業(yè)審批鏈中對(duì)應(yīng)的審批節(jié)點(diǎn)。

第三，結(jié)構(gòu)化推理日志。區(qū)別于普通文本日志，每一步執(zhí)行記錄包含工具調(diào)用、參數(shù)傳遞、返回結(jié)果以及AI選擇下一步的推理依據(jù)，支持全鏈路回放和定位。同時(shí)，這些日志可供評(píng)估流水線消費(fèi)——統(tǒng)計(jì)各環(huán)節(jié)耗時(shí)、異常率和通過率——為智能體的持續(xù)優(yōu)化提供量化依據(jù)。

第四，熔斷與降級(jí)。當(dāng)出現(xiàn)外部接口超時(shí)、返回格式異?；蜻B續(xù)推理邏輯矛盾時(shí)，系統(tǒng)自動(dòng)暫停任務(wù)、保存執(zhí)行現(xiàn)場并通知運(yùn)營人員介入。在個(gè)人場景中AI出錯(cuò)影響有限，但在企業(yè)場景中，異常狀態(tài)下的繼續(xù)執(zhí)行可能直接觸發(fā)錯(cuò)誤的業(yè)務(wù)操作。

技能注冊(cè)、權(quán)限矩陣、動(dòng)作門控、推理日志、熔斷降級(jí)——我們把這套能力統(tǒng)稱為智能體的Harness工程，即給智能體加上"韁繩"的系統(tǒng)性工程。它不是限制AI的能力，而是讓AI的能力在企業(yè)環(huán)境中可控地釋放。這是企業(yè)級(jí)智能體平臺(tái)與個(gè)人Agent框架之間的本質(zhì)差異。

寫在最后

龍蝦打開了一扇門，讓我們看到了AI智能體自主規(guī)劃、自主執(zhí)行的巨大潛力。但對(duì)于企業(yè)而言，穿過這扇門之后面對(duì)的不是一條直道，而是一個(gè)需要邊界感的新世界。

葉劍和陸子睿兩位專家從不同角度給出了同一個(gè)判斷：企業(yè)AI智能體的規(guī)?；涞兀P(guān)鍵不在于追求最高級(jí)別的自主性，而在于找到自主能力與業(yè)務(wù)管控之間的平衡點(diǎn)。L3——有限自主——正是這個(gè)平衡點(diǎn)所在。在L3的圍欄內(nèi)，讓AI充分發(fā)揮自主規(guī)劃的價(jià)值；在圍欄之外，保持企業(yè)對(duì)關(guān)鍵決策的控制權(quán)。同時(shí)，持續(xù)投入業(yè)務(wù)語義建模和智能體Harness工程建設(shè)，為最終走向L4積累條件。

在一個(gè)AI能力日新月異的時(shí)代，比追新更重要的，或許是想清楚一個(gè)問題：什么該交給AI，什么必須留在人手里。畫好這條線，企業(yè)才能真正放開手腳。

媒體聯(lián)絡(luò)人
李波
libole@cn.ibm.com
IBM中國