04-24
2025隨著大模型的不斷發(fā)展與普及,很多人已經(jīng)明顯體會到,大模型LLM在簡單的辦公場景應(yīng)用已經(jīng)非常成熟,但在一些復(fù)雜的業(yè)務(wù)場景,卻很難落地應(yīng)用。要想實現(xiàn)這一目標(biāo),需要很多專業(yè)的技術(shù)支持。由此,催生了大量AI Agent的需求,但是很多人對Agent的理解依舊停留在過去,實際上技術(shù)生態(tài)的不斷發(fā)展完善,已經(jīng)進(jìn)入到了新的形態(tài)。AI Agent分為兩類:垂直Agent和通用Agent。我們今天重點介紹垂直Agent的設(shè)計開發(fā)。
一、垂直AI Agent的核心特征與分類
垂直類Agent是聚焦于特定場景的AI應(yīng)用系統(tǒng),與通用Agent相比,垂直類Agent是完全不同的。其核心特征首先體現(xiàn)在其特定目標(biāo)定位上,這類Agent針對單一場景如醫(yī)療診斷或金融風(fēng)控進(jìn)行深度優(yōu)化,其精準(zhǔn)性要求遠(yuǎn)高于通用型Agent。例如,醫(yī)療診斷Agent需要能夠準(zhǔn)確識別特定疾病的臨床表現(xiàn)并提供循證醫(yī)學(xué)支持的診斷建議,而金融風(fēng)控Agent則需要實時分析交易模式并根據(jù)細(xì)微異常指標(biāo)識別潛在欺詐行為。這種專注性使得垂直類Agent能夠在特定領(lǐng)域達(dá)到接近專業(yè)人士的判斷水平。
知識嵌入是垂直類Agent的另一核心特征,它需要集成該場景領(lǐng)域的所有相關(guān)知識庫。以法律咨詢Agent為例,其需要整合法律條文、判例解析、法理學(xué)說等專業(yè)資料,通過RAG(檢索增強(qiáng)生成)技術(shù)來提升回答的專業(yè)性和準(zhǔn)確性。這一過程不僅涉及大量領(lǐng)域知識的數(shù)字化,還需要建立高效的語義索引體系,確保在用戶查詢時能夠快速檢索到最相關(guān)的知識點。金融投顧Agent則需要整合市場數(shù)據(jù)、公司財報、行業(yè)研究報告等資料,實現(xiàn)對投資建議的專業(yè)支撐。相比之下,通用Agent往往只能提供基礎(chǔ)知識層面的回答,無法滿足專業(yè)場景的深度需求。
一般分類:
二、垂直類Agent開發(fā)全流程解析
1. 需求階段
業(yè)務(wù)場景梳理:需求分析是垂直類Agent開發(fā)的基礎(chǔ)環(huán)節(jié),這個部分的質(zhì)量決定了最終產(chǎn)品的價值實現(xiàn)。這個階段,需要進(jìn)行深入細(xì)致的業(yè)務(wù)場景梳理,使用5W1H分析法捕捉關(guān)鍵信息。例如,在醫(yī)療影像診斷場景中,需要我們明確Agent的服務(wù)對象既包括放射科醫(yī)生也包括臨床醫(yī)生,他們具有不同的專業(yè)背景和使用需求;核心任務(wù)包括從影像數(shù)據(jù)預(yù)處理、病灶檢測到結(jié)構(gòu)化報告生成的完整流程;觸發(fā)條件不僅包括DICOM格式影像數(shù)據(jù)上傳,還包括歷史病例調(diào)閱請求等多種情境。這種全面的需求分析能夠保證Agent的功能設(shè)計與實際醫(yī)療工作流程無縫銜接。
價值量化模型:價值量化模型構(gòu)建是證明投資合理性的關(guān)鍵。我們需要建立多維度的ROI測算,不僅要考慮直接成本,還要評估質(zhì)量效率提升和機(jī)會成本等間接效益。
2. 技術(shù)架構(gòu)設(shè)計
垂直領(lǐng)域Agent的技術(shù)架構(gòu)設(shè)計需要充分考慮業(yè)務(wù)特性和性能要求,典型的分層架構(gòu)包括感知層、推理層、執(zhí)行層和反饋學(xué)習(xí)層四個核心部分。
感知層負(fù)責(zé)多模態(tài)數(shù)據(jù)的接收和初步處理,如在金融風(fēng)控場景中,需同時處理交易數(shù)據(jù)流、用戶行為日志和外部信用評分等多源異構(gòu)數(shù)據(jù);
推理層作為系統(tǒng)的"大腦",結(jié)合領(lǐng)域適配的大模型與知識圖譜,實現(xiàn)對復(fù)雜場景的理解和決策推理,例如在法律助手應(yīng)用中,需要將最新法規(guī)與歷史判例進(jìn)行語義關(guān)聯(lián),支持類案推理;
執(zhí)行層則負(fù)責(zé)將決策轉(zhuǎn)化為實際行動,通過API編排調(diào)用外部系統(tǒng),如在智能制造場景下,需要與MES、ERP等多個企業(yè)系統(tǒng)無縫集成,實現(xiàn)生產(chǎn)計劃自動調(diào)整;
反饋學(xué)習(xí)層則持續(xù)從用戶互動和業(yè)務(wù)結(jié)果中收集數(shù)據(jù),通過在線學(xué)習(xí)算法不斷優(yōu)化模型表現(xiàn)。
3. 數(shù)據(jù)工程實施
數(shù)據(jù)工程是垂直領(lǐng)域Agent性能優(yōu)化的關(guān)鍵環(huán)節(jié),其核心在于構(gòu)建高質(zhì)量的專業(yè)知識庫。知識庫構(gòu)建流程始于全面的原始數(shù)據(jù)采集,需綜合考慮公開文獻(xiàn)、行業(yè)標(biāo)準(zhǔn)和企業(yè)內(nèi)部資料等多種數(shù)據(jù)源。
以醫(yī)療AI助手為例,其知識庫應(yīng)包括醫(yī)學(xué)教科書、臨床指南、藥品說明書以及匿名化的典型病例等多維度資料。采集后的數(shù)據(jù)需經(jīng)過結(jié)構(gòu)化處理,將非結(jié)構(gòu)化文本轉(zhuǎn)換為規(guī)范化的知識條目,包括概念抽取、關(guān)系識別和屬性標(biāo)注等步驟。接下來的數(shù)據(jù)標(biāo)注環(huán)節(jié)相當(dāng)重要,對于結(jié)構(gòu)化數(shù)據(jù)如標(biāo)準(zhǔn)診療規(guī)范,需要經(jīng)驗豐富的臨床專家進(jìn)行審核標(biāo)注;而對于非結(jié)構(gòu)化數(shù)據(jù)如醫(yī)學(xué)文獻(xiàn),則可采用眾包標(biāo)注與對抗學(xué)習(xí)相結(jié)合的半自動化方法,先由算法生成初步標(biāo)注,再由人工校驗糾錯,形成高質(zhì)量的標(biāo)注結(jié)果。經(jīng)過專業(yè)審核的數(shù)據(jù)將進(jìn)入向量化存儲階段,采用適合領(lǐng)域特性的嵌入模型(如MedBERT等醫(yī)療領(lǐng)域預(yù)訓(xùn)練模型)生成語義向量,并構(gòu)建高效的檢索增強(qiáng)生成(RAG)索引,實現(xiàn)毫秒級的知識檢索響應(yīng)。
標(biāo)注規(guī)范的制定需要充分結(jié)合行業(yè)標(biāo)準(zhǔn)和應(yīng)用場景特點。在醫(yī)療場景中,疾病診斷必須遵循ICD-10疾病編碼體系,確保與全球醫(yī)療信息系統(tǒng)的兼容性;藥物標(biāo)注則需采用ATC分類系統(tǒng),以支持藥物相互作用的自動檢測;醫(yī)療程序則應(yīng)按照CPT編碼規(guī)范進(jìn)行標(biāo)注,便于與醫(yī)保報銷系統(tǒng)對接。在金融場景下,財務(wù)數(shù)據(jù)需符合XBRL可擴(kuò)展商業(yè)報告語言標(biāo)準(zhǔn),支持跨機(jī)構(gòu)、跨國家的財務(wù)數(shù)據(jù)交換與分析;風(fēng)險控制指標(biāo)則需遵循巴塞爾協(xié)議III的定義體系,確保風(fēng)險評估的準(zhǔn)確性和一致性。標(biāo)注過程中還需建立嚴(yán)格的質(zhì)量控制機(jī)制,包括隨機(jī)抽檢、交叉驗證和專家評審等多重保障措施,確保數(shù)據(jù)質(zhì)量達(dá)到行業(yè)應(yīng)用標(biāo)準(zhǔn)。高質(zhì)量的標(biāo)注數(shù)據(jù)不僅提升了Agent的專業(yè)表現(xiàn),也為后續(xù)的模型微調(diào)提供了可靠基礎(chǔ)。