539个Skill风险项达1937条 “龙虾”在保险业应用走到了哪一步?
2026-05-10 09:05      作者:樊红敏     来源:中国经营网

中经记者 樊红敏 北京报道

近期,以“龙虾”为代表的AI智能体(Agent)成为各行各业热门的讨论话题。

复旦大学经济学院许闲教授团队近期发布基于539个公开技能(Skill)样本的测评报告《保险“龙虾”技能洞察报告》(以下简称《报告》),当前保险Skill市场已不再是零散试水,而是开始进入明显增量阶段。进入2026年后开始明显提速,2月升至66个,3月进一步跃升至287个,4月截至20日,仍达到144个。

《报告》核心洞察发现之一是安全风险集中:共1937条风险项,数据隐私泄露(569次)、合规监管(358次)、外部依赖(281次)为核心隐患。

保险行业对“龙虾”的整体接受度如何,“龙虾”在保险领域的实际应用又走到了哪一步?

“我们目前测评的539个Skill样本,主要来自公开渠道,因此它更适合反映‘公开可获得的保险Skill生态’,而不能完全等同于保险机构内部真实使用Skill的全貌。”许闲团队在接受《中国经营报》记者采访时表示,整体来看,保险行业对“龙虾”、Skill及智能体的接受度在提升,但相较于IT、电商、内容生成等行业,保险行业的实际应用进程仍然偏谨慎、滞后;从实际应用阶段看,目前还处在探索和试点阶段。

数据隐私泄露、合规监管风险集中

4月27日,许闲团队正式开源发布业内首个面向保险全生命周期的“龙虾”技能平台Insurance-Skills;同步发布基于539个公开Skill样本的测评。

“龙虾”是能够理解任务、调用工具、完成闭环的专业系统。Skill则是智能体的专业技能包——把核保规则、理赔流程、客服话术、合规口径封装成“即插即用”模块,让大模型真正进入保险业务开展工作。

许闲团队以全网保险强相关Skill为样本,通过全量搜集、质量评估与风险分析,厘清保险智能体Skill市场现状,形成国内首份《报告》。《报告》核心洞察发现主要包括:一是增量显著但有效供给有限:万级检索结果仅筛选出539个有效样本;2026年3月单月新增287个,市场快速放量。二是场景高度集中:聚焦理赔、合规、风控、承保,合规审查内控(17.21%)、数据分析(12.28%)居前。三是以辅助能力为主:71.5%为参考文档型,仅8.7%支持自主工具调用。四是复用性极低:仅0.7%可独立运行,外部依赖强、跨机构迁移难度大。五是安全风险集中:共1937条风险项,数据隐私泄露(569次)、合规监管(358次)、外部依赖(281次)为核心隐患。六是质量短板清晰:综合均分7.73分,弱项在示例、章节覆盖、错误指导、版本跟踪。

根据《报告》数据计算,在安全风险方面,数据隐私泄露风险占比达29.38%,合规监管风险占比达18.48%。“这些保险业务过程中实际面临的风险隐患同样也存在于保险Skill的使用中,故在保险真实场景下应用Skill仍需谨慎考虑这些安全风险。”《报告》提到。

就上述539个Skill的开发团队主要有哪些类别,是否包括保险公司自主开发的Skill?许闲团队向记者表示,从目前收集到的样本来看,539个Skill中,只有31个是针对特定公司业务场景开发的,占比并不高。更多样本来自开源渠道或公开平台,开发主体以个体开发者、技术社区成员、第三方技术团队为主。

“所以,我们在报告中看到的539个公开Skill,可能只是保险Skill生态的‘显性部分’,而保险公司内部自研、自用、未公开的Skill,可能是另一个更值得持续观察的部分。”许闲团队表示。

实际应用尚处在探索和试点阶段

那么,保险行业对“龙虾”的整体接受度如何,“龙虾”在保险领域的实际应用又走到了哪一步?

据报道,已有保险机构开始探索引入类似“龙虾”的AI代理系统,试图通过“数字员工”提升效率与服务能力。如某头部险企科技负责人近期曾对相关媒体表示:“公司从2026年1月起开设了研发Skills专区,截至目前沉淀120余个Skills案例,其中在AI角色化助手上表现优异,从一个toC的助手,通过我们提供的丰富技能化团队化的训练,已逐步转型成为团队级研发领域优秀AI伙伴。”

许闲团队认为,整体来看,保险行业对“龙虾”、Skill以及智能体的接受度在提升,但相较于IT、电商、内容生成等行业,保险行业的实际应用进程仍然偏谨慎、偏滞后。从实际应用阶段看,目前保险领域的“龙虾”应用大致还处在探索和试点阶段。一些机构或已经在客服问答、营销辅助、理赔材料初筛等低风险或半结构化场景中进行尝试,主要还是辅助和效能提升,并没有进行完全自动化的智能体应用。

“实际应用目前仍处于局部提效的早期阶段,多聚焦于前端营销辅助、基础问答等标准化场景,复杂非标方案的定制与全链路闭环仍需人工深度介入。”北京排排网保险代理公司总经理杨帆也向记者表示。

保险AI科技公司暖哇科技首席数据官陈鸿在接受记者采访则时表示,目前狭义的“龙虾”(OpenClaw)受限于其安全机制,更适合C端用户或一人公司(OPC)作为个人助理使用,公司内B端要应用“龙虾”,尤其在保险这样有严肃合规要求的行业里,还是需要先解决智能体的数据安全和权限管理问题。

“所以我们并没有直接使用‘龙虾’框架,我们在参考‘龙虾’框架之外,还做了必要的智能体安全治理,包括但不限于引入非人身份(NonHumanIdentify)管理,确保智能体既能自主访问敏感资源,又在合理的身份权限管理之内。”陈鸿称。

据陈鸿介绍,暖哇科技有数字员工项目正在基于类似“龙虾”的通用智能体框架上开发,它和“龙虾”有类似的记忆功能和动态应用Skill的能力,但有更多面向保险场景的针对性设计,这些设计有助于支持保险业务场景中的数字员工的持续自主工作,具体细节需要等项目发布再公开。

许闲团队则认为,保险行业应用Skill的关键,不是简单判断“该不该用”,而是要回答“在哪些场景可以用、用到什么程度、由谁负责、如何评估风险”。

在许闲团队看来,一方面,Skill确实可能带来明显效率提升,它可以降低重复劳动,提高响应速度,改善客户体验。但另一方面,保险行业不能只看效率,还必须把数据安全、合规监管、外部依赖、模型幻觉、责任归属等问题纳入统一评估。尤其是当智能体开始连接外部工具、调用内部系统、处理客户信息或参与业务判断时,风险会明显上升。

“因此,未来更重要的工作,可能不是简单鼓励保险机构‘多开发Skill’,而是建立一套更系统、更细致的Skill测评标准。比如,可以从功能有效性、安全性、合规性、稳定性、可解释性、数据保护能力、外部依赖风险、人机协同机制等维度,对保险Skill进行分层分类评估。”许闲团队进一步表示,“这也是我们搭建平台的初衷和后续希望继续推进的方向,通过标准化测评,帮助行业识别哪些Skill适合直接辅助使用,哪些需要加强治理后才能使用,哪些不适合进入高风险业务流程。”

(编辑:李晖 审核:何莎莎 校对:燕郁霞 )