0 引言
1 TransKG交通运输知识大模型构建
1.1 数据集构建
表1 交通运输领域微调数据集样例 |
| 字段 | 对话1 | 对话2 | 对话3 | 对话4 |
|---|---|---|---|---|
| system | 你是一名物流枢纽管理领域的智能助手,专注于货运调度与运营问题解答 | 你是一名多式联运调度领域的专家助手,为用户解答铁路、公路、水运等联运相关业务问题 | 你是交通运输领域应急管理专家,擅长解决运输事故和应急调度问题 | 你是一名交通运输安全管理专家,专注于提升道路运输安全与风险防控 |
| input | 货运枢纽日常管理中,如何实现多类型货物的高效调度? | 多式联运过程中,如何协调铁路与公路环节的衔接,提高整体运输效率? | 面对突发暴雪天气,如何应急调整长途货运计划以保障货物及时送达? | 在运输高危化学品时,枢纽应采取哪些安全措施以防止事故发生? |
| output | 枢纽通常采用分区管理和智能调度系统,将不同类型货物划分至指定作业区,通过实时监控与排班,提升流转效率 | 联运枢纽设立中转换装区,实现集装箱在铁路与公路间无缝转运,并通过统一调度和信息共享优化衔接 | 遇到暴雪等极端天气,调度系统会动态调整线路与班次,优先安排替代路径和备用运力,确保货物安全及时送达 | 运输高危化学品时,需专设安全通道和隔离区,实施全过程视频监控,严格执行双人交接和实时风险预警,确保运输安全 |
1.2 TransKG大模型构建
2 TransKG-Chat交通运输知识图谱构建方法
2.1 知识图谱五元组构建
表2 五元组结构要素及其功能说明 |
| 要素名称 | 符号 | 语义说明 | 功能作用 |
|---|---|---|---|
| 起点实体 | h | 关系的起始节点 | 标识知识单元的出发点,为关系描述提供具体对象 |
| 关系 | r | 起点实体与终点实体间的语义关系 | 刻画实体间的关联类型,实现领域内多样知识连接 |
| 终点实体 | t | 关系的指向节点 | 指明知识单元的落点,辅助知识图谱的逻辑结构扩展 |
| 起点隶属 | ph | 起点实体的上级/归属层级 | 明确起点实体的层次、归属,实现复杂知识的分层与去歧义化处理 |
| 终点隶属 | ph | 终点实体的上级/归属层级 | 明确终点实体的层次、归属,支撑图谱分层、可视化和复杂语义组织 |
2.2 知识图谱五元组自动抽取方法
2.3 交通运输知识图谱应用
表3 知识图谱五元组在交通领域的典型应用场景 |
| 应用场景 | 典型业务问题 | 五元组示例 | 五元组结构优势说明 |
|---|---|---|---|
| 设施全寿命周期管理 | 某桥梁属于哪个线路?其维护周期如何? | ["桥梁A", "属于", "线路X", "桥梁组", "线路组"] | 实体归属与多层级管理清晰建模, 便于全生命周期信息追踪 |
| 智能调度与联动 | 调度任务涉及哪些单位和设备? | ["调度任务T", "涉及", "调度设备E", "调度中心", "设备库"] | 关系可细粒度表达, 隶属信息辅助资源组织与联动分析 |
| 安全隐患溯源与响应 | 某次事故源头及涉及 层级如何判定? | ["事故X", "关联", "隐患Y", "事故库", "隐患数据库"] | 支持事故与隐患多层溯源, 助力风险演化链条结构化建模 |
| 交通运行知识问答 | 某路段拥堵原因与 影响因素有哪些? | ["路段S", "原因", "信号失灵", "路网层", "设备层"] | 可多层次表达原因/影响链, 增强知识问答推理能力 |
| 行业标准自动化归档 | 业务流程涉及哪些标准、文件归属关系? | ["流程F", "依据", "标准B", "流程库", "标准体系"] | 结构化梳理流程与标准间的 复杂依赖和归属层级 |
3 TransKG模型与TransKG-Chat方法的性能评估
3.1 TransKG模型与主流模型在交通运输领域问答性能分析
3.2 TranKG-Chat知识图谱构建效率对比实验及时效性分析
3.3 消融实验与知识图谱准确率评估
表6 不同方法与结构在各层级知识图谱上的mAP(%) |
| 图谱层级 | 三元组+ 未微调 | 三元组+ 微调 | 五元组+ 未微调 | 五元组+微调(TransKG模型) |
|---|---|---|---|---|
| 一级 | 84.1 | 93.6 | 92.8 | 98.0 |
| 二级 | 72.5 | 81.4 | 87.3 | 97.2 |
| 三级 | 35.0 | 45.8 | 85.1 | 95.8 |
| 四级 | 15.3 | 22.5 | 80.6 | 95.1 |