常识资讯
上海交大高金和IDEA研究院宣布战略合作 联合研发金融知识大模型
中新网上海新闻1月18日电(记者 姜煜)“爱高金·爱归来”上海交通大学上海高级金融学院2024年度校友年会暨15周年院庆“金融科技”论坛近日在沪圆满举行。
本次金融科技论坛由上海交通大学上海高级金融学院主办,上海交通大学上海高级金融学院校友会承办,上海高金金融研究院、国际金融家论坛数字化转型专业委员会与并购重组委员会协办。校院领导、各界校友以及行业嘉宾等500余人出席了本次论坛。本次论坛以“AI大模型在金融领域的应用”为主题,聚焦人工智能尤其是大模型技术在金融垂直领域的应用落地。上海交通大学校长助理于朝阳、上海高级金融学院校友总会执行会长王建郡为本次论坛致开幕辞。
论坛上,上海交通大学上海高级金融学院(SAIF)与粤港澳大湾区数字经济研究院(简称“IDEA研究院”)举行战略合作签约仪式。上海交通大学上海高级金融学院副院长、会计学教授、中国金融研究院副院长、上海高金金融研究院联席院长李峰与粤港澳大湾区数字经济研究院执行院长郭健代表双方隆重签署战略合作协议。双方将融合发挥各自资源优势,在推进学术和行业研究、培养专业人才、共建金融大模型等方面开展多层次合作。
签约仪式后,上海交通大学校长助理于朝阳、上海交通大学文科建设处处长吴文锋与李峰院长、郭健院长一起联合发布“金融知识大模型”。上海交通大学上海高级金融学院希望运用最新的大模型技术,深度融合学院的人才培养专注力、学术研究影响力和服务社会向心力,主动对接现实场景中面临的系列需求。IDEA研究院长期寻求数字经济时代下AI前沿技术与各行各业的深度融合,深入参与到大模型技术从广泛关注到广泛应用的过程。两家机构将携手努力,共同推动AI大模型在金融领域的发展进入崭新篇章,从而更好地助力实体经济的高质量发展。
粤港澳大湾区数字经济研究院数字金融首席科学家林舟驰博士为大家解读了“金融知识大模型”。作为针对教育科研机构现实场景中的系列痛点而提出的创新性解决方案,“金融知识大模型”面向金融教育、金融咨询与金融分析这三个主要场景,以金融知识检索、知识问答、信息抽取、意图识别、代码智能和工具调用等能力为支撑,具备了“金融试题解析”“金融分析计算”和“金融事件分析”三大功能。金融试题解析方面,根据输入的金融试题,大模型通过题干关键词进行背景知识搜索、相关案例搜索和相关例题搜索,能够根据需要解答问题、对答案进行分析或答疑。金融分析计算方面,针对金融计算问题,大模型内部经过“知识库检索”“公式召回”“代码生成”“编译计算”等环节,输出最终的正确答案。金融事件分析方面,金融知识大模型基于海量新闻库、财报库、研报库数据,具有多轮高质量金融相关对话、思维导图生成、问题推荐等功能。
测试结果表明,金融知识大模型性能突出。不仅在主流金融测试集FinEval上全面超越了现有的主流大模型,而且在金融领域的重要考试方面成绩喜人——在CPA考试上全面超越现有的主流大模型,包括GPT3.5和GPT4;在CFA考试中,全面超越了主流的中文大模型,在大部分科目上跟GPT4互有胜负。
为更形象地展示金融知识大模型的能力,现场演示了三个场景常识资讯。第一个场景是求解CPA例题。CPA题目相对简短,金融知识大模型定位题干关键词对应的知识点后,针对知识点检索做了特定优化。第二个场景是解答较为复杂的CFA二级分析计算题。金融知识大模型求解过程要经过OCR图表识别和STEM剪枝过程以精简题干。在这两个场景中,学生都可以以一种交互式的学习方式,获得答案的解析和针对题干内容的答疑,颠覆了传统的人机教培方式,更容易提升学生对复杂知识的接受程度。第三个场景是针对“2023年中央金融工作会议”的公报内容作深层次的信息检索和归纳整理。金融知识大模型构建了以“2023中央金融工作会议”为问题主体的思维导图,并生成了与它相关的子问题。通过意图识别选取相关的子节点对金融知识库、资讯库进行信息检索,最后通过金融知识大模型进行最终的内容生成。
金融知识大模型的优异表现,得益于背后的创新性“知识驱动”方案,即以金融知识库+大语言模型为底座,取代了传统的单一语言模型底座架构,再搭配金融、教育、咨询场景的高质量语料进行模型预训练,形成了思维图谱推理技术。这种思维图谱推理技术,能在某种程度上把模型的推理过程白盒化,通过知识的归纳、整理,形成思维图谱,逐点逐层解决一个现实中的金融问题。在知识+模型的底座基础上,研发团队开发了一系列面向现实场景的工具接口,例如金融信息抽取,可以在海量研究报告与新闻材料中抽取有价值的金融常识、金融主体和关系信息,金融事件各类观点等等。这些金融信息都将被解析,并最终被吸收成为金融知识库的一部分,服务于各类顶层任务,例如知识检索、知识问答、摘要生成、事件分析等等。
目前,金融知识库囊括了超过20万篇研报、3000万篇新闻资讯。模型采用了来自金融教科书、企业财报、企业研报、新闻舆情、法律案例和政府报告等超过160G高质量金融文本进行增量预训练,还通过30多万条衍生于金融公式、金融试题、金融代码、金融问答、金融表格和金融知识图谱等的高质量指令数据进行有监督微调,有力保证了大模型最终输出内容的可靠性和可控性。
主旨演讲环节,欧洲人文和自然科学院外籍院士、欧洲科学院院士、上海交通大学自然科学研究院院长金石以“量子计算与金融”为主题,为大家呈现了量子计算在金融领域的最新进展。特许全球金融科技师(CGFT)学术委员会委员、恒生电子首席科学家、中科院博导、上海证券交易所前总工程师白硕从实践专家角度,详细阐述了“大模型金融行业应用的挑战和机遇”主题。
圆桌讨论环节,由上海交通大学上海高级金融学院副院长、会计学教授李峰担任主持,围绕“大模型在金融行业应用的挑战和机遇”的研讨主题,与浦发银行信息科技部副总经理万化、平安资管大数据总监刘剑、上海人工智能研究院院长宋海涛和信也科技副总裁陈磊展开交流。四位专家分别从银行、保险、研究机构和科技企业的角度,结合自身工作实际向大家分享了所在领域人工智能尤其是金融大模型的应用现状、成功经验、发展挑战与未来趋势。(完)