天天速看：华泰证券：从BloombergGPT看金融GPT机遇

2023年3月30日，金融信息提供商彭博社发布了专为金融领域打造的大语言模型（Large Language Model，LLM）Bloomberg GPT。该模型依托彭博社的大量金融数据源，构建了一个3630亿个标签的数据集，支持金融行业内的各类任务，在执行金融任务上的表现远超过现有模型，在通用场景上的表现与现有模型也能一较高下。

(资料图片仅供参考)

华泰证券分析师谢春生（执业：S0570519080006）认为，掌握金融数据的国内厂商也有望复制Bloomberg GPT的路径，实现大语言模型在金融场景的有效赋能。

核心突破在于金融语料

尽管Bloomberg GPT的模型参数介于GPT-2与GPT-3之间。但BloombergGPT的金融垂直能力远超GPT系列。

分析师指出：

根据论文《Bloomberg GPT: A Large Language Model for Finance》的模型介绍显示，Bloomberg GPT同样基于典型的Transformer架构，Bloomberg GPT的模型参数介于GPT-2与GPT-3之间，GPT-2模型参数为1.5亿，GPT-3模型参数为1,750亿，Bloomberg GPT的模型参数为500亿。

官方论文《Bloomberg GPT: A Large Language Model for Finance》中的测试结果显示，Bloomberg GPT在执行金融任务上的表现超过现有的通用LLM模型，在通用场景上的表现与现有通用LLM模型能力基本持平。

尽管Bloomberg GPT的模型参数相较于GPT-3较小，但分析师表示，依托彭博社的大量金融数据源，Bloomberg GPT在预训练中获得了大量高质量金融数据，并对预训练数据进行了一系列的清洗、标注，Bloomberg GPT在通用能力与GPT-3基本持平的情况下，实现了金融垂直能力的大幅增强。

开拓开源模型+垂直数据的LLM新思路

Bloomberg GPT在开发方式上有何独特之处？分析师认为，在模型构建上，Bloomberg GPT显示出了卓越的创新，为国内金融数据公司开发大模型提供了有意义的路径参考。

具体而言，主要体现在五个方面：

1）垂直领域语言模型：过去的大语言模型多为基于通用文本训练的通用模型，垂直领域模型多为仅基于垂直领域数据训练垂直模型，Bloomberg GPT开创了通用+垂直的混合训练方法，让模型兼具通用性与专业性；

2）训练数据：过去的大语言模型的预训练数据很大程度上依赖于网页抓取数据，如C4、ThePile、Wikipedia等，Bloomberg自建了高质量的大规模金融数据集；

3）模型评估：Bloomberg在对模型进行了公共、金融NLP基准测试之外，还对模型进行了一系列基于Bloomberg内部任务的性能测试；

4）Token化（Tokenizer）：将训练文本Token化是模型训练的关键步骤，Bloomberg使用Unigram模型取代greedymerge-basedsub-word模型，实现更智能的token化转换；

5）模型构建方法：以GPT-3、GPT-4为代表的大语言模型均由大型的专业人工智能团队开发，并且模型训练需要大量算力；受益于开源模型BLOOM的项目实践与Bloomberg在垂直领域高质量数据的深厚积累，Bloomberg GPT成功证明了一个中等规模的团队可以在垂直领域的特定数据上生产同样具有竞争力的大语言模型。

金融GPT未来可期

分析师认为，Bloomberg GPT未来有望应用于以下三大场景：

1）Bloomberg查询语言的生成：Bloomberg GPT可以将用户自然语言查询转换为有效的Bloomberg查询语言，使与金融数据的交互更加自然；

2）新闻标题的建议：Bloomberg GPT可以为Bloomberg的新闻应用程序提供支持，协助新闻工作者完成新闻短标题的撰写；

3）金融问答：得益于金融垂直领域知识的输入，Bloomberg GPT可以更加准确地回答金融相关的问题，例如在识别公司CEO的问答上，Bloomberg GPT的回答相较通用模型更为准确。

分析师指出，作为并非聚焦人工智金融垂直领域厂商，Bloomberg为金融GPT发展提供了具有参考价值的有益示范。

掌握丰富的金融垂直知识与现有AI产品布局，基于高质量的金融数据与开源的大语言模型，同样有机会打造专属金融场景的大语言模型，实现大语言模型在金融场景的有效落地，让大语言模型成为底层的AI操作系统。

本文主要观点来自华泰证券分析师谢春生（执业：S0570519080006）撰写的报告《从BloombergGPT看金融GPT机遇》，有删节

天天速看：华泰证券：从BloombergGPT看金融GPT机遇

央行：54.1%的居民预期下季房价不变-每日热门

天天时讯：33股股东户数连降3期以上 最多已连降14期

千份样本揭示高净值人士慈善需求：基金会与慈善信托是最主要的慈善工具 焦点热闻

猎聘大数据显示：2022年新能源汽车活跃人才是传统汽车的10倍:天天聚看点

世界热点评！郑商所调整PTA期货2305合约交易保证金标准、涨跌停板幅度和交易手续费标准

丝芭旗下电子商务公司因肖像权纠纷被列为被执行人-全球独家

啄木鸟投诉平台周报：教育培训机构虚假宣传、诱导贷款、退费难问题依然严重:前沿热点

拖欠工资、门店关闭 网红品牌虎头局疑似破产冲上热搜 天天消息

天天播报:利润增超9成股价仍触底？力量钻石多项财务数据背离遭问询

新增投资者诉讼 ST华仪说明情况

未按规定及时披露关联交易事项 S*ST佳通拟遭行政处罚|热点聚焦

每日热闻!V观财报｜净利“变脸”，金明精机收深交所监管函

V观财报｜汤姆猫前董事长收监管函_全球热闻

环球微头条丨太阳能：董事长曹华斌辞职

“一屏观全域、一网管全域、一端惠全域” 京东云助力宿迁打造“一网统管”中小城市样板

环球热议:欧委会批准意大利一项4.5亿欧元支持可再生氢生产的计划

研究显示超10万座冰川将在本世纪末完全融化消失 奥地利冰川或将在2075年全部消失

信测标准：2022年归母净利润同比涨47.46% 拟10派3元:今日热议

ST爱迪尔：公司非主营业务收入主要来源于加盟费、品牌管理费等费用

丽江股份：3月31日召开董事会会议|世界快播

当前短讯！人间世第二季在线观看完整版（人间世第二季）

苹果电脑如何安装win10系统（苹果电脑操作系统）_当前视讯

天天热议:党员的权利有哪些内容?（党员的权利有哪些内容）

形容女孩很有气质的成语（形容女孩子气质的名字）

英语作文格式开头空格（英语作文格式）

央行第一季度城镇储户问卷调查报告：54.1％的居民预期下季房价不变

东北三省去年常住人口共减少86.08万人，出生人口跌破40万

环球热点！央行：贷款总体需求指数为78.4%，比上季上升19.0个百分点

世界今日报丨央行：倾向于“更多投资”的居民占18.8%，比上季增加3.3个百分点

每日热文：央行：企业家宏观经济热度指数为33.8%，比上季上升10.3个百分点

全球最新：2022年券商分仓榜单出炉：中信夺魁，民生、东亚前海增幅最大

中科磁业龙虎榜：机构净卖出667.15万元:要闻

开源证券发布东方电气研报，公司信息更新报告：业绩符合预期，能源装备龙头有望持续向上

今日视点：央行：3月对金融机构开展常备借贷便利操作共56.71亿元

泰和科技：预计2023年第一季度净利润为3000万元~3700万元，同比下降70.35%~75.96%_环球今头条

天铁股份：第一季度“天铁转债”转股约1.09万股_环球速讯

兴业银行：第一季度“兴业转债”转股约1.07万股 环球信息

李洛夫原型（李洛夫本人）

固定资产标准金额是多少（固定资产标准金额）|天天快看

关于幸福的文章题目（关于幸福的文章）

质量管理内容包括哪些（质量管理内容）_即时看

【天天时快讯】中国版《巴塞尔协议III》即将实施：鼓励按揭买房，限制开发建房

快资讯：汤姆猫：公司及子公司、合作方持续在推进脑机接口领域的产学研工作

IMF：去年四季度人民币全球外储占比为2.69% 位居全球第五-环球通讯

苏泊尔2022年净利21亿，拿出24亿分红，控股股东获20亿现金红利:天天看点

焦点简讯:河南花花牛26%股权被转让：挂牌底价2.05亿元、溢价率25%，最近月亏损2344万元

报道：旭辉控股延发年报，因与子公司永升服务18亿交易遭质疑

思哲睿多轮融资下估值涨超3倍，实控人直接持股比例已低于15%-今日热议

【速看料】被价格战卷到？哪吒、零跑3月交付量跌超1成，理想汽车反再破2万

新冠药物起大早赶晚集，开拓药业去年亏损扩大至逾9亿，至今仍无产品商业化

环球快消息！医美三剑客有人掉队，爱美客的玻尿酸比茅台酒还赚钱，华熙生物仍是老大哥

净利润跌超七成！煌上煌掉队明显，但今年还要新开上千门店

快报：贝泰妮去年业绩增长，再抛百万股权激励！网友称，别画大饼了？

世界资讯：营收、净利双下滑，新标准下存货高企，中药配方颗粒龙头红日药业渡难关

当前关注：意华股份：子公司以自有资金1亿元投资设立“晟维新能源（新疆）科技有限公司”

最新快讯!注意！润邦股份将于4月25日召开股东大会

仲景食品：2022年年度业绩说明会定于2023年4月10日举行|每日消息

三晖电气：聘任邓栋为副总经理:世界百事通

当前热文：3年行业销售收入减少4成 黄酒业仍未实现突围

什么水果减肥速度快（什么水果减肥）:世界热议

焦点信息:说英雄谁是英雄豆瓣评分（说英雄谁是英雄）

趣味辩论赛辩题大全（辩论赛辩题大全）

今日热文：什么是病毒感染（什么是病毒）

7月份是什么星座女生（7月份是什么星座）|全球热头条

焦点滚动:科创板飙升 A股普涨冲击3300点 能否站稳？

要闻：出生人口超百万，谁是全国第一生育大省？

锂价跌至25万“生死线”，大企业控价？宜春锂矿小老板：日子苦不堪言

环球观热点：郑州二环外取消限购 限售政策也调整

工信部：1-2月规模以上家具制造业企业营业收入893.5亿元

中国期货业协会：3月我国期货市场成交额环比增长21.84%-天天热资讯

佳兆业集团港股跌9.09% 佳兆业美好港股跌9.7%|全球微动态

白酒概念板块涨0.01% 顺鑫农业涨6.11%居首_天天热头条

锂电池板块涨0.72% 中国长城涨10.02%居首|每日看点

【世界报资讯】鹰眼预警：神州数码债务偿还压力巨大 财务费用吞噬利润

当前简讯:天健会计师所遭监管谈话 审计荣盛石化2年年报违规

三一重工涨3.51%：2022年净利降64% 拟10派1.6元-每日热文

萃华珠宝拟定增募资不超7.8亿实控人变更 股价涨停

鹰眼预警：云南白药陷入平庸？增长停滞仍藏水分 应收增速大超营收

当前热议!鹰眼预警：深圳机场大幅亏损 负债水平持续攀升

天天时讯：33股股东户数连降3期以上最多已连降14期

千份样本揭示高净值人士慈善需求：基金会与慈善信托是最主要的慈善工具焦点热闻

拖欠工资、门店关闭网红品牌虎头局疑似破产冲上热搜天天消息

研究显示超10万座冰川将在本世纪末完全融化消失奥地利冰川或将在2075年全部消失

兴业银行：第一季度“兴业转债”转股约1.07万股环球信息

当前热文：3年行业销售收入减少4成黄酒业仍未实现突围

焦点滚动:科创板飙升 A股普涨冲击3300点能否站稳？

环球观热点：郑州二环外取消限购限售政策也调整

【世界报资讯】鹰眼预警：神州数码债务偿还压力巨大财务费用吞噬利润

当前简讯:天健会计师所遭监管谈话审计荣盛石化2年年报违规

萃华珠宝拟定增募资不超7.8亿实控人变更股价涨停

鹰眼预警：云南白药陷入平庸？增长停滞仍藏水分应收增速大超营收

当前热议!鹰眼预警：深圳机场大幅亏损负债水平持续攀升

开源证券发布康龙化成研报公司信息更新报告近期获4份券商研报关注目标均价涨幅40.09%

今日47股涨停主要集中在计算机、建筑装饰等行业

北向资金净买入5.79亿元连续5日净买入

天天播报:新希望大额计提减值致预亏或超15亿股价低迷机构持股仅1.8%锐降67个百分点

天齐锂业盈利241亿增10倍毛利率超85%拟斥资49亿分红