鹏城实验室联手百度塑“文心” 全球首个知识增强千亿大模型在深发布

2021-12-09 11:42:51 深圳商报

作为当前AI发展的重要方向，预训练大模型已成为AI领域的技术新高地。12月8日，鹏城实验室与百度在深圳正式发布全球首个知识增强千亿大模型——“鹏城-百度·文心”。该模型参数规模达到2600亿，是目前全球最大中文单体模型，在60多项任务上取得最好效果。中国工程院院士、鹏城实验室主任高文，百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰共同启动发布仪式。

高文院士表示，预训练模型对整个科学的发展、社会的发展、创新的发展都是非常重要的工具。运用这个工具，可以帮助做很多人工智能的赋能，不局限于某个领域，这对人工智能的发展都是一个福音。王海峰介绍，百度知识增强大模型从大规模知识和海量数据中融合学习，效率更高，效果更好，具有良好的可解释性。最新的产业级知识增强大模型文心全景图，既包含基础通用的大模型，也包含面向重点领域、重点任务的大模型，以及丰富的工具与平台，有助于促进技术创新和产业发展。

此次发布的“鹏城-百度·文心”是“全球首个知识增强千亿大模型”，在机器阅读理解、文本分类、语义相似度计算等60多项任务取得最好效果，并在30余项小样本和零样本任务上刷新基准。

为解决大模型应用落地难题，百度团队首创大模型在线蒸馏技术，模型参数压缩率可达99.98%。

本着开源开放的理念，该模型代码近期会在OpenI启智社区开源，依托“鹏城云脑Ⅱ”对外开放，积极联合产学研协各方，充分挖掘AI大模型的赋能能力，助力科技创新，推动产业发展。

目前，百度文心通过百度飞桨平台陆续对外开源开放，并已大规模应用于百度搜索、信息流、智能音箱等互联网产品，同时通过百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业。

关键词：实验室知识发布发布