华为盘古大模型曝光

来源：数据观综合时间：2023-03-28 16:06:25 作者：

　　沉寂两年后，华为“盘古”AI大模型即将上线。

　　3 月 27 日，华为产业链开盘大涨，多支概念股高开。

　　消息面上，华为盘古大模型即将发布的消息刷屏，受到极大关注。事实上，这来自人民日报 3 月 25 日刊发名为《人工智能产业化应用加速》的文章。该文章称，近几年，国内外厂商纷纷加码巨量模型的投入与研发，让人工智能产业落地找到了新的方向，其中提到了华为云盘古大模型在新药开发上发挥的重要作用。

　　最接近人类中文理解能力的AI 大模型？

　　华为云团队于 2020 年立项 AI 大模型，并且于 2021 年 4 月发布“盘古大模型”。目前，盘古大模型已经发展出包括基础大模型（L0）、行业大模型（L1）、行业细分场景模型（L2）三大阶段的成熟体系。

　　2022 年 11 月，在华为全联接大会 2022 中国站上，华为云进一步迭代盘古大模型的技术能力，扩展盘古大模型的服务范围，发布盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项重磅服务。

　　资料显示，盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成。通过模型泛化，解决传统 AI 作坊式开发模式下不能解决的 AI 规模化、产业化难题。

　　根据华为云官网信息，华为即将上线的盘古系列 AI 大模型分别为NLP大模型、CV大模型、以及科学计算大模型（气象大模型）。

　　据华为云介绍，盘古NLP大模型可用于内容生成、内容理解等方面，并首次使用Encoder-Decoder架构，兼顾NLP大模型的理解能力和生成能力，保证了模型在不同系统中的嵌入灵活性。在下游应用中，仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。

　　2019 年权威的中文语言理解评测基准CLUE榜单中，盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一，刷新三项榜单世界历史纪录；总排行榜得分83.046，多项子任务得分业界领先，是目前最接近人类理解水平（85.61）的预训练模型。

　　盘古CV大模型可用于分类、分割、检测方面，也是首次实现模型按需抽取的业界最大CV大模型，首次实现兼顾判别与生成能力。基于模型大小和运行速度需求，自适应抽取不同规模模型，AI 应用开发快速落地。使用层次化语义对齐和语义调整算法，在浅层特征上获得了更好的可分离性，使小样本学习的能力获得了显著提升，达到业界第一。

　　盘古气象大模型实现气象预报精度首次超过传统数值方法，速度提升1000倍，提供秒级天气预报，例如重力势、湿度、风速、温度，气压等变量的1小时-7天预测。借助创新的3DEST网络结构以及分层时间聚合算法，盘古气象大模型在气象预报的关键要素（例如，重力势、湿度、风速、温度等）和常用时间范围上（从一个小时到一周）精度均超过当前最先进的预报方法，同时速度相比传统方法提升1000倍以上。

　　按上述描述来看，相比定位于多模态大语言模型的文心一言，华为盘古大模型除了NLP（自然语言处理）能力之外，还可应用在分子、金融、气象等更广泛的领域。

　　华为发布会背后：各大机构关注升温

　　在不久前的 2023 华为春季旗舰新品发布会上，华为带来全新智慧搜图功能。该功能基于多模态大模型技术，在手机端侧对模型进行小型化处理，实现了首创的、精准的自然语言手机图库搜索体验。除了手机，未来智能音箱、手表等IOT设备有望也能搭载端侧处理功能，从而实现大模型在各个智能终端上的轻量化应用。

　　基于此，华为的盘古大模型成为市场各大机构关注的焦点。

　　招商证券认为，国内应用软件 AIGC 投资逻辑可以分为四类：

　　1、模型类企业：除去百度文心一言、华为盘古、以及阿里腾讯等互联网企业自研大模型外，目前A股有望推出类GPT模型企业包括三六零、科大讯飞。

　　2、海外映射应用：基于对微软企业级服务产品 AI 应用情况的研究，判断办公及企业级服务领域将是国内 AIGC 能力应用的优质场景。

　　3、有望接入 ChatGPT 应用：目前中国地区应用软件无法直接接入GPT模型，而海外地区应用则具备接入GPT的潜力，因此判断海外业务占比高的企业有望率先在AIGC领域有相关应用产品落地。

　　4、“AIGC+”应用：判断在“AIGC+”的垂直领域中具备数据基础优势的企业有望率先落地。

　　民生证券认为，盘古NLP大模型可以赋能千行百业，应用于各种场景。

　　在智能营销领域，盘古NLP大模型可以通过文本匹配，问答和对话系统、意图识别等关键技术更好地赋能销售环节，取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统，帮助服务人员快速提升业务水平，重塑消费者体验。

　　在智能舆情方面，盘古NLP大模型可以利用文档信息抽取、情感分类、文档自动摘要等技术在金融，电商，政务领域实现精准舆情分析、企业运营软件分析。

　　天风证券认为，盘古NLP大模型可以实现一个 AI 大模型在众多场景通用、泛化和规模化复制，减少对数据标注的依赖，让AI开发由作坊式转变为工业化开发的新模式。未来随着盘古系列AI大模型的上线，将持续赋能金融、电力、交通、气象、物流等行业。

　　浙商证券研报也对其进行了分析，具体来看，华为云盘古药物分子大模型归为AI辅助药物设计服务类。从 AI+制药降本增效 Drug X 迎来重大突破、科技平台与科研团队联手AI与生物医药双向赋能、全流程辅助药物设计 AI 未来大有可为三个角度列举了华为云盘古药物分子大模型的应用实例。

　　国内大模型概览

　　大模型增强了 AI 技术的通用性，助力普惠 AI 的实现。未来，大模型有望于场景深度融合，配合专业工具和平台支持应用落地，开放的生态来激发创新，形成良性循环。

　　头部企业均采取“模型+工具平台+生态”三层共建模式，有助于业务的良性循环，也更容易借助长期积累形成竞争壁垒。大模型厂商主要包括百度、腾讯、阿里、商汤、华为等企业，也有智源研究院、中科院自动化所等研究机构，同时英伟达等芯片厂商也纷纷入局。

　　百度：文心大模型

　　3 月16日下午，百度CEO李彦宏在发布会上正式揭开了“文心一言”的面纱。“文心一言”是百度新一代知识增强大语言模型，它基于百度ERNIE及PLATO系列模型的基础进行研发，其大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据，以及5500亿事实的知识图谱等。李彦宏表示，虽然“文心一言”的实际能力还并不完美，但希望通过发布后的真实用户反馈来帮助大模型快速迭代，加速模型能力的提升。

　　“文心一言”具备五大能力——

　　文学创作：发布会现场以《三体》为例，“文心一言”能够对《三体》进行续写，并能回答事实相关问题，体现出了强大的总结分析与推理能力。

　　商业文案创作：“文心一言”能够为公司起名提供创意，并能直接进行商业新闻稿的创作，展现了模型的理解表达与创作能力。

　　数理逻辑推算：“文心一言”能够看出题目本身存在的错误，并能给出正确题目的解题步骤，具备较强的数理逻辑能力。

　　中文理解：“文心一言”基于大量中文语料进行训练，能够解释“洛阳纸贵”背后的经济学原理，并能写出藏头诗，展现了对中文的强大理解能力。

　　多模态生成能力：“文心一言”可以输入文字生成图像、音频和视频，并支持多种方言生成。文字生成视频的能力现阶段还未对外开放，但百度旗下的百家号已经在使用这项技术。

　　李彦宏在发布会上宣布，已有 650 家企业首批接入了“文心一言”，涵盖了互联网、媒体、金融、保险、汽车、企业软件等行业，百度大模型在 B 端的生态圈迅速扩大。

　　IDC 评估结果显示，百度文心大模型处于第一梯队，产品能力、生态能力达到 L4 水平，应用能力达到 L3 水平。

　　腾讯：混元大模型

　　2022 年 4 月，腾讯首次对外披露 HunYuan 大模型，协同了腾讯预训练研发力量，完整覆盖NLP大模型、CV大模型、多模态大模型及众多行业/领域任务模型。

　　HunYuan-NLP：万亿级别中文NLP预训练模型，参数量达1T，排名CLUE1.1总排行榜第一。

　　HunYuan-vcr：排名VCR（Visual Commonsense Reasoning）榜单第一。

　　HunYuan_tvr：跨模态文字-视频检索AI大模型。

　　HunYuan 先后支持了包括微信、QQ、游戏、腾讯广告、腾讯云等众多产品和业务，降本增效。依靠 HunYuan 的多模态理解能力，在广告内容理解、行业特征挖掘、文案创意生成等方面的应用，在为腾讯广告带来大幅GMV提升的同时，也初步验证了大模型的商业化潜力。

　　HunYuan 大模型和腾讯广告精排大模型基于太极机器学习平台，共同完善优化了广告理解、用户理解、广告和用户匹配的整个流程，提升对广告理解、匹配效率、精准度和转化效率。

　　HunYuan 大模型的生成能力，可以提升广告制作的效率：“图生视频”功能，可以将静态的图片自动生成不同样式的视频广告；“文案助手”功能，可以为广告自动生成更恰当的标题，提升广告的效果；“文生视频”功能，未来只需要提供一句广告文案，就可以自动生成与之匹配的视频广告。

　　阿里：通义大模型

　　2022年9月，在阿里巴巴达摩院主办的世界人工智能大会“大规模预训练模型”主题论坛上，发布“通义”大模型系列，并宣布相关核心模型向全球开发者开源开放。阿里达摩院基于其AI统一底座构建了通用模型与专业模型协同的层次化人工智能体系。

　　统一底座层：M6-OFA模型作为单一模型，在不引入新增结构的情况下，可处理超过30种跨模态任务。

　　通用模型层：NLP模型“通义–AliceMind”；CV模型“通义-视觉”；多模态模型“通义-M6”。

　　专业模型层：深入电商、医疗、娱乐、设计、金融、工业、制造业等行业。

　　通义-M6为多模态大模型，已经从 2020 年 6 月的 3 亿参数基础模型发展到2021年10月的10万亿参数全球最大预训练模型到 2022 年 1 月的业界首个通用统一大模型M6-OFA。

　　2021 年 3 月，发布通义–AliceMind，为达摩院开源的深度语言模型体系，CLUE1.1总排行榜第二。

　　AliceMind生态体系包括：通用语言模型StructBERT、多模态语言模型StructVBERT、多语言模型VECO、生成式模型PALM、文档图像理解模型StructuralLM、表格理解模型SDCUP、超大中文理解与生成模型PLUG（24层StructBERT编码器+“24-6”层的PALM编码器-解码器）、超大图像-文本模型mPLUG等。

　　人工智能迈入“双G时代”

　　东方证券研报指出，目前人工智能最火热的两个赛道分别是生成（Generation）和通用（General），这两条赛道相互交织并行，AI领域也进入了“双G时代”。

　　在生成领域，以DALLE-2、StableDiffusion等引领的生成式AI技术与AIGC概念如火如荼；在通用领域，AI研究者们现在都在朝着通用人工智能（Artificial General Intelligence，AGI）的方向不断努力，大模型不断增强的多模态感知能力就是迈向AGI的重要途径。

　　毋庸置疑，OpenAI及其GPT系列模型是当前人工智能赛道上的领跑者，超大规模模型带来的知识涌现能力是ChatGPT出圈的关键。

　　OpenAI持续在GPT模型上发力，陆续推出规模更大的迭代版本GPT-2和GPT-3，在OpenAI的研究中，发现了当模型参数到达一定规模时，模型会开始涌现出In-contextlearning（上下文学习）、ChainofThoughts（思维链）、Zero-shot（能够处理未见任务）等能力，而这样的能力成为了ChatGPT能够“更像人”的关键。

　　对比来说，我国的人工智能技术起步晚，经验积累不足，但是发展速度较快。随着我国相关科技公司大力投入生成式AI、大语言模型的研究，我国在AI的“双G时代”中将持续扮演追赶者的角色，争取和国际领先水平缩小差距。