首页 资讯正文

字节跳动首次公布大模型进展

  6月28日下午,字节跳动公布了大模型业务最新进展。字节跳动旗下的火山引擎召开发布会,首次正式公布在大模型领域的研发布局和合作进展,并发布大模型服务平台“火山方舟”,提供模型训练、推理、评测、精调等全方位功能与服务。

  据介绍,“火山方舟”内集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研院所的大模型,目前正启动邀测。

  推动大模型形成生产力

  此前,百度、阿里、腾讯、商汤、360 等国内大厂已经相继宣布入局,大部分的做法都是发布一个通用大模型或者数个行业大模型底座,行业客户可以基于这些基础模型和自身拥有的行业数据精调,打造一个服务自身业务的 AI 应用。

  值得注意的是,但字节跳动的切入方式与其他大厂有明显的不同,其公布的是大模型B端业务,而C端自研大模型仍在保密中。

  “火山方舟”由字节跳动旗下火山引擎搭建,提供了一个大模型服务平台,供开发者和企业使用。其运营模式是,在一个平台内提供多个模型,企业可同步试用多个大模型,选用更适合自身业务需要的模型组合。

  对模型提供方,通过 “火山方舟”能够以更低的成本触达海量客户,更小的代价在ToB市场实现规模化;严谨的安全互信机制,兼顾灵活性与安全性;源源不断的算力,形成最具竞争力的性价比。对模型使用者来说,通过 “火山方舟”可以便捷地接触到众多高质量的基座模型,一站式对接多家模型提供商,为不同场景选择最合适的模型。

  具体来看,“火山方舟”基于大模型应用的工作习惯,打造了多个核心部分。“模型广场”会有不同的模型供应商提供不同版本和尺寸的模型,用户可以直接与模型交互,调用推理API,接入生产环境;“模型评估”是“火山方舟”重点打造的环节入口,用户可以基于业务需求设计一套可量化的评估指标,在模型评估后挑选最合适的模型;“模型精调” 可以帮助客户利用自有数据进行持续训练,建设和积累自己的精调数据集,降低推理成本。

  目前,抖音集团内部已有十多个业务团队试用“火山方舟”,在代码纠错等研发提效场景,文本分类、总结摘要等知识管理场景,以及数据标注、归因分析等方面探索,利用大模型能力促进降本增效。这些内部实践在快速打磨“火山方舟”,推动平台能力的进一步完善。

  此外,为促进模型提供方和模型使用方的互信,“火山方舟”上线了基于安全沙箱的大模型安全互信计算方案,利用计算隔离、存储隔离、网络隔离、流量审计等方式,实现了模型的机密性、完整性和可用性保证,适用于对训练和推理延时要求较低的客户。

  群雄逐鹿大模型

  自ChatGPT去年末在全球掀起巨大轰动以来,大模型无疑已成为全球最热闹的赛道之一。

  根据中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》指出,近年来在自然语言处理、机器视觉和多模态等领域,国内已经涌现出多个具有行业影响力的预训练大模型,10亿级参数规模以上大模型数量已达79个。

  由于行业内初创企业基本还处在起步阶段,而头部厂商大都在过往几年里或多或少对大模型研发有所涉猎,在算力、人才、资金等层面都取得了一定的先发优势。这意味着当前百舸争流的热闹局面,实质上还是几大头部厂商的对垒。

  从大模型的布局体系来看,科技大厂在算力层、平台层、模型层、应用层进行了四位一体的全面布局。百度、阿里、华为三家均从芯片到应用进行自主研发的全面布局,如百度的“昆仑芯+飞桨平台+文心大模型+行业应用”、阿里的“含光800芯片+M6-OFA底座+通义大模型+行业应用”、华为的“昇腾芯片+MindSpore框架+盘古大模型+行业应用”。垂直行业科技企业和科研院校,主要以研发大模型算法及细分领域应用为主,自有算力相对薄弱,很少涉及芯片领域自主研发。

  从大模型参数量看,科技大厂的参数量远大于科研院所。科技大厂的大模型参数量较大:阿里通义千问大模型参数在10万亿级以上、腾讯混元大模型和华为盘古大模型参数量均在万亿级以上、百度文心一言大模型参数量在2千亿级以上、京东言犀大模型的参数量为千亿级;垂直行业科技企业已经上线的参数量普遍在千亿级以上;而科研院校大模型的参数量在千亿级及以下。

  从大模型应用方向看,大部分企业前期以内部应用为主,后续主要向B端企业拓展服务,预计少数企业将在C端市场形成规模。目前,百度文心大模型、华为盘古大模型、中国科学院紫东太初大模型均在B端垂类市场积累了标杆应用案例,腾讯混元大模型、阿里通义大模型则更多聚焦公司自身业务。而在C端市场应用方面,百度文心一言、阿里通义千问、腾讯混元助手三类大模型最有可能向此方向拓展,但目前只有百度文心一言大模型正在进行友好客户测试,阿里通义千问大模型则计划在今年9月份进行公测,腾讯混元助手大模型则处于计划开发状态。

  从大模型业界评估看,国内大模型与GPT-4有较大差距,但科技大厂具备追赶实力。目前国内大模型处于百花齐放的状态,但业界普遍认为,第一梯队当属百度、阿里巴巴、腾讯、华为四家。综合实力方面,四家企业在大模型研发投入、技术能力和人才团队实力较强;商用推进方面,四家企业均依托现有业务领域更容易形成大模型应用规模效应。

  AI大模型竞争,国内厂商哪家强?

  伴随生成式AI等基于大模型发展的各类应用爆发,大模型带来的价值进一步升级到人类生产力工具的颠覆式革新,逐渐拉开了通用人工智能的发展序幕。近日,弗若斯特沙利文发布的《AI大模型市场研究报告(2023)》对中国市场提供大模型产品服务的厂商进行了分析和评估。

  报告指出,AI大模型的高速发展离不开底层技术支持和应用场景迭代。大模型作为AGI时代的曙光,相关厂商也将迎来广阔的发展空间。报告从发展现状、驱动因素等推演了AI大模型厂商竞争与发展的几大关键点。其中,在竞争格局渐趋明晰的过程中,相关厂商需跨越技术、人才、资金等壁垒,在产品技术能力、战略愿景能力、生态开放能力三大维度上展开角逐。通过遴选,报告选择了5家大模型厂商,分别为商汤、百度、阿里巴巴、华为、腾讯,评价模型包含15个一级指标、56个二级指标,对厂商大模型的各个能力进行评估。

  报告认为,中国大模型厂商的成功因素主要包括:全栈大模型训练与研发能力、业务场景落地经验、AI安全治理举措以及生态开放性四个方面,其中全栈大模型训练与研发能力还包括数据管理经验、AI基础设施建设与运营以及大模型系统和算法设计三个部分。这些成功因素分别体现着大模型厂商的产品技术能力、战略愿景能力、生态开放能力三个维度。

  报告指出,在通往AGI时代的旅程上,大模型和人类反馈的强化学习(RLHF)的结合,不仅重构了AI开发范式,未来软件80%的价值将由AI大模型提供,剩余20%会由提示工程和传统业务开发组成,开发者的生产力将得到极大释放;与此同时,AI的发展也将由之前单向发展的数据飞轮升级到不断迭代进化的智慧飞轮,更高效地解决海量的开放式任务。

责任编辑:张薇

分享: