京东发布千亿级大模型“言犀”,号称“最懂产业的大模型”

财华社 2023-07-16 08:01

全球大模型竞赛依旧在持续,京东也推出自己的千亿级大模型“言犀”。

7月13日,在2023京东全球科技探索者大会暨京东云峰会上,京东推出言犀大模型,率先布局产业应用。同时,京东还发布言犀AI开发计算平台,该平台已经启动预约注册,预计8月正式上线。

与一般大模型相比,京东言犀具备天然的“产业基因”。京东集团技术委员会主席曹鹏表示,京东灵犀大模型源于产业、服务产业,具有更高的产业属性。

从场景中来,回到场景中去

大模型背后竞争的本质,或是数据要素的竞争。

智能大模型训练是指使用大规模数据和高级计算资源对深度学习等人工智能训练的过程。

在人工智能领域,大模型通常指的是参数数量庞大、层数深的神经网络模型,如ChatGPT等。这些模型具有强大的学习能力和表达能力,但同时也需要大量的数据和计算资源来进行训练。

由此,大模型训练所需要的数据的重要性越来越突出,数据规模与质量都会影响模型最终呈现效果。

从过往大模型发展看,很多Transformer的通用大语言模型都依赖于来自维基百科、CommonCrawl、书籍、期刊等大型公共数据集,以及大量从互联网上抓取到的内容。

与之相比,京东言犀大模型孵化于产业场景丰富的京东,具备天然的“产业基因”。

作为一家新型实体企业,京东具备丰富的产业场景,包括零售、物流、科技、健康、工业、产发等领域,积累下每年数百亿条优质交互数据。

深厚的产业数据积累,以及千行百业Know-How,成为京东布局大模型的核心优势。京东用于训练言犀大模型的数据库,便是由70%通用数据和30%供应链原生数据组成,由此,训练出的大模型天然具备“产业基因”,具有“更高产业属性、更强泛化能力、更多安全保障”的优势。

此外,在训练过程中,京东言犀还采用数万小时含有不同噪音、方言的真实场景数据进行迭代,包括把正常语境下的句子变成一种含有噪声或方言的数据再输入到模型里,从而进一步提升模型的抗干扰能力。

源于产业、用于产业,京东言犀未来将服务于产业,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。

此前言犀已经与大同12345政务热线合作,呼入电话接起率达到100%。同时,言犀也自动完成了工单创建、智能匹配至对应委办局、跟踪工单执行情况、自动对市民回访等全闭环流程。

在养老行业,言犀还联合天津市河西区的智慧养老服务平台,每天早上9点自动给近5000名独居老人拨打问候电话,避免其突发疾病或无人照顾等情况。

京东集团CEO许冉表示,“大模型真正实现自己的价值,一定是在产业应用中。”“京东的大模型技术演进,遵循了京东的技术追求:成本、效率、体验、可信、普惠、突破。成本、效率和体验是从京东的经营理念传承而来,也是零售的第一性原理。可信、普惠和突破则是技术服务于产业和社会的承诺。”

京东集团技术委员会主席、京东云事业部总裁曹鹏表示,“数智供应链训练了产业大模型,而大模型则依托供应链深入产业”。

依托京东言犀大模型,以及京东在产业和供应链侧的优势,京东还发布了两大服务平台,包括全新升级的优加DaaS和言犀智能服务平台,以及面向零售、金融、城市、健康、物流五大领域的行业解决方案。

京东积极锤炼大模型

京东从很早就开始布局大模型。

京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬公开表示,京东大模型并不是马上就产生的,而是多年的铺垫。2020年时京东就关注到了深度学习模型和语言生成,当时也开启了语言模型研发。

2021年,京东推出十亿级模型K-PLUG,2022年推出百亿级模型Vega,本次大会则展示了千亿级模型。

一开始,京东就发挥供应链和丰富的产业场景优势,来训练更加适合行业使用要求,更容易实现场景落地的大模型产品。

其早先研究的K-PLUG模型已经在京东的发现好货等场景广泛应用。其对于给定商品的sku,可以自动生成长度不等的商品文案,目前已经覆盖2000多个京东的品类。在商品文案的生成上,K-PLUG明显比ChatGPT的更加符合商家需求。

2022年针对模型泛化性不足,京东提出了百亿级模型Vega,服务京东物流一站式数智化供应链数据管理平台,助力企业降本增效。

百亿级模型之后,今年京东再推出千亿级大模型。本次千亿级大模型言犀推出,让京东形成了一套大模型的完整工具链:言犀AI开发计算平台、向量数据库,以及全新升级的基础设施云舰、云海和京刚。

国内大模型千帆竞发

ChatGPT系列大模型再次引发人工智能在全球的火爆,国内互联网大厂也纷纷秀肌肉。2023年以来,国内大模型产品批量涌现。

今年3月,百度发布国内首个知识增强大语言模型“文心一言”,只需简单提出需求,文心一言就能自动生成内容,并能设计排版、AI绘画等。

日前,百度文心大模型正式从3.0升级到3.5,在问答、推理、代码、文生图等能力都向前迈了一步,实现安全性显著提升,训练和推理速度也大幅提升。

另一家人工智能龙头科大讯飞(002230.SZ)在今年5月正式发布“1+N认知智能大模型”星火,并火速在AI学习机的中英文作文辅导、中英文口语学习,以及讯飞听见一段录音一键成稿、讯飞办公本自动文本摘要等场景落地。

6月,讯飞星火还迎来V1.5版本更新,在开放式知识问答、多轮对话等多方面都有全新升级。

此外,国内大模型领域还涌现出通义千问、商量、序列猴子……据世界人工智能大会官方微信披露数据,2023年的大会上聚齐了三十多个大模型及相关产品。

在行业发展如火如荼之际,相关监管政策也落地。

7月13日,《生成式人工智能服务管理暂行办法》自2023年8月15日起施行,以促进生成式人工智能健康发展和规范应用。

东方证券认为,认为,《暂行办法》的实施初步建立起了我国对于生成式人工智能领域的监管体系,并且未来将会进一步完善。随着监管体系的逐步建立,我国的AI领域从基础模型到上层应用的商业化进程将有望快速推进,AI生态有望快速建立。

李莹

上一篇 & 下一篇