债券的定价模型,债券的定价模型有
0
2024-08-10 10:06:22
原始来源:
图片来源:生成
制作大型模型的公司有很多,但能够明确提供工业实施的时间表还是第一次。
刚刚,在2023京东全球技术探索者大会暨京东云峰会上,京东推出燕西大模型开放计算平台,并展示了零售、健康、物流、营销、金融、客户等多个行业场景服务。取得阶段性实际成果。
首先,我们欣赏了大型模型驱动的数字人歌舞表演。
电商场景下,支持AIGC产品内容生成。
还有一个AI增长营销平台,只需几句话就可以建立一个营销计划和推广网站。
除了现场演示,三步实施路线图也备受关注——
今年下半年,我们对京东内部高复杂度场景进行反复打磨和锤炼,并在关键场景为标杆客户提供外部服务。主要目的是发现看似“不起眼”但在工业应用中非常关键的问题。
2024年上半年,针对严肃的业务场景,大模型能力将全面对外开放。
重要的一点是,这里的开放不仅仅是提供API,而是将其与行业应用打包在一起,让企业开箱即用。
京东不会将生菜端上桌。
京东之所以有信心制定这样的路线,是因为里面有相当多的有用信息。
通用大机型火爆半年后,整个行业都把目光集中在了下一阶段的——工业大机型上。
随着最早提出大规模产业模式的京东交出了一份答卷,“产业伙伴需要什么样的大规模模式?”的问题。也可以分阶段回答。
大机型时代已经到来,C端应用层出不穷。普罗大众对存在的“胡言乱语”等问题有直观的感受和切身的体会。
但对于B端公司来说,由于行业不同以及自身业务考虑,“用什么?怎么用?”仍然没有很好的答案。他们中的大多数人“仍然不知道如何使用它”。
当人们谈论大工业模型时,他们的第一反应是专注于某个行业,做小模型。
但何晓东告诉量子位,这可能是一个误会。在制作工业模型时,仍然需要通用的领域数据。通用领域数据对于行业应用也非常关键。它提供背景常识知识。否则,如果用户突然问一些与这个领域无关的问题,话题就会跳来跳去,原来领域的小模型就会混乱。
因此,企业所需的大产业模式也必须以通用能力为基础。
对于企业来说,大机型多用于降低成本、提高效率。例如,它可以自动处理数据和任务、分析大量数据以做出更准确的决策、扩展到新的业务领域等等。
为了实现这些用途,大型模型必须满足两个原则:可信和可用。
可信是指模型的预测结果可靠,可以为企业所信赖;可用是指模型能够在实际业务中发挥作用,为企业创造价值。这两点不仅是企业选择大型机型的依据;这也是实现大车型产业化的两个基本特征。
我们先看可信度。
市场上目前还没有完整的解决方案来专门解决大型模型的可信度问题。
自大模型亮相并投入使用以来的几个月里一直存在的幻觉问题。早在2020年,京东基于Transformer的K-PLUG模型实体属性提取准确率就达到了95%,已经达到商用水平。
究其原因,是京东走了自己的路,——知识注入。
这在当时的行业中尚属首例。
极大提升了以往AI生成文本任务中的文本多样性和章节连贯性,以及产品卖点文案生成中需要特别注意的卖点的唯一性和属性一致性,给产品“真正的好评” 。
最后,在实体属性提取准确率、生成式多轮对话ROUGE-L、多轮问答知识检索率等一系列NLP任务中,其性能明显优于其他基线模型。
他们之所以能够这么早就发现并解决“幻觉”问题,与他们持续不断的工业实践有关。
市场上通用的生成语言模型生成的内容的准确率约为83%或85%。一般toC用户用起来都觉得还好,十有八九有一个错误,但是用于商业用途就不能接受了。
同样的想法也融入到了现有的实践中。
从提供大模型的企业角度来看,这个问题就变成了如何让大模型能够创造普惠价值。任何技术实现普惠,都意味着尽可能降低技术门槛和使用成本。
算法的泛化,向量数据库SaaS,这是京东给出的一组组合。
前两者就不用说了,一方面,算法的泛化能力让模型能够处理多种任务,解决行业中复杂的长尾场景。
2022年,针对模型泛化能力不足的问题,京东提出了百亿级Vega模型。 2023年,Vega大模型将在通用语言理解基础模型方面进行升级,提出规模更大、性能更强、可迁移性更好的Vega v2模型。
向量数据库可以实时更新知识库,补充大型模型的长期记忆,降低训练成本。可以说是一举多得。
矢量数据库方面,京东于2019年在业界率先开发了Varch,目前服务超过100家大中型企业用户。数据显示,利用京东向量数据库进行大模型预训练,通过优化模型推理效率,相比传统方法可降低80%的推理成本。
目前大模型应用中的主流思路是调用API。何晓东在接受采访时表示,对于一些传统行业客户来说,这还是有一定的技术门槛。
客户唯一关心的是服务效率,只要能用上产品就行。
于是团队决定直接将技术解耦,形成“延禧AI开发计算平台”,并在内部实践中打磨产品模块。客户甚至不需要掌握深入的AI知识,可以跳过中间步骤,直接引入成熟的大模型能力。
过去需要10多名科学家的团队才能工作,现在只需要1-2名算法人员,通过平台即可完成从数据准备、模型训练到模型部署的整个过程。训练效率提升2倍,推理效率提升6.2倍,成本节省近90%。
从可信度和可用性两个角度来看,京东提供的解决方案在整个行业中开创了先例。
这种基于工业实践发现问题、解决问题的方法不仅体现在大语言模型上,也体现在京东工业人工智能发展的各个阶段。
在深度学习之前的时代,很少有人期望人工智能能够像今天这样成为一种独立的功能甚至产品。当时的目标主要集中在降低成本、提升效率、优化体验。
2012年,京东开始应用智能客服中心,重点利用科技辅助客服,提高人力效率,优化客户体验。回顾过去,探索了三个具体的任务方向:
ASR语音识别技术、NLP语义分析技术、数据挖掘技术。
如今,这三类技术对大型模型的训练产生了深远的影响。
进入深度学习时代,人工智能开始在更全面、更复杂的场景中发挥作用。
2015年,京东智能客服正式应用深度神经网络技术。 2018年,无人客服首次升级,实现人机一体化。在同样“深入”的实践过程中,延禧团队逐渐认识到了这样一个问题:
客服对话是一种面向任务的对话,最终目的是解决真实场景中的问题,这与普通聊天有本质的区别。而且,用户在不同场景下对对话的需求也不同。售前和售后有很大区别。
因此,早在AlphaGo掀起上一轮人工智能热潮时,何晓东就提出“对话的本质是推理和决策”。后来他经常在各种场合用“围棋也叫手语”来阐述这一观点。
在这一思想指导下,何晓东带领团队融合声学、语义、时间等多模态特征,开发了一系列针对人机交互场景的“轮流走”技术路线。
近日,谷歌整合旗下Google Brain和DeepMind团队,提出利用AlphaGo技术和Transformer开发下一代大型模型“Gemini”,这也标志着这条路线的价值终于被更多人认可。
随后就是变形金刚大模型时代,京东的布局也很早。
在AI工程方面,京东每天服务数亿活跃用户。以智能客服领域为例,每年会产生数百亿的动态交互数据。一是数据规模大,每天提供智能客服1000万次,每月语音通话200万小时。今年京东618期间,累计服务人次突破7亿。在各种高负载测试下,京东已经形成了最佳实践。
再加上京东其他区域的人机交互,数据规模达到数百亿。
2022年,京东将利用延禧2.0——人工智能应用平台,将内部验证的技术解耦,开始对外输出。
如今的延禧AI开发计算平台也延续了这一思路。
何晓东介绍,从今年开始,燕西大模型凭借强大的工程能力,正在深入京东场景落地。在京东健康、金融、物流等多个优势行业率先磨练可复制场景能力,打磨出成熟可靠的解决方案。技术能力。
以健康领域为例,依托延禧大模型的多轮交互、工具调用、汇总汇总、图文多模态等能力,打造了健康助手、辅助诊疗应用。
目前,健康助手和辅助诊疗已累计超过3000万次优质临床对话,构建百万级医学知识图谱,覆盖千余种疾病的专业服务,20项评价标准保障医疗安全。
在物流领域,京东物流超级大脑在延禧大模型的支持下,实现实时交互、根因分析和智能决策,并不断更新迭代,具备自动生成的能力实时全球最优供应链解决方案。
在营销领域,京东科技市场与平台运营团队打造了AI增长营销增长平台,利用大模型解决关键任务、动态适应性、用户体验等问题,大幅优化营销运营流程,实现增长在节目制作效率上。一百倍的提升;原来涉及产品/研发/算法/设计/分析师等5种以上职能的流程,被压缩到只有一个人;同时,一个入口的全新交互模式,将人机交互次数从2000次减少到至少50次,运行效率提升40倍以上。
接下来是正在加速发展的通用人工智能时代。何晓东认为,一定是在往多模态的方向发展。
当人工智能的通用能力达到一定水平时,它不仅可以在幕后提供技术支持,还可以形成直接面向人类用户的产品,甚至像未来的智能体一样与人类进行更深层次的交互。
对此,京东云基于延禧大模型集成了多项多模态数字人交互能力,在数字人客服、直播等场景的实践中也找到了一些经验。
例如,已经实现了语义驱动的身体运动编辑。通过与大型模型相结合,可以匹配数字人说话的动作和语义,使交互更加自然。
又比如数字人动态局部高清技术,它利用了人类视觉感知不均匀的特点,对人脸尤其是眼睛周围特别敏感。提高关键区域的分辨率,并适当降低其他区域的分辨率,从而降低部署成本。
京东方面表示,延禧将进一步降低运营门槛和运营难度,让更多中小企业和个人用得起、用上数字人类服务。
……
由此看来,延禧大模型实施路线图强调“半年打磨期”的原因就不难看出:
我们不能只是提供API来告诉外界有这样的AI能力。最终目标是为合作伙伴提供可直接使用、具有端到端价值的产品模块。
几个月前,企业还在抢着发布大模型,而现在世界人工智能大会已经摇身一变成为“大模型之家”,各家企业都提供了自己的行业实施解决方案。
虽然看起来很眼花缭乱,但如果深入了解就会发现,这些解决方案不可避免地存在业务场景衔接、实施进度仍处于起步阶段等问题。
这与大模型技术产业化的难度有关,尤其是最后一公里问题,往往是可用与不可用的界限。这涉及到整个系统工程问题,是传统人工智能三大要素无法解决的。
作为第一家提出大规模行业聚焦模式的公司,京东已经感知到了这一变化,并更新为新的“三要素”内涵:
场景。过去,静态数据无法适应动态交互。只有行业应用中的实时场景数据才能实现。产品和单点算法不足以支持新的大型模型。只有最终的产品形态才具有核心竞争力,才能带动系统算法的创新和突破。在算力方面,单个AI芯片的进步慢于大型模型算力需求的爆发,算力集群成为更好的解决方案。至此,京东大机型时代的路线已经清晰:
行业原生。起源于工业和服务业。
所以在本次峰会上,京东解耦了底层能力,向行业合作伙伴发布了从基础层、模型层、MaaS、SaaS的一揽子技术产品和解决方案。
事实上,已经给出了明确的“三步走”策略:
第一步,内部基于核心行业数据构建大基数模型;第二步是将其应用到京东内部的零售、金融、健康、物流等核心业务中;第三步,瞄准京东金融、政务、健康等区外重点行业。该场景全面开放大模型能力,向行业输出可控、可信、实惠的定制模型。这样的落地路径,也是京东再次向行业重申自己的技术追求的地方:
成本、效率、体验、可信、包容、突破。
早在2017年,京东就提出了“科技、科技、科技”的口号。这三种技术代表三个层次:
第一个层次是服务于自己业务的需要;第二个层次是服务行业的技术;第三个层次是探索未来技术。
这三者成对耦合,形成技术和产业的闭环。 ——立足行业前沿创新突破,再对内打磨沉淀,实现“可信”,最终服务行业创造普惠价值。
正是出于产业化思维,京东自今年2月公布业界首个大规模产业模式以来,一直没有透露任何进一步的进展。现在才凭借自身的技术积累首次亮相。
毕竟,从目前的发展情况来看,大模型的实施难度不在于技术的追赶,而在于产业的突破。