Takejian Intelligence总裁兼首席运营官孙斌
日期:2023-06-25 08:56:18 / 人气:154
大语言模型如何在企业落地》和《创意的“寒武纪大爆发”》。无论是前沿科技产业,还是整个经济社会结构,都会有很大的变化。为了让创业者更好的拥抱这个时代,创业黑马将以中国AIGC第一服务平台为己任。通过走访众多业内知名企业家、投资人、专家学者、创业从业者,从软硬件平台、投资人、行业应用等角度做系列报告,畅谈大模式时代新机遇,展现产业新实力。本文为第八篇。
本期的分享嘉宾是Takejian Intelligence总裁兼首席运营官孙斌。朱坚智能由前微软(亚洲)互联网工程院副院长简仁贤于2015年创立。是认知AI时代国内领先的以NLP为核心技术的人工智能企业。通过对话、知识、培训、生成四大产品平台,实现了跨行业、跨场景的规模落地,已服务超过500家大中型企业。当以ChatGPT为代表的LLM(大语言模型)技术在全球掀起浪潮时,竹内升级了所有产品线,推出了运用各种LLM技术的成熟的AIGC企业级产品,帮助白领知识生产者提高生产力,帮助企业完成数字化智能化转型。
在6月8日的黑马AIGC主题系列直播第二季中,孙斌分享了“To B领域大语言模型的落地与探索”主题,展示了竹内智能在生成式AI技术落地方面的业务洞察、布局和重要成果。
以下为本次直播实录:
今天我想分享一下我过去作为NLP(自然语言处理)专业团队亲身经历的大语言模型的发展,以及我们看到的未来。
我相信最近很多人在网上了解到了聊天GPT这个大语言模型,也分析了很多关于大语言模型和生成式AI的特点、优势或不足。但其实大语言模型,包括我们从事的NLP(自然语言处理)行业,已经发展了很久。竹内智能团队专注NLP已经8年了,这8年也是NLP真正实现产业化的时期。期间一直在NLP赛道,研究如何将NLP服务商业化,如何进行营销,如何为企业提供服务,如何在C端实现增长,也积累了一些经验和客户。
01
行业变革和四大挑战
在人工智能领域,图像、语音、语义处理都是重要的赛道,NLP是关于自然语义理解的部分。
其实在人工智能的语义理解方面,可以分为两部分:一是人机问答,大家都很熟悉的,叫做短文本,用于交互;另一种是长文本,它允许机器阅读、理解、提取和摘录现有的非结构化文档和文章。这两个区域是NLP的强势区域,也是工业化落地的区域。今天我们熟悉的大语言模型,在对话中向你展示了很高的理解和对话能力,但更让你惊艳的是生成的文章,编写的代码,翻译的语言。
在这两个领域(短文本和长文本),NLP团队过去取得了大量的成果,但在他们的发展过程中,主要面临四大挑战,而现在大语言模型的出现极大地改变了局面。
首先是深度语义理解和推理。在大语言模型爆发之前,所有的语言模型都是相对轻量级的。对于一些特定的场景,当时的第一个挑战就是如何准确理解客户的意思。每个人都在不断使用新的模型优化算法来理解客户的意图,他们的背景和他们的情绪,但现在大语言模型大大提高了这种能力。
二是基于知识图谱的智能问答。这也是现在人们批评大模型最多的地方,因为对大模型的认识不是很准确。以前的最佳实践方案是,我们用NLP模型理解客户的对话意图,然后利用客户给出的知识和答案实现精准匹配,可以帮助对话机器人给出正确的回复。
第三个挑战是如何通过语义训练实现问答的精准匹配。比如金融行业,关于信用卡的服务内容,其实是有标准答案的,但是客户问的问题千差万别。我们如何用语言模型理解客户的意图是一个难题。在To B服务领域,回答的准确率非常高,否则会误导或者对客户造成损害,这种挑战会延续到大语言模型时代。
第四个挑战是任务的过程。众所周知,任何一个大的语言模型都有很强的聊天能力,但是你很难让它完成一项工作,比如办理信用卡,补办飞机票,或者查询一个工单信息。这种多轮流对话很容易被大型语言模型模仿,但是需要另一层技术控制才能准确提供这些数据。
NLP行业过去的这四大挑战依然存在,但在很大程度上,使用大语言模型可以更轻松地解决,这就是技术变革给行业带来的好处。在这方面,我们应用大模型做了一些案例,得到了客户的认可。比如某证券客户的客服中心,原来使用的是传统的客服机器人,使用中暴露出很多问题,比如业务知识和闲聊混合管理不易维护,大量知识资料内容与分组不符,回答准确率太低等等。40%~50%的通话最终会转人工服务。但是在技术的帮助下,机器人的服务比例可以提高30个百分点,可以大大节省人力,提高效率。
所以在今天AI的应用过程中,尤其是To B行业,其实一个模型并不能像大家想象的那样解决所有问题。它实际上是一个平台逻辑,如下图所示:
底层是基础技术,上面是AI模块。需要通过一些API方法进行二次开发,最终接入客户的业务场景。最近大家都在关注大语文模型的写作能力和对话能力。但从服务企业的从业者来看,虽然底层模型能力已经有了很大的突破,但为了更好的实现应用,还有很多能力需要提升。
在今天大语言模型行业爆发之际,我们甚至呼吁所有有赛道经验的专业团队,掌握大模型,让它在多个场景落地,实现产业发展。不仅大模式本身要高速发展,大模式带来的创新业务也要实现快速发展。
02
工业的未来
接下来我来分享一下从从业者角度的分析。大语言模式会给行业带来哪些变化?
首先,想想聊天GPT现象的本质是什么,它给大家带来了什么体验?我相信所有跟它聊过的人都不只是为了好玩,大家都会觉得“我在跟一个代理人说话。”这是什么意思?这意味着人类可以用语言模型进行交流。它能理解你,回答你,帮助你执行。大语言模型最棒的地方在于,它以“暴力”的方式带来足够的知识,然后它可以理解人的情绪,与人对话,这将解决前人与机器交互的瓶颈问题。
从这个角度来说,我的第一个判断是大模型会改变我们现在的软件范式。相信做的同事对此都有切身体会。当PC出现的时候,当互联网到来的时候,当手机应用开始爆发的时候,软件范式已经发生了变化,从工业软件到PC软件,再到网站和手机app,再到现在的大模型热潮,软件范式又要被改写了。
那么,大语言模型来了之后,软件应用会是什么范式?我们可以通过对话调动各种应用。如果我们以前是面向应用的,我们可以清楚的想象,未来人与手机或者智能硬件交流,然后它会完成相应的软件操作。所有应用之间的屏蔽将被打破,应用能力将被调用,大语言模型将直接调动应用能力,形成新的交互方式,这将是新的操作系统,新的“iPhone时刻”。
未来2~3年,大量C端应用会因为对话方式的改变而改变。很有可能不再使用触摸输入,而是语音输入。很多动作也会打破应用的边界。可能每部手机都会有一个AI助手,可以通过对话调度多个应用能力。下单、叫车、购买都可以通过语音完成。接下来,千千将会出现数以千计基于ChatGPT模式的应用。
以上是C端的变化,那么B端会发生什么呢?我的第二个判断是,在B端,企业/行业的私有领域知识将变得至关重要,从而产生大量的企业聊天GPT和行业聊天GPT。
目前大语言模型的特点是能高度理解人类语义,能做一些深层次的工作,比如写作、推理、分析等。,但其知识不可依赖。这是因为用于训练的互联网数据不可靠,今天的大语言模型其实是对话模型,而不是问答模型。它是为对话而创造的,所以会妥协,会认错。为了让对话进行下去,它会根据对话参与者的喜好改变内容,但它并不是一个拥有正确知识的模型。
但是对于企业客户,我们的行业总监、客服、营销人员、政策顾问一定不能给客户不准确的知识。所以在B端,一定会发展成这样一种范式:大语言模型会交流理解,私有领域知识——准确的私有领域知识——然后会驱动行业/企业的应用,行业/企业的应用也会因为这种改变而改变。
那么,如何构建企业的私有领域知识呢?我们可以回顾一下企业数字化的发展历程。最早的时候我们叫设备网络化数字化,是第一代生产数字化。第二步,利用ERP,包括制造系统,实现整个业务流程的IT,这是第二代资产数字化。
现在,我们有了大语言模型,有了行业/企业的私有领域知识,让企业的hr部门、行政部门、销售部门、客服部门的所有知识都可以通过对话或阅读的方式表达出来,真正让企业智能化。
人工智能发展到一定阶段后,可以利用知识,实现进化。我们将从数字时代进化到数字时代。
在接下来的时间里,我们会看到越来越多的企业利用人工智能技术,把部门、企业甚至行业的知识变成知识库,变成可以被AI构建和调用的知识,形成知识流,然后把这些知识变成数字人,为我们的企业服务,为我们的客户服务。
我们可以预测,在未来的一年里,企业服务的这些内容将呈现指数级增长,至少会增长10倍。从事To B行业的创业者一定要做好这方面的准备。
03
未来的四个新挑战
那么,未来大模式的发展会面临哪些新的挑战?
除了上面提到的四个挑战,作为一个技术从业者,我想和你们分享几个我们看到的新挑战:
第一个挑战是大模型阅读还是知识图谱预构建?过去我们做了很多知识图谱,但是今天的大语言模型可以读取文档和非结构化数据。那么,有必要建立知识图谱吗?换个角度说,你是希望今天预设答案方便问答,还是希望大语言模型自己去读内容,给你答案?
其实这两种实用的路径都可以完成大量的内容查询,但最终哪一种效果好,哪一种准确率高,相信不同的场景使用不同的模式。也许有人会问,两者结合是不是更好?答案值得期待。希望我们的专业团队能给出有工程能力的结果。
第二个新挑战是“提示?嵌入?微调?”这三个词都是现在很热的词。Prompt是提示,Embedding是指嵌入的接口,Fine-tuning是指模型微调,都是训练大模型要做的任务。但是目前没有多少团队能很好的调整模型,在微调的过程中可能会变差。所以我今天给你的建议是,不要执着于大语言模型的微调,最终还是要以可控的结果和高质量的目标为标准。利用大语言模型的能力和自身的工程能力,比如知识图谱和调用客户数据,然后利用数据的能力最终满足客户的需求才是王道。
第三个新挑战是做大语言模型还是专业模型。我的观点是,通用大语言模型有它的优势,专业模型也有它的场景。每个模型其实都有它的能力特点。我们认为通用语言模式适合在To C端进行对话和培训,专业模式适合在行业内获取专业知识和完成专业任务。
第四个新挑战:大模型应该在云中调用还是部署在私有域中?十年前大家都在讨论公有云好还是私有云好。事实上,我们看到今天两者并存。云计算与AIGC产业发展有相似之处,通用模型适用于各类中小企业,具有通用性和灵活性。专业模型安全性高,数据可控。它要为企业服务,数据要准确,要完成不同的任务。所以我们可以预测,未来会有几家领先的企业提供最好的大语言模型为大家服务,但同时也会有千千成千上万的行业私有云、企业私有云,千千成千上万的行业模型、企业模型。
未来公有大模式一定会越来越强,由头部几家企业牵头,行业私有模式一定会百花齐放,这也是我们很多To B企业的商机。
我们相信ChatGPT现象会给我们带来巨大的AIGC红利。写作、绘画、创作等职业会有很大的提升。大模型说到底就是工具,会用工具的人会淘汰不会用工具的人。
智能家居行业会有很大发展。以前每个家庭的环境太复杂,没有办法在家庭环境中预设各种对话。现在大语言模型应用后,对智能家居行业会有很大的推动作用。
还有个人助理的应用,我觉得会有很大发展。AI可以帮你订机票,点餐,改日期,预约,甚至买东西。我们预计今年下半年将会有大量的个人助理应用。
此外,还有元宇宙的“IP众包”模式、情感陪伴产品等。,这些都将迎来爆发。
竹内智能是一家成立于2015年的NLP专业公司。我们的核心能力是将短NLP和长NLP的处理能力与我们的专业模型和现有的大语言模型相结合,实现不同的应用场景,让不同的数字化员工为企业和个人提供服务。我们也希望与行业内所有玩家分享,享受AIGC带来的产业大爆发,共同做好AI在各行业的落地。
黑马AIGC工业营地
理解AIGC的基本逻辑,一步到位地了解行业的未来。
3个核心认知,6个前沿主题
(扫描下方二维码,立即加入)
↓↓↓"
本期的分享嘉宾是Takejian Intelligence总裁兼首席运营官孙斌。朱坚智能由前微软(亚洲)互联网工程院副院长简仁贤于2015年创立。是认知AI时代国内领先的以NLP为核心技术的人工智能企业。通过对话、知识、培训、生成四大产品平台,实现了跨行业、跨场景的规模落地,已服务超过500家大中型企业。当以ChatGPT为代表的LLM(大语言模型)技术在全球掀起浪潮时,竹内升级了所有产品线,推出了运用各种LLM技术的成熟的AIGC企业级产品,帮助白领知识生产者提高生产力,帮助企业完成数字化智能化转型。
在6月8日的黑马AIGC主题系列直播第二季中,孙斌分享了“To B领域大语言模型的落地与探索”主题,展示了竹内智能在生成式AI技术落地方面的业务洞察、布局和重要成果。
以下为本次直播实录:
今天我想分享一下我过去作为NLP(自然语言处理)专业团队亲身经历的大语言模型的发展,以及我们看到的未来。
我相信最近很多人在网上了解到了聊天GPT这个大语言模型,也分析了很多关于大语言模型和生成式AI的特点、优势或不足。但其实大语言模型,包括我们从事的NLP(自然语言处理)行业,已经发展了很久。竹内智能团队专注NLP已经8年了,这8年也是NLP真正实现产业化的时期。期间一直在NLP赛道,研究如何将NLP服务商业化,如何进行营销,如何为企业提供服务,如何在C端实现增长,也积累了一些经验和客户。
01
行业变革和四大挑战
在人工智能领域,图像、语音、语义处理都是重要的赛道,NLP是关于自然语义理解的部分。
其实在人工智能的语义理解方面,可以分为两部分:一是人机问答,大家都很熟悉的,叫做短文本,用于交互;另一种是长文本,它允许机器阅读、理解、提取和摘录现有的非结构化文档和文章。这两个区域是NLP的强势区域,也是工业化落地的区域。今天我们熟悉的大语言模型,在对话中向你展示了很高的理解和对话能力,但更让你惊艳的是生成的文章,编写的代码,翻译的语言。
在这两个领域(短文本和长文本),NLP团队过去取得了大量的成果,但在他们的发展过程中,主要面临四大挑战,而现在大语言模型的出现极大地改变了局面。
首先是深度语义理解和推理。在大语言模型爆发之前,所有的语言模型都是相对轻量级的。对于一些特定的场景,当时的第一个挑战就是如何准确理解客户的意思。每个人都在不断使用新的模型优化算法来理解客户的意图,他们的背景和他们的情绪,但现在大语言模型大大提高了这种能力。
二是基于知识图谱的智能问答。这也是现在人们批评大模型最多的地方,因为对大模型的认识不是很准确。以前的最佳实践方案是,我们用NLP模型理解客户的对话意图,然后利用客户给出的知识和答案实现精准匹配,可以帮助对话机器人给出正确的回复。
第三个挑战是如何通过语义训练实现问答的精准匹配。比如金融行业,关于信用卡的服务内容,其实是有标准答案的,但是客户问的问题千差万别。我们如何用语言模型理解客户的意图是一个难题。在To B服务领域,回答的准确率非常高,否则会误导或者对客户造成损害,这种挑战会延续到大语言模型时代。
第四个挑战是任务的过程。众所周知,任何一个大的语言模型都有很强的聊天能力,但是你很难让它完成一项工作,比如办理信用卡,补办飞机票,或者查询一个工单信息。这种多轮流对话很容易被大型语言模型模仿,但是需要另一层技术控制才能准确提供这些数据。
NLP行业过去的这四大挑战依然存在,但在很大程度上,使用大语言模型可以更轻松地解决,这就是技术变革给行业带来的好处。在这方面,我们应用大模型做了一些案例,得到了客户的认可。比如某证券客户的客服中心,原来使用的是传统的客服机器人,使用中暴露出很多问题,比如业务知识和闲聊混合管理不易维护,大量知识资料内容与分组不符,回答准确率太低等等。40%~50%的通话最终会转人工服务。但是在技术的帮助下,机器人的服务比例可以提高30个百分点,可以大大节省人力,提高效率。
所以在今天AI的应用过程中,尤其是To B行业,其实一个模型并不能像大家想象的那样解决所有问题。它实际上是一个平台逻辑,如下图所示:
底层是基础技术,上面是AI模块。需要通过一些API方法进行二次开发,最终接入客户的业务场景。最近大家都在关注大语文模型的写作能力和对话能力。但从服务企业的从业者来看,虽然底层模型能力已经有了很大的突破,但为了更好的实现应用,还有很多能力需要提升。
在今天大语言模型行业爆发之际,我们甚至呼吁所有有赛道经验的专业团队,掌握大模型,让它在多个场景落地,实现产业发展。不仅大模式本身要高速发展,大模式带来的创新业务也要实现快速发展。
02
工业的未来
接下来我来分享一下从从业者角度的分析。大语言模式会给行业带来哪些变化?
首先,想想聊天GPT现象的本质是什么,它给大家带来了什么体验?我相信所有跟它聊过的人都不只是为了好玩,大家都会觉得“我在跟一个代理人说话。”这是什么意思?这意味着人类可以用语言模型进行交流。它能理解你,回答你,帮助你执行。大语言模型最棒的地方在于,它以“暴力”的方式带来足够的知识,然后它可以理解人的情绪,与人对话,这将解决前人与机器交互的瓶颈问题。
从这个角度来说,我的第一个判断是大模型会改变我们现在的软件范式。相信做的同事对此都有切身体会。当PC出现的时候,当互联网到来的时候,当手机应用开始爆发的时候,软件范式已经发生了变化,从工业软件到PC软件,再到网站和手机app,再到现在的大模型热潮,软件范式又要被改写了。
那么,大语言模型来了之后,软件应用会是什么范式?我们可以通过对话调动各种应用。如果我们以前是面向应用的,我们可以清楚的想象,未来人与手机或者智能硬件交流,然后它会完成相应的软件操作。所有应用之间的屏蔽将被打破,应用能力将被调用,大语言模型将直接调动应用能力,形成新的交互方式,这将是新的操作系统,新的“iPhone时刻”。
未来2~3年,大量C端应用会因为对话方式的改变而改变。很有可能不再使用触摸输入,而是语音输入。很多动作也会打破应用的边界。可能每部手机都会有一个AI助手,可以通过对话调度多个应用能力。下单、叫车、购买都可以通过语音完成。接下来,千千将会出现数以千计基于ChatGPT模式的应用。
以上是C端的变化,那么B端会发生什么呢?我的第二个判断是,在B端,企业/行业的私有领域知识将变得至关重要,从而产生大量的企业聊天GPT和行业聊天GPT。
目前大语言模型的特点是能高度理解人类语义,能做一些深层次的工作,比如写作、推理、分析等。,但其知识不可依赖。这是因为用于训练的互联网数据不可靠,今天的大语言模型其实是对话模型,而不是问答模型。它是为对话而创造的,所以会妥协,会认错。为了让对话进行下去,它会根据对话参与者的喜好改变内容,但它并不是一个拥有正确知识的模型。
但是对于企业客户,我们的行业总监、客服、营销人员、政策顾问一定不能给客户不准确的知识。所以在B端,一定会发展成这样一种范式:大语言模型会交流理解,私有领域知识——准确的私有领域知识——然后会驱动行业/企业的应用,行业/企业的应用也会因为这种改变而改变。
那么,如何构建企业的私有领域知识呢?我们可以回顾一下企业数字化的发展历程。最早的时候我们叫设备网络化数字化,是第一代生产数字化。第二步,利用ERP,包括制造系统,实现整个业务流程的IT,这是第二代资产数字化。
现在,我们有了大语言模型,有了行业/企业的私有领域知识,让企业的hr部门、行政部门、销售部门、客服部门的所有知识都可以通过对话或阅读的方式表达出来,真正让企业智能化。
人工智能发展到一定阶段后,可以利用知识,实现进化。我们将从数字时代进化到数字时代。
在接下来的时间里,我们会看到越来越多的企业利用人工智能技术,把部门、企业甚至行业的知识变成知识库,变成可以被AI构建和调用的知识,形成知识流,然后把这些知识变成数字人,为我们的企业服务,为我们的客户服务。
我们可以预测,在未来的一年里,企业服务的这些内容将呈现指数级增长,至少会增长10倍。从事To B行业的创业者一定要做好这方面的准备。
03
未来的四个新挑战
那么,未来大模式的发展会面临哪些新的挑战?
除了上面提到的四个挑战,作为一个技术从业者,我想和你们分享几个我们看到的新挑战:
第一个挑战是大模型阅读还是知识图谱预构建?过去我们做了很多知识图谱,但是今天的大语言模型可以读取文档和非结构化数据。那么,有必要建立知识图谱吗?换个角度说,你是希望今天预设答案方便问答,还是希望大语言模型自己去读内容,给你答案?
其实这两种实用的路径都可以完成大量的内容查询,但最终哪一种效果好,哪一种准确率高,相信不同的场景使用不同的模式。也许有人会问,两者结合是不是更好?答案值得期待。希望我们的专业团队能给出有工程能力的结果。
第二个新挑战是“提示?嵌入?微调?”这三个词都是现在很热的词。Prompt是提示,Embedding是指嵌入的接口,Fine-tuning是指模型微调,都是训练大模型要做的任务。但是目前没有多少团队能很好的调整模型,在微调的过程中可能会变差。所以我今天给你的建议是,不要执着于大语言模型的微调,最终还是要以可控的结果和高质量的目标为标准。利用大语言模型的能力和自身的工程能力,比如知识图谱和调用客户数据,然后利用数据的能力最终满足客户的需求才是王道。
第三个新挑战是做大语言模型还是专业模型。我的观点是,通用大语言模型有它的优势,专业模型也有它的场景。每个模型其实都有它的能力特点。我们认为通用语言模式适合在To C端进行对话和培训,专业模式适合在行业内获取专业知识和完成专业任务。
第四个新挑战:大模型应该在云中调用还是部署在私有域中?十年前大家都在讨论公有云好还是私有云好。事实上,我们看到今天两者并存。云计算与AIGC产业发展有相似之处,通用模型适用于各类中小企业,具有通用性和灵活性。专业模型安全性高,数据可控。它要为企业服务,数据要准确,要完成不同的任务。所以我们可以预测,未来会有几家领先的企业提供最好的大语言模型为大家服务,但同时也会有千千成千上万的行业私有云、企业私有云,千千成千上万的行业模型、企业模型。
未来公有大模式一定会越来越强,由头部几家企业牵头,行业私有模式一定会百花齐放,这也是我们很多To B企业的商机。
我们相信ChatGPT现象会给我们带来巨大的AIGC红利。写作、绘画、创作等职业会有很大的提升。大模型说到底就是工具,会用工具的人会淘汰不会用工具的人。
智能家居行业会有很大发展。以前每个家庭的环境太复杂,没有办法在家庭环境中预设各种对话。现在大语言模型应用后,对智能家居行业会有很大的推动作用。
还有个人助理的应用,我觉得会有很大发展。AI可以帮你订机票,点餐,改日期,预约,甚至买东西。我们预计今年下半年将会有大量的个人助理应用。
此外,还有元宇宙的“IP众包”模式、情感陪伴产品等。,这些都将迎来爆发。
竹内智能是一家成立于2015年的NLP专业公司。我们的核心能力是将短NLP和长NLP的处理能力与我们的专业模型和现有的大语言模型相结合,实现不同的应用场景,让不同的数字化员工为企业和个人提供服务。我们也希望与行业内所有玩家分享,享受AIGC带来的产业大爆发,共同做好AI在各行业的落地。
黑马AIGC工业营地
理解AIGC的基本逻辑,一步到位地了解行业的未来。
3个核心认知,6个前沿主题
(扫描下方二维码,立即加入)
↓↓↓"
作者:奇亿娱乐
新闻资讯 News
- 梅婷一家四口罕同框!女儿颜值遗...11-12
- 徐帆的爱情故事:4年王志文,终嫁...11-12
- 同样搭档关晓彤演情侣,王安宇与...11-12
- 徐帆的爱情故事:4年王志文,终嫁...11-12