CN EN
Trend insights
趋势洞察
AI浪潮下的企业数字化建设
2023.08.01

微信图片_20230913104940_1.jpg

一、AI的前世今生


1956年,约翰·麦卡锡、马文·明斯基、纳撒尼尔·罗切斯特和克劳德·香农在达特茅斯学院共同举办了首次AI会议。在这次会议上,他们首次提出了“人工智能”这个概念,并将其定义为“制造出能够模拟人类智能的程序”。随后AI进入了长达60多年的不断摸索、缓慢发展阶段。主要有三个流派或范式的观点占据主导地位:符号主义、连接主义和贝叶斯主义。每一个流派都代表了一种不同的方法来理解和创建智能系统。


符号主义:也被称为规则主义或逻辑主义,是AI发展早期的主导范式。符号主义者认为,智能行为可以通过明确的规则和逻辑来实现。他们使用逻辑符号和规则来表示知识,并通过逻辑推理来解决问题。这个观点的典型代表是专家系统,它们使用一组预定义的规则来模拟专家的知识和判断。


连接主义:倾向于使用神经网络来模拟人脑的工作方式。他们认为,智能行为是通过大量的简单计算单元(类似于神经元)的相互连接和交互来实现的。这种观点的代表是各种类型的神经网络,包括深度学习模型,它们能够通过学习大量数据来自动提取有用的特征和知识。


贝叶斯主义:使用概率和统计方法来处理不确定性和学习知识。他们认为,智能行为涉及到对不确定信息的处理和决策,而这可以通过贝叶斯统计和概率图模型来实现。这个观点的典型应用包括贝叶斯网络、隐马尔科夫模型等。


2016年,当AlphaGo战胜围棋世界冠军李世石的那一刻,连接主义流派实现了一次历史性的突破。2023年,以ChatGPT为代表的大语言模型横空出世,随后Claude、文心一言、讯飞星火等国内外大模型百花齐放,在全球掀起了新一轮AI科技浪潮。


今年3月以来,AI成了每天必不可少的新闻热点。AI新产品也在以天为单位推陈出新。随之产生了很多新词汇:


大语言模型:大语言模型(Large Language Model),简称大模型,是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径。


提示词:提示词(prompt)是在人工智能领域,特别是在自然语言处理和对话系统中,用于触发模型生成某种特定响应或行为的输入。一个好的提示可以帮助模型更准确地理解用户的意图,生成更相关和有用的响应。


通用大模型:通用大模型是泛行业的,它被训练在大量的、跨领域的数据上,目的是理解和生成各种各样的文本。这类模型的特点是非常通用,可以应用于许多不同的任务和领域。例如,GPT-4就是一个通用大模型,它可以用于从写作助手到自动编程,再到聊天机器人等各种任务。


行业大模型:行业大模型指的是专门针对某一行业或专业领域进行训练的大型人工智能模型。这些模型通过在特定领域的大量文本数据上进行训练,可以理解并生成与该领域相关的语言内容,具有高度的专业知识和理解能力。

通用大模型,就像是把大模型培养成一个高中生。它具备了自主学习能力和基本知识储备 数理化史地生都懂一些,但不深入。行业大模型,就像是把大模型继续培养成一个大学生,计算机专业、经济专业、法律专业……深耕于某一专业领域。


二、建设一个大模型总共分几步


需求定义和设计:在这个阶段,我们需要明确建模的目标、任务,以及模型应用的场景。同时,需要进行预研,确定模型的架构和技术路线。


数据收集和准备:在此阶段,我们需要收集用于训练、验证和测试模型的大量数据。数据可能来自多个来源,需要进行清洗和预处理,以符合模型训练的需求。


模型开发:这一阶段包括模型的预训练(Pretraining)和微调(Fine-tuning)。预训练是让模型学习基本的语言模式和知识,微调则是基于具体任务对模型进行调整,使其能够更好地执行特定的任务。


模型验证和评估:在此阶段,我们需要在验证集和测试集上评估模型的性能,检验模型是否满足预设的性能指标和需求。


模型优化:根据模型在验证集和测试集上的表现,可能需要对模型进行优化,这包括调整模型参数、改进模型架构,甚至改变模型训练的策略。


模型部署:模型训练和优化完成后,可以将模型部署到实际的使用环境中,如服务器或者嵌入式设备。模型部署后,用户可以开始使用模型进行预测。


模型监控和维护:部署后,我们需要定期监控模型的性能,根据实际情况对模型进行维护和更新。这可能包括重新训练模型、更新模型版本等。


反馈和迭代:收集用户的反馈,对模型进行迭代更新和优化。这是一个持续的过程,以不断提高模型的性能和用户体验。


三、大模型上线后,在平时的使用中它还会自我进化吗?


不会。大模型是静态模型,并不具备在使用中进化的能力。以ChatGPT为例,它被设计成一个“静态”模型。这意味着一旦训练完成并发布,模型就不会继续从用户输入中学习或更新。用户与模型的互动,并不会导致模型对新数据的学习或者对模型权重的更新。这种设计主要基于两个原因:


隐私和安全:如果模型在交互过程中持续学习,那么用户的输入数据就需要被存储和处理,这可能引发数据隐私和安全的问题。


可控性:一旦模型开始在线学习,其行为可能会变得难以预测。它可能学习到一些不希望的或者有害的行为,这会增加模型的风险。


换言之,一个大模型上线后,它的能力上限就在那里,是明确的固定的。如果你觉得它最近变聪明了变厉害了,如果不是幻觉,那就是研发团队对它做了重新训练或优化迭代。


微信图片_20230913104940.jpg


四、对点咨询的数字化建设规划


自产品研发中心成立以来,我司在大规模数字化建设的过程中,结合自身发展实情,规划了三个阶段性目标:


内循环:

内循环是数字化建设的第一阶段。它主要致力于基础设施建设,用系统处理业务取代用Excel、邮件处理业务,具体量化指标是两个所有:所有业务上系统;所有系统实现数据互联互通。


外循环:

数字化建设的第二阶段是产品生态建设,着力打造面向B端客户和C端用户的互联网产品、服务和平台。外循环的战略意义:一方面是实现新的增长曲线;另一方面也是增强公司的科技属性。


智能化:

在AI技术的加持下,以多年积累的行业数据做训练样本,结合产研的技术积累和人才储备,除了利用外部的通用大模型和行业大模型来降本增效。在适当的时机,建立自己的私有小模型,将双循环系统进一步智能化,提高AI为业务赋能的含金量。


五、当前AI面临的机遇和挑战


先说说机遇。今年3月ChatGPT的横空出世,确实是人工智能60多年发展历史上的一次革命性突破。最明显的改变是:它能真正听得懂人话了。它与人对话的能力,直接把小度、天猫精灵、小迪这类智能音响、智能车载系统秒成了渣渣。它在自然语义解析、图片、视频和文档处理等方面的能力,使得文案创作类工作率先被AI重塑甚至颠覆。再结合虚拟数字人技术,短视频和直播业务是下一个被AI席卷的行业。


作者认为,AI的广阔空间更多在于2B而非2C,在于行业大模型而非通用大模型。2C没有太深的行业壁垒,也不需要庞大的专业的行业数据,那么通用大模型的能力就是核心竞争力。所以,这一领域是神仙打架,最终活下来的只有少数巨头。这也符合2C市场赢者通吃的特性。尤其是OpenAI最近推出的Plugin Store,在大模型的基础上建立生态,直接触达C端,解决用户需求,形成闭环。国内厂商要加油了。2B的需求远不止写诗作画那么简单,而更看重处理和解决具体问题。比如:帮我找出过去30年北京地区的气象数据并分析出气象特点和变化趋势。通用大模型做不到,这正是行业大模型的机会。


医疗健康:用于疾病诊断、预测患者状况,开发新药、优化患者护理等方面,创造出新的医疗解决方案。


金融服务:用于风险评估、欺诈检测、投资策略制定等方面,提供更精确和个性化的金融服务。


零售业:用于销售预测、库存管理、个性化推荐、客户服务等方面,提升零售业的效率和客户体验。


制造业:AI可以用于预测设备故障、优化生产流程、自动化质量检测等方面,提升制造业的生产效率和质量。


物流和供应链:AI可以用于路线优化、货物跟踪、供应链预测等方面,提升物流和供应链的效率和透明度。


教育:AI可以用于个性化学习、智能辅导、考试阅卷等方面,改变传统的教学模式,提供更好的教育服务。


媒体和娱乐:AI可以用于内容推荐、智能剪辑、音乐和艺术创作等方面,创新媒体和娱乐的内容和形式。


结合国内的局面,阿里腾讯讯飞等头部玩家都有机会在自己擅长的电商、社交/游戏和教育领域做出行业大模型。作者认为,只有行业大模型还不足以覆盖各行各业方方面面,还需要一种补充:私有小模型。对于一些有行业数据积累,且有研发能力的企业,可以采用Llama2、ChatGLM-6B等开源大模型做基础,加以行业数据做训练,最终形成贴合自己业务场景的私有小模型。


再说挑战。即便今天,即使是最先进的GPT4,也仍然只能被归类为学术界所定义的弱人工智能。即便今天,通过这一波AI赚到钱的,主要有两类人:一类是卖课的,教人怎么用ChatGPT;另一类是卖会员的,做个山寨版ChatGPT,起个名字叫ChatAI、AIRobot等,底层调用OpenAI的API,上层封装成国内的网页、公众号、小程序或APP等,使得国内用户可直接访问(降低使用门槛),然后收会员费。即便今天,虽然AI惊艳了世人,但它还只是起到辅助性作用,人们为此买单的意愿并不强,或者说还有待发掘。打个比方,如果说人类文明是一桌菜,就目前来说,AI顶多是桌上一碟提鲜的蘸料,连凉菜都算不上,更别说主菜了。这样的局面持续的越久,对AI的发展走势越不利。想让AI时刻真正复刻iPhone时刻,除了写诗作画,AI需要更多的落地业务场景,需要更多的解决具体问题。


AI是历史赋予互联网行业的使命,是时代给予互联网企业的馈赠。这一轮AI浪潮来势汹涌全球瞩目,最头部的玩家当属中美,而中美背后则是两国互联网巨头们的科技竞赛。尤其中国,近年来,元宇宙、区块链、无人超市等概念在红极一时之后迅速扑街,互联网企业的影响力日渐式微。这一仗,既是代表国家争夺全球科技制高点,也是为自己正名的立身之战。

AI浪潮下的企业数字化建设
2023.08.01

微信图片_20230913104940_1.jpg

一、AI的前世今生


1956年,约翰·麦卡锡、马文·明斯基、纳撒尼尔·罗切斯特和克劳德·香农在达特茅斯学院共同举办了首次AI会议。在这次会议上,他们首次提出了“人工智能”这个概念,并将其定义为“制造出能够模拟人类智能的程序”。随后AI进入了长达60多年的不断摸索、缓慢发展阶段。主要有三个流派或范式的观点占据主导地位:符号主义、连接主义和贝叶斯主义。每一个流派都代表了一种不同的方法来理解和创建智能系统。


符号主义:也被称为规则主义或逻辑主义,是AI发展早期的主导范式。符号主义者认为,智能行为可以通过明确的规则和逻辑来实现。他们使用逻辑符号和规则来表示知识,并通过逻辑推理来解决问题。这个观点的典型代表是专家系统,它们使用一组预定义的规则来模拟专家的知识和判断。


连接主义:倾向于使用神经网络来模拟人脑的工作方式。他们认为,智能行为是通过大量的简单计算单元(类似于神经元)的相互连接和交互来实现的。这种观点的代表是各种类型的神经网络,包括深度学习模型,它们能够通过学习大量数据来自动提取有用的特征和知识。


贝叶斯主义:使用概率和统计方法来处理不确定性和学习知识。他们认为,智能行为涉及到对不确定信息的处理和决策,而这可以通过贝叶斯统计和概率图模型来实现。这个观点的典型应用包括贝叶斯网络、隐马尔科夫模型等。


2016年,当AlphaGo战胜围棋世界冠军李世石的那一刻,连接主义流派实现了一次历史性的突破。2023年,以ChatGPT为代表的大语言模型横空出世,随后Claude、文心一言、讯飞星火等国内外大模型百花齐放,在全球掀起了新一轮AI科技浪潮。


今年3月以来,AI成了每天必不可少的新闻热点。AI新产品也在以天为单位推陈出新。随之产生了很多新词汇:


大语言模型:大语言模型(Large Language Model),简称大模型,是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径。


提示词:提示词(prompt)是在人工智能领域,特别是在自然语言处理和对话系统中,用于触发模型生成某种特定响应或行为的输入。一个好的提示可以帮助模型更准确地理解用户的意图,生成更相关和有用的响应。


通用大模型:通用大模型是泛行业的,它被训练在大量的、跨领域的数据上,目的是理解和生成各种各样的文本。这类模型的特点是非常通用,可以应用于许多不同的任务和领域。例如,GPT-4就是一个通用大模型,它可以用于从写作助手到自动编程,再到聊天机器人等各种任务。


行业大模型:行业大模型指的是专门针对某一行业或专业领域进行训练的大型人工智能模型。这些模型通过在特定领域的大量文本数据上进行训练,可以理解并生成与该领域相关的语言内容,具有高度的专业知识和理解能力。

通用大模型,就像是把大模型培养成一个高中生。它具备了自主学习能力和基本知识储备 数理化史地生都懂一些,但不深入。行业大模型,就像是把大模型继续培养成一个大学生,计算机专业、经济专业、法律专业……深耕于某一专业领域。


二、建设一个大模型总共分几步


需求定义和设计:在这个阶段,我们需要明确建模的目标、任务,以及模型应用的场景。同时,需要进行预研,确定模型的架构和技术路线。


数据收集和准备:在此阶段,我们需要收集用于训练、验证和测试模型的大量数据。数据可能来自多个来源,需要进行清洗和预处理,以符合模型训练的需求。


模型开发:这一阶段包括模型的预训练(Pretraining)和微调(Fine-tuning)。预训练是让模型学习基本的语言模式和知识,微调则是基于具体任务对模型进行调整,使其能够更好地执行特定的任务。


模型验证和评估:在此阶段,我们需要在验证集和测试集上评估模型的性能,检验模型是否满足预设的性能指标和需求。


模型优化:根据模型在验证集和测试集上的表现,可能需要对模型进行优化,这包括调整模型参数、改进模型架构,甚至改变模型训练的策略。


模型部署:模型训练和优化完成后,可以将模型部署到实际的使用环境中,如服务器或者嵌入式设备。模型部署后,用户可以开始使用模型进行预测。


模型监控和维护:部署后,我们需要定期监控模型的性能,根据实际情况对模型进行维护和更新。这可能包括重新训练模型、更新模型版本等。


反馈和迭代:收集用户的反馈,对模型进行迭代更新和优化。这是一个持续的过程,以不断提高模型的性能和用户体验。


三、大模型上线后,在平时的使用中它还会自我进化吗?


不会。大模型是静态模型,并不具备在使用中进化的能力。以ChatGPT为例,它被设计成一个“静态”模型。这意味着一旦训练完成并发布,模型就不会继续从用户输入中学习或更新。用户与模型的互动,并不会导致模型对新数据的学习或者对模型权重的更新。这种设计主要基于两个原因:


隐私和安全:如果模型在交互过程中持续学习,那么用户的输入数据就需要被存储和处理,这可能引发数据隐私和安全的问题。


可控性:一旦模型开始在线学习,其行为可能会变得难以预测。它可能学习到一些不希望的或者有害的行为,这会增加模型的风险。


换言之,一个大模型上线后,它的能力上限就在那里,是明确的固定的。如果你觉得它最近变聪明了变厉害了,如果不是幻觉,那就是研发团队对它做了重新训练或优化迭代。


微信图片_20230913104940.jpg


四、对点咨询的数字化建设规划


自产品研发中心成立以来,我司在大规模数字化建设的过程中,结合自身发展实情,规划了三个阶段性目标:


内循环:

内循环是数字化建设的第一阶段。它主要致力于基础设施建设,用系统处理业务取代用Excel、邮件处理业务,具体量化指标是两个所有:所有业务上系统;所有系统实现数据互联互通。


外循环:

数字化建设的第二阶段是产品生态建设,着力打造面向B端客户和C端用户的互联网产品、服务和平台。外循环的战略意义:一方面是实现新的增长曲线;另一方面也是增强公司的科技属性。


智能化:

在AI技术的加持下,以多年积累的行业数据做训练样本,结合产研的技术积累和人才储备,除了利用外部的通用大模型和行业大模型来降本增效。在适当的时机,建立自己的私有小模型,将双循环系统进一步智能化,提高AI为业务赋能的含金量。


五、当前AI面临的机遇和挑战


先说说机遇。今年3月ChatGPT的横空出世,确实是人工智能60多年发展历史上的一次革命性突破。最明显的改变是:它能真正听得懂人话了。它与人对话的能力,直接把小度、天猫精灵、小迪这类智能音响、智能车载系统秒成了渣渣。它在自然语义解析、图片、视频和文档处理等方面的能力,使得文案创作类工作率先被AI重塑甚至颠覆。再结合虚拟数字人技术,短视频和直播业务是下一个被AI席卷的行业。


作者认为,AI的广阔空间更多在于2B而非2C,在于行业大模型而非通用大模型。2C没有太深的行业壁垒,也不需要庞大的专业的行业数据,那么通用大模型的能力就是核心竞争力。所以,这一领域是神仙打架,最终活下来的只有少数巨头。这也符合2C市场赢者通吃的特性。尤其是OpenAI最近推出的Plugin Store,在大模型的基础上建立生态,直接触达C端,解决用户需求,形成闭环。国内厂商要加油了。2B的需求远不止写诗作画那么简单,而更看重处理和解决具体问题。比如:帮我找出过去30年北京地区的气象数据并分析出气象特点和变化趋势。通用大模型做不到,这正是行业大模型的机会。


医疗健康:用于疾病诊断、预测患者状况,开发新药、优化患者护理等方面,创造出新的医疗解决方案。


金融服务:用于风险评估、欺诈检测、投资策略制定等方面,提供更精确和个性化的金融服务。


零售业:用于销售预测、库存管理、个性化推荐、客户服务等方面,提升零售业的效率和客户体验。


制造业:AI可以用于预测设备故障、优化生产流程、自动化质量检测等方面,提升制造业的生产效率和质量。


物流和供应链:AI可以用于路线优化、货物跟踪、供应链预测等方面,提升物流和供应链的效率和透明度。


教育:AI可以用于个性化学习、智能辅导、考试阅卷等方面,改变传统的教学模式,提供更好的教育服务。


媒体和娱乐:AI可以用于内容推荐、智能剪辑、音乐和艺术创作等方面,创新媒体和娱乐的内容和形式。


结合国内的局面,阿里腾讯讯飞等头部玩家都有机会在自己擅长的电商、社交/游戏和教育领域做出行业大模型。作者认为,只有行业大模型还不足以覆盖各行各业方方面面,还需要一种补充:私有小模型。对于一些有行业数据积累,且有研发能力的企业,可以采用Llama2、ChatGLM-6B等开源大模型做基础,加以行业数据做训练,最终形成贴合自己业务场景的私有小模型。


再说挑战。即便今天,即使是最先进的GPT4,也仍然只能被归类为学术界所定义的弱人工智能。即便今天,通过这一波AI赚到钱的,主要有两类人:一类是卖课的,教人怎么用ChatGPT;另一类是卖会员的,做个山寨版ChatGPT,起个名字叫ChatAI、AIRobot等,底层调用OpenAI的API,上层封装成国内的网页、公众号、小程序或APP等,使得国内用户可直接访问(降低使用门槛),然后收会员费。即便今天,虽然AI惊艳了世人,但它还只是起到辅助性作用,人们为此买单的意愿并不强,或者说还有待发掘。打个比方,如果说人类文明是一桌菜,就目前来说,AI顶多是桌上一碟提鲜的蘸料,连凉菜都算不上,更别说主菜了。这样的局面持续的越久,对AI的发展走势越不利。想让AI时刻真正复刻iPhone时刻,除了写诗作画,AI需要更多的落地业务场景,需要更多的解决具体问题。


AI是历史赋予互联网行业的使命,是时代给予互联网企业的馈赠。这一轮AI浪潮来势汹涌全球瞩目,最头部的玩家当属中美,而中美背后则是两国互联网巨头们的科技竞赛。尤其中国,近年来,元宇宙、区块链、无人超市等概念在红极一时之后迅速扑街,互联网企业的影响力日渐式微。这一仗,既是代表国家争夺全球科技制高点,也是为自己正名的立身之战。

下载报告
需填写需求问卷后才可下载
点击链接地址