从2000~2001年,数字化转型的说法开始“火”了起来。
数字化一词,其实国内外早就在使用。远的不说,2015年5月,《中国制造2025》就提出了“数字化、网络化、智能化”的进阶式说法;2015年10月,德国工业4.0的主推手孔翰宁先生讲解工业4.0的题目是“德国的数字化旅程”,他认为工业4.0的核心就是企业“构建在新的数字化基础架构上的数据驱动的商业模式”;同期埃森哲公司给出的数字化转型模型,把一个数字化企业所需要做的各项工作进行了全方位描述,提出了数字化流程、数字化平台、数字化运营、数字化客户、数字化客户体验、数字化业务等说法;2017年,中国工程院发布的“中国智能制造发展战略研究报告”给出智能制造“三个基本范式”,第一代智能制造就是“数字化制造”;2020年发改委、网信办文件中给出的企业“上云 用数 赋智”中的“用数”直指数字化一词。时至今日,“数字化XX”已经几乎无处不在。
于是,最近一年关于比较“数字化vs信息化”的文章逐渐多了起来。这些文章大都是把数字化和信息化加以区分,各自给出一个定义和说法来进行比较。
今天,笔者根据自己对信息、信息化、数字化的理解,从一个不同的视角来谈谈自己的一点看法,希望引发大家的共同思考与讨论。
1.大千世界信息具有多种形态
在不同的学术著作上和不同的专家群体中,对信息有着不同的定义和理解。基本上,大家倾向于认为,信息是描述客观事物属性和它的运动状态的一种客观存在。自从自然界诞生以来,信息就一直是一种客观存在,自然界以自然信息的形式向外部世界显示其基本构成和各种属性特征。
人们用信息描述物质、能量的形和态,以及形态的变化等,例如源于物质、能量的信号、消息、事件,它们所包含的一些含义等。信息的基本特征是“恒生恒变”,因为世界是物质的,物质的世界是一直在不断运动发展的,所有的物质、能量、信息都在运动和变化。信息本身的变化也是信息[5]。
物质具有能量,能量与物质不可分,物质和能力都具有信息,在任意空间尺度上,大到星球、银河系,小到分子、原子甚至是基本粒子,它们都是物质、能量、信息的统一体[5]。
信息通过某种能量形式,例如机械能、声能、热能、化学能、电能、磁能、电磁能或者生物能形式等作用于物质,激发物质产生出放大物质运动的某种能量,由此而得到更加丰富、可控、容易传播的信息,来进行多载体、多编码、多用途的通讯——从古代的烽火狼烟到近代的电报,再从有线电话到无线手机等。信息又可以多种载体和形式被记录和复制,信息的表达、通信、记录和复制,始终在加速和推动人类的发展与进步[5]。
笔者在与其他八位作者合写《三体智能革命》一书指出[1],信息有三种形态,即自然信息、表述信息、数字化信息:
物理世界带给人类的自然信息,例如天体现象(太阳东出西落、月盈月亏、流星雨、脉冲星、引力波等)、各种自然界声音(如风、雨、雷、电、鸟鸣等)、各种地质活动迹象(火山爆发、泥石流、山体滑坡、地震等)、各种物理/化学/生物作用(蒸发、凝结、摩擦、腐蚀、风化、光合、遗传等),等等。自然信息不以人类的意志为转移,它由亘古不变的自然法则、科学现象来控制它的生成、传递、处理和演变规律。人类只能去接收和观察自然信息,发现和探索自然规律。
人类使用语言、图、文、符号等手段来描述自然信息的能力,构成了表述信息。第一次信息大爆发是智人在7万年以前学会了语言;第二次信息大爆发是人类有了文字和印刷术,各种书籍大量传播,纸介质知识呈现出一种社会化传播和复用的态势。
当人类把尽可能多的自然信息、表述信息都放进了电脑,变成了基于二进制比特来表达的“比特化信息”,或者叫做数字化信息,就形成了第三次信息大爆发。
顺便指出,在数字化信息之前,还有一个模拟电子信息阶段,例如摩尔电报、基于模电信号的有线电话、广播、无线对讲机、电视等,这些使用了无线电磁波传递但又不是比特数字制式的模拟电子信号,都属于模电信息。现在所有模电信号设备都已淘汰,电话、广播、对讲机、电视等全面使用数字信号,所以本文不将此类信息纳入讨论范围。
电脑诞生近70年,打下了人类文明坚实基础。进入新世纪之后,数字化信息急速膨胀,让人类自身走向了更高的智慧水平,让人类创造的人造系统有了更高的智能水平。三种信息与今天如火如荼的新工业革命,与人造系统走向智能系统,是息息相关的。
巧合的是,工业和信息化部原副部长杨学山教授,在他所著《论信息》书中,也定义了三种信息:自在态信息、自有态信息、纪录态信息[2]。
“自在态信息是指一切客观存在物,包括非生物体个体、非生物体群体、生物体个体和生物体群体在物理空间遵循物理规律,自行散发出的信息。”[2]自在态信息基本上等同于笔者定义的自然信息。
“自有态信息是指各种物体内含的信息。自有态信息有两大类:一是非生物体和生物体自身不能进行含义运动变化为目的进行处理的内含信息,所有非生物体的内含信息均属于这一类;二是生物体、机器智能、信息系统自身可用的信息,即自有且自用的信息。”[2]第二种自有态信息类似于笔者定义的表述信息。
“记录态信息是指对自在态信息和自有态信息通过一定的工具、用一定的载体记录下来,并能够为特定智能体群理解和使用的信息。”[2]笔者定义的数字化信息,看起来是记录态信息的一个子集。
忽略定义上的内涵差异,至少可以看到,无论是《论信息》还是《三体智能革命》,这两本书都支持了信息具有多种形态的观点。
划重点:信息有三种形态,它们彼此之间有序发展,一脉相承,长期共存。因此基于不同形态的信息所定义和实施的“信息化”,必然各自含义不同,结果存异。换言之,缺乏形态说明的“信息化”,是存在歧义性的。
2.信息化的缘起与内涵
关于“信息化”一词的缘起,通常业内很多人都认为,是日本人类学家梅棹忠夫在1963年发表的《论信息产业》文章中,提出了“信息化是指通讯现代化、计算机化和行为合理化的总称”的术语和定义。
但是根据安世亚太咨询总工段海波博士在“信息化的东风vs.数字化的西风:压倒or融合?”一文中的考证结果[4],“信息化”一词是由一批日本学者共同提出的:1963年,梅棹忠夫在《论信息产业》一文中提出了“joho sangyo(信息产业)”的概念;1964年,政治学者神岛二郎教授在《论信息社会的社会学》中首次使用了“joho shakai(信息社会)”的概念;1967年,日本经济计划署科学、技术和经济研究小组创造性地提出了“Joho-ka”一词,即“信息化”。1970年,社会学家増田米治把“Joho Shakai”翻译成英文“Informatization Society”。
如此说来,从中文的“信息化”到英文的“Informatization”术语,是日本人首创,然后被中国(或他国)逐渐使用。
段博士同时指出,1976-1978年,时任法国总统德斯坦委托法国财政部官员西蒙·诺拉、阿兰·孟克,写了一份《L' informatisation de la société(社会的信息化)》研究报告[4]。这份报告被认为是英文“Informatization”一词的又一来源。但经过笔者用翻译软件验证,发现法文“Informatisation”一词,用谷歌或微软翻译软件做“法译中”,结果是“电算化,计算机化”,用同款谷歌或微软翻译软件做“英译中”,则译为“信息化”;而在百度翻译软件中,无论是“法译中”还是“英译中”,都是“信息化”。或许是因为不同语种术语含义的差异,加之国内用法文上网检索资料的人很少,导致在国内早期众多介绍信息化起源文章中,基本没有见到对该篇研究报告的介绍。
即使有了来自日本学者的中文“信息化”和英文“Informatization”术语,但是中国人显然是受到中文“信息化”一词影响更多,直接照搬使用了。而对英文“Informatization”还显得相当陌生(第5节论述)。
信息化一词,笔者个人印象最深的是在上个世纪80年代末兴起的“制造业信息化”、“企业信息化”浪潮中,企业开始大量使用。政府方面正式使用以政府发布的有关新闻为准:1993年12月国务院成立了“国家经济信息化联席会议”,1994年5月成立了“国家信息化专家组”,1996年4月成立了“国务院信息化工作领导小组”,1997年召开了首届“全国信息化工作会议”;2002年在“十六大”提出“坚持以信息化带动工业化,以工业化促进信息化”。从此,信息化已经成为了各级政府工作中的一个重要抓手和政策口径,也是很多政府部门的命名关键词,如工信部、网信办、经信厅/委/局等。
在97年首届全国信息化工作会议上,提出了一个信息化定义:“信息化是指培育、发展以智能化工具为代表的新的生产力并使之造福于社会的历史过程。”[7]从该定义来看,信息化的目标是指向智能化工具和新生产力的,是有相当的认识高度和一定的前瞻性的。
不过,在一般人的理解中,信息化并非这么“高大上”,很多人认为,信息化就是计算机、通信和网络技术的现代化;也有人认为,信息化就是从物质生产占主导地位的社会向信息产业占主导地位社会转变的发展过程;更多人认为,信息化就是企业上几种软件信息系统来提升企业的业务能力——这可能是最有代表性的普遍认识。总之,对信息化的理解呈现出百花齐放状态。
划重点:信息化一词的中文和英文来源于上个世70年代的日本。80年代传入中国,被企业和政府广泛采用。对信息化本身的解读,从学术界、产业界到有关部门,其实一直没有达成内涵一致的共识。
3.数字化的缘起与内涵
数字化是伴随着计算机的发展而兴起的,是一个长期存在的历史发展过程。笔者认为,基于二进制电脑(冯·诺依曼体系结构)的历史有多长,数字化的历史就有多长。
从1945年发明的EDVAC计算机到当前最先进的计算机,其实都是采用的冯·诺依曼体系结构。冯·诺依曼理论的要点是:电子计算机采用二进制数制;应该按照程序顺序执行计算和控制[6]。EDVAC是英文Electronic Discrete Variable Automatic Computer(电子离散变量自动计算机)的缩写,其含义是将程序和数据以相同的二进制格式一起储存在存储器中,所有的指令都是由操作码和地址码组成;指令在其存储过程中按照执行的顺序进行存储;以运算器和控制器作为计算机结构的中心等。电脑中央处理器(CPU)可以在任意点暂停或继续工作,所有功能都通过单一的二进制数制资源统一了起来。
用二进制比特(bit)来表达所计算的数据,既是电脑计算的基本起点,也是电脑存储体中最小的单位。在二进制电脑系统中,每一个比特(bit)可以代表0或1的数字信号。以比特为核心的几个基本概念,如图1所示。
在电脑中,“位”用(bit/比特)表达,“字节”用byte表达,“字”用word表达。
“字长”是指字的长度,一个字节的字长是8位,即1字节=8位(1 byte=8 bit),可以用来表达一个键盘上的字符,如(A~Z)、(0~9),或其它符号(,. ? ! % & + – * /)等;而一个汉字的表达,需要一个字(word)或者两个字节,即一个字的字长为16位,1字=2字节(1 word=2 byte=16 bit)。
表达上述字节的二进制编码信息有专门的编码表格,即ASCII表,如图2所示。
在图2的ASCII表中,“行”表示高4位,“列”表示低4位。“行+列”就是8位(bit/比特),恰好是一个字节。用“行+列”的方式就能得到所有键盘字符的二进制编码。假设要在电脑里表示“1,2,3”,从图2的ASCII表可以看到,1编码是00000001,2编码是00000010,3编码是00000011;“A,B,C”等其它字符编码也是如此表达[5]。ASCII表就是一种用0和1进行编码的模型化的表达,每个字符/字节就是一个模型,每两个字节/一个字所表达的汉字等也是一种模型。当然,还有其它形式的编码表,但是都是在ASCII表的基础上扩大的,彼此兼容。
所有需要电脑处理的、可以用表述信息描述的字符、文本内容,都可以用高级语言程序的方式,写入软件,让电脑进行处理。例如“我是中国人”的汉字文本,在电脑里的表达,如图3所示。
在此基础上,理解“数字化”一词准确含义就不难了——所谓XX事物的“数字化”,其实就是XX事物的“比特化”或“二进制化”(台湾地区称作“数位化”)。总之,就是用二进制比特0和1来表达所有的自然信息(如温度、声音、压力、位置等)和表述信息(所有字符、图、文、语言等)。
划重点:“数字化”就是把各种自然信息、表述信息进行“比特化”或“二进制化”处理,转化为用0和1表达的比特数字序列,让电脑里的芯片和软件可以识别和计算、可以控制和存储这些比特数据,进而形成企业要素数字化。
4.企业数字化转型三步曲
在企业数字化转型过程中,通常分成三步走。
第一步:要素数字化(Digitization)
要素数字化,也称作“信息数字化”,是将企业工作场景中必须用到的参数、文字、图像、语音、信号等各种企业要素(自然信息,表述信息),通过人机交互、软件转换、传感器采样等方式,转换为二进制比特数据序列,这就是上一节所阐述内容。具体做法如下:
●将工作场景中的自然信息、表述信息做数字化处理,将其转化为数字化信息——例如,计算机屏幕上所显示的任何一个点、一条任意形状的线、一个字符、一篇文章、一幅图像、一种声音、一个视频、一个三维模型、一个仿真场景等,都可以看作是自然信息、表述信息被数字化的结果,都是经由软件定义而形成;
●将电子产品中的模拟信息做数字化处理,如所有模电信号转换成数字信号;
●将人类语言、文字、符号等表述信息作品数字化;
●将人、机、物等要素数字化,建立他们/它们的数字孪生,等等。
这项工作是最基本的、基础性的企业数字化工作,实际上从上个世纪90年代大规模普及电脑和应用软件之后,很多企业都已经走在了要素数字化的道路上了。而且,这种工作直到今天,仍然是要坚持不懈做下去的重要任务,因为企业的数字化能力是建立在企业要素数字化的基础之上的。
第二步:业务数字化(Digitalization)
该步骤的特征是传统业务模式不断被数字化技术解构和重构。企业要尽可能地把各项业务放到数字化平台乃至云平台上来做,逐渐向着软件定义、知识驱动、智能决策的数字化业务模式转变,不断提升企业的数字化能力。
例如,手工绘图、拉计算尺式的产品研发可以被CAX软件所替代;八级车工可以被数控机床和机器人所替代;纸质工资报表、生产成本核算与物料管理可以被ERP软件所替代;进出库单式的仓库管理已经被仓储软件所替代;线下计划式的产品维护可以被线上基于大数据的预测式维护所替代等;而所有这些,现在又可以被基于云平台的工业互联网平台+工业APP所替代。
第三步:数字化转型(Digital Transformation)
帮助企业构建基于“智能制造/工业互联网/工业云平台”解决方案的数字化智能研发、数字化智能制造和数字化智能运维等新模式,全面推动企业各个方面实现自我变革和创新重构。参考“走向智能丛书”第三本《重构:数字化转型的逻辑》作者安筱鹏博士观点,企业数字化转型应该实现五个重构[3]:
●思维重构:在现有生产要素基础上,必须加上数字化维度去“升维思考”;
●战略重构:高度发达的数字化手段引发的工具革命,促进重构企业战略;
●技术重构:原有技术体系的解耦、分化、重组、再封装,重建技术体系;
●能力重构:企业层面,实现CPS赋能;社会层面,数字经济形成新动能;
●组织重构:组织边界逐渐模糊,组织本身不断柔性化、动态化,随时重组。
关于五个重构的详细内容,可参阅笔者2019年推介《重构》文章:“不重构,无未来,没例外”
划重点:企业拥抱数字化的三个阶段,在发展上是逐步演进,在层次上是是由浅及深,在逻辑上是要素重构。首先要打好要素数字化的坚实基础。
5.信息化面临的些许窘境
信息化一词,由于是从外来词引入,当年对其理解和研究得并不是很深入。从国外经验来说,应该是在完成工业化之后进入信息化发展阶段,但是由于国情限制,中国在没有完成工业化的情况下就直接进入了工业化与信息化同期发展、相互融合发展阶段。因此一直伴随着这样那样的问题。
窘境⑴:无对应英文,国际交流困难
除了日本人给出的“Informatization”的英文翻译,中国为了向国外推介中国的信息化研究内容与成果,也做出了很多翻译上的努力,仅在China Daily(中国日报)上,对“信息化”先后有过4种译法:①Informationalization,②Informationization,③Informatization,④Information Technology。其它民间自编词汇还有若干。因为是自造英文词,前两个词读起来很拗口。每当我们与国外专家交流时,讲这些自造英文词,对方基本听不懂,因为他们大都习惯使用数字化、信息、信息技术、信息系统等通用词汇,基本上不用“信息化”术语。
窘境⑵:三种信息化,需加前提澄清
在自然信息中,信息化的真实含义是通过客观世界自然规律的安排,把客观世界中任何物质、能量、信息的形状、相态/时态/事态和有关形态的变化,都以显性或隐性方式展示给包括人类在内的自然界各个组成部分。
例如,自然界无时无刻不把其组成部分和运行规律,以科学现象、效应和原理的方式,让人类用感官感知到,用大脑去思考,用语言去描述,用图文去记录。
在表述信息中,信息化的真实含义是在自然信息的启发下,人类经过思考,开始用各种语言、图、文、符号等来表达和记录对自然信息的认识,同时用信息的彼此关联来形成结构化的知识(例如为了开发软件系统而提炼出来的业务逻辑、机理模型等),构建体系化的DIKW金字塔。
例如,单个汉字“光”,“速”,各有不止一种意思,明显具有类似于数据的不确定性,因此单个汉字往往归于“数据”范畴,无法形成特定信息。如果把这两个单字加在一起形成的“光速”这个词,则消除了单字的不确定性,形成了“光速(c)”这个含义明确的表述信息。同理,能量(E)、质量(m)亦是如此,都算是表述信息。但是,当爱因斯坦用质能方程:E=mc2把这三个信息彼此关联起来,就形成了知识。这个质能方程就是由结构化信息组成的、模型化的、可以指导人正确做事的知识。
即使自然信息、表述信息已经通过某种技术手段,从物理世界转换到了电子世界,例如将声音转换为模电信号音频,录制在了磁带上,实现了信息化存储。但是这种模电信号结构的信息化音频,不是用比特数据表达的“数字化音频”。这种模电信息在复制时难以保真,会逐渐丢失某些原有音频信息。
例如磁带经过几次翻录,原有音频就会丢失很多,声音听起来就不一样了。而真正的数字化音频,是以0和1的比特数据录制的,任意翻录而无音频损失。
综上所述,在谈及“信息化”时,是采用那种形态的信息和什么样的技术手段来做信息化,是有歧义性的。不事先说明用的是哪种信息,会出现理解上的偏差。
窘境⑶:术语渐替换,变化悄然发生
由窘境⑵,可能会人有说:“我说的不是前两种信息,默认就是第三种数字化信息啊!”如果是这样,那你就是在用“数字化信息”来表达“数字化的信息化”了。在如此明确的“数字化”前提条件下,其实就不需要比较数字化和信息化的差异了,本来“数字化”和“数字化的信息化”就是同一个事情的两个说法而已。
今天新工业革命已经来临,大家用了三十多年的“约定成俗”的信息化,已经开始发生微妙变化。
现在普遍使用数字化转型、数字化变革、企业数字化转型等术语。很多原来冠名以“信息(化)XX”的术语,都开始被“数字(化)XX”所替代。因为不这样替代,原有的词义已经不太好再继续使用了。这样的例子有很多:
数字化转型如果说成“信息化转型”,大家会略感诧异;
数字化变革如果说成“信息化变革”,听众会反应迟缓;
数字经济如果说成“信息经济”,明显感觉词义滞后了;
数字创意如果说成“信息创意”,业内人士会不知所云;
数字中国如果说成“信息中国”,公众理解将出现问题;
数字孪生如果说成“信息孪生”,专家学者会表示疑惑;
数字货币如果变成“信息货币”,数字货币也会出现定义上的混淆;
等等。
划重点:在新工业革命的大背景下,信息化的词义确实正在逐渐失去原有魅力。信息化的实质会持久存在,但是信息化的术语最终会被数字化取而代之。实际上如本文开篇所言,这个取代过程已经悄然开始。
6.信息化与数字化之比较
关于信息化与数字化的比较,市场上已经有了不少文章,仁者见仁,智者见智,内容丰富,各有所长。笔者只谈几点在这些文章中没有提到过的内容。
笔者用一张独创的“三塔图”来阐述三种信息之间的范式转换,同时想说明一下自己所认识到的数字化与信息化之间的异同,如图4所示。
图4中有三个金字塔,浅绿色表示三种信息,以及它们从左到右的转换过程。
左侧金字塔描述的是,自然界的信息来自于对客观世界“三要素”的描述,即物质、能量都具有形状、相态/状态/事态等自然信息,向外界展示其存在和特性,自然信息覆盖了物质和能量,自然信息本身的变化也是信息;
中间金字塔描述的是,人类将从客观世界观察到的自然信息转化为语言、图、文、符号等描述的表述信息,并且发现了“数据-信息-知识-智慧”之间存在着向上的关联升维关系,向下的解构降维关系,由此而形成社会化的DIKW知识体系,更好地组织和利用数据、信息和知识;
右侧金字塔描述的是,人类利用技术手段把前两种信息转化为数字化信息,并且参照DIKW金字塔,发展成为适用于赛博空间的BDIKSW金字塔[1]。BDIKSW金字塔奠定了信息技术的发展逻辑和知识体系,赋能于工业软件、智能制造和工业互联网。
从左侧金字塔,到中间金字塔,再到右侧金字塔,实际上发生了两次不同内涵的“信息范式转换”。自然信息、表述信息、数字化信息,一脉相承,长期共存,彼此之间存在着信息范式转换。而这种转换,实际上一直是信息化、数字化工作的核心内容。
划重点:“信息范式转换”是笔者在本文中提出的全新学术观点。这个观点是建立在信息具有多种存在形式,不同信息具有不同的起源、载体、表现形式和基本内涵的基础之上的。“信息范式转换”一直是信息化、数字化工作的核心内容。
7.小结
笔者认为世界上的信息有三种:自然信息,表述信息,数字化信息。
自然信息是客观存在,不以人的意志为转移。表述信息由人创造、持有、使用和优化。这两种信息与数字化并无直接关系。
第三种是数字化信息——既然是数字化的信息,那么“数字化的信息化”等价于大家约定成俗的基于数字化信息技术的“信息化”。
人类历史发展证明,三种信息都具有改变世界的力量。但是后来者居上,几十年的发展实践证明,数字化信息所具有的“数字原力”最大,在短时间内对世界的改变最显著,因为数字化的比特数据承载了数字化信息,数字化信息表征了数字化知识,而数字化知识赋能了所有的软件(包括工业软件),而工业软件又赋能了智能制造和工业互联网[5]。“信息范式转换”一直是信息化、数字化工作的核心内容。
目前仍然处于信息化、数字化两个术语同时使用的阶段。只要大家能够清晰地理解信息化和数字化的准确含义,使用哪个术语都不影响当前工作。
但是用发展的眼光看,从历史上信息化一词存在的先天性翻译和定义缺陷,到今天数字化一词开始在中国被“重新发现”并普遍用于界定新工业革命的所有活动。未来的企业应该是数字化的,产品应该是数字化的,流程应该是数字化的,工业应该是数字化的,经济应该是数字化的,社会文明也应该是数字化的,大量的现实事物都会变身为“数字(化)XX”而进入赛博空间,成为数字孪生社会中的一员。
数字化正本清源,将成一同。信息化渐行渐远。
数字化全面替代信息化应该是可以预见得到的结果。
参考资料
[1]胡虎赵敏,三体智能革命,机械工业出版社,2016.9
[2]杨学山,论信息,电子工业出版社,2016.4
[3]安筱鹏,重构:数字化转型的逻辑,电子工业出版社,2019.3
[4]段海波,信息化的东风vs.数字化的西风:压倒or融合?,安世亚太,2021.3.26
[5]赵敏,工软/智造/工互:离不开的知识工程,英诺维盛公司,2021.3.18
[6]百度百科,冯诺依曼结构,https://baike.baidu.com/item/冯·诺依曼结构计算机/10430105?fr=aladdin
[7]百度百科,信息化,https://baike.baidu.com/item/信息化/85967?fr=aladdin
原创文章,作者:3628473679,如若转载,请注明出处:https://blog.ytso.com/170647.html