化茧成蝶，人工智能引领新发展

随着社会信息化的飞速发展，一项划时代的技术正在掀起新的技术革命浪潮，那就是人工智能（AI）。

自1956年“人工智能”一词第一次出现在达特茅斯会议上，已经过去60多年。在经历了第一阶段的符号主义、第二阶段的数学建模之后，人工智能来到了以移动互联网、大数据、超级计算、万物互联为技术基石的信息时代。在算法和计算能力的驱动下，这项曾经只在科幻小说里被人们津津乐道的技术，终于化茧成蝶，第一次真真切切地站在普通大众面前，以AlphaGo在围棋领域颠覆性的胜利为标志，宣告了信息时代又一次新技术革命的到来。

当前，新冠肺炎疫情仍在肆虐，一方面全球经济深度衰退的风险挥之不去；另一方面，全球新一轮科技革命和产业变革持续演进。在“十四五”开局的新阶段，高质量发展对于技术创新和产业变革有着迫切需求。人工智能作为新兴技术，有望在新的变革中发挥驱动和引擎作用。

人工智能：信息社会的核心技术

“人工智能是利用数字计算机或者由数字计算机控制的机器，模拟、延伸和扩展人类的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术和应用系统。”

——《人工智能标准化白皮书（2018年）》

当今社会已经进入信息时代。信息社会的主要资源就是信息。这些信息资源及其以大数据、人工智能、云计算和网络通信为主的信息处理技术共同形成信息产业，逐步在经济和社会发展中发挥主导作用。当信息的共享突破时空限制的时候，所有人类高端的生产、生活、学习形态都以信息的获取、存储、处理以及再产生为基本模式。这其中又以信息处理环节为核心。而人工智能技术正是借助算法和计算能力，仿照人脑同时在很多方面超越人脑的信息处理技术，因此人工智能技术将是构成信息社会的核心技术。

鉴于人工智能技术对信息社会的重大推动作用，我国将人工智能作为战略性新兴产业，同时部署了智能制造等国家重点研发计划和专项，对人工智能产业予以大力扶持。

2017年7月国务院发布的《新一代人工智能发展规划》对人工智能的发展制定了三步走目标：第一步，到2020年人工智能总体技术和应用与世界先进水平同步，人工智能产业成为新的重要经济增长点；第二步，到2025年人工智能基础理论实现重大突破，人工智能成为带动经济转型的主要动力；第三步，到2030年人工智能理论、技术与应用总体达到世界领先水平，成为世界主要人工智能创新中心。

2020年8月，国家标准化管理委员会、中央网信办、国家发改委、科技部、工业和信息化部五部门联合印发的《国家新一代人工智能标准体系建设指南》要求，建立国家新一代人工智能标准体系，加强标准顶层设计与宏观指导。

2021年3月，《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》（以下简称“纲要”）正式发布。在共19篇65章的纲要全文中，“智能”“智慧”相关表述达57处，这表明在当前我国经济从高速增长向高质量发展的重要阶段中，以人工智能为代表的新一代信息技术，将成为我国“十四五”期间推动经济高质量发展，建设创新型国家，实现新型工业化、信息化、城镇化和农业现代化的重要技术保障和核心驱动力之一。预计到2025年，人工智能产业规模超过4500亿元。中国有望成为世界上最大的人工智能市场，未来5年的年均复合增长率超40%。我们正站在又一次技术大变革时代的门口。

工业革命中出现了动力和机器，曾经大量繁重的体力工作被机器所替代，从而大大提高了社会的生产效率。人工智能的出现也将把人们从繁重的脑力劳动中解放出来。人工智能技术是知识和数据双驱动下的产物，随着信息社会中数据的膨胀，人工智能的数据样本趋于丰富，人类的一些规则明确、烦琐单一的脑力劳动直至分析、决策、规划等高端脑力劳动都可以逐步被人工智能所替代。人工智能技术给人类带来的影响，可能远远超过计算机和互联网在过去几十年间给人类世界带来的改变。（诺文）

未来挑战：确保人工智能安全

作为引领新一轮科技革命和产业变革的核心驱动力量之一，人工智能近年来被广泛应用于金融、电商、医疗等领域。风生水起之余，人工智能产业也暗藏隐忧：随着全球人工智能规模化建设和应用的加速，人工智能基础设施、设计研发及融合应用面临的安全风险正日益凸显。近日，在互联网安全大会（ISC 2021）的“中国人工智能安全创新峰会”上，专家学者、机构及业界代表等围绕人工智能安全发展趋势及最新研究成果与应用等前沿话题展开探讨。在大咖们看来，人工智能产业健康有序发展，安全是重要保障，是形势所需，也是一些技术落地不可或缺的前提。

AI安全不容忽视

人工智能技术是一把“双刃剑”，在推动数字经济社会创新发展的同时，也可能引发一系列安全挑战。北京大学教授陈钟从人工智能赋能网络攻击的新兴威胁场景、技术现状、发展趋势以及应对之道进行了详细解读，他表示未来网络安全将呈现零信任、无边界、赛博化的特点，人工智能面临着软件漏洞、系统安全、网络安全、传感器欺骗、数据投毒五大威胁。因此人工智能系统在被广泛使用之前，需要保证系统将以受控、充分定义和充分理解的方式安全地操作。陈钟强调，需要进一步加强对人工智能技术的攻关，积极探索人工智能与区块链的融合发展，使互联变互信，创造更加安全、可信的美好未来。

中国科学院大学教授、博士生导师、密码学院院长、数据保护研究中心主任荆继武分享了他对智能时代信息化发展形势的判断，讲述了信息安全技术的新方向——白盒化。他表示，人工智能技术正在加速网络共同体的形成，安全技术将逐步走向开放化、白盒化，他以“密码算法的保密与开放”“技术细节的保密与开放”为例对其进行深入解读。他强调，白盒化的安全是未来全球安全市场的重要方向，它的发展需要得到市场的支持，公开体系结构，从而推动安全技术产品的专业化完善和深度融合。

目前，真正能代表人工智能前沿发展的莫过于深度学习，尤其是深度学习在无人驾驶、医疗决策等领域的应用。浙江大学“百人计划”研究员、博士生导师、浙江大学滨江研究院国产信创研究中心副主任纪守领以《深度学习模型的安全可解释性与鲁棒性》为主题分享了在深度学习模型上的研究成果，并从对抗样本攻防对深度学习模型的鲁棒性进行了拆解，从模型层面、数据层面、承载系统层面对深度学习模型的安全性进行分享。

AI对抗开辟网络安全新战场

中科院信息工程研究所副主任陈恺通过实例向观众展示了如何利用声音、图像中的噪声信息“骗”过人工智能大脑，对抗自动驾驶目标识别系统。他表示，人工智能技术虽然广泛应用于计算机视觉、自然语言处理、自动驾驶等领域，但人工智能系统容易受到攻击，限制了其在关键安全领域的应用。因此提高人工智能系统对抗攻击的鲁棒性在人工智能进一步发展中发挥着越来越重要的作用。陈恺表示只有掌握了各种攻击方式对于人工智能造成干扰的原因，才更有能力确定相应的防御思路，在模型之前可以放一些检测器检测对抗样本，以此提升网络的安全性能。

目前，针对网络空间的攻击无所不在，网络安全与治理已经成为学术界和产业界共同关注的科技前沿问题。北京邮电大学教授李小勇以《AI及威胁情报驱动的跨网系行为检测与异常发现》为题，从网络空间安全与威胁情报、威胁情报的发展与应用、AI及威胁情报驱动的跨网系异常检测三个方面进行了分享。他指出，利用异构多源行为大数据高效感知、IP流量异常行为高效识别与利用、空口异常行为精准识别与利用、跨网系异常行为融合分析与态势感知等关键技术可以进行跨网系异常检测，智能威胁云的情报可以减少攻击面、监测未知威胁、实时安全防护，实现智能防御。

共建开放创新的AI安全生态

近年来，人工智能技术的发展和应用不断推动着网络安全攻防自动化和智能化水平的提高，目前已经在恶意代码检测、恶意流量分析、漏洞挖掘、僵尸网络检测、网络灰产检测等领域有了广泛的应用。360集团AI安全实验室主任邹权臣表示，各个场景、各个领域的人工智能系统都存在着被攻击和被欺骗的可能，因此亟须构建人工智能安全创新环境，通过开源开放与高等院校和科研院所进行对接与成果转化，促进人工智能安全行业持续、健康、快速发展。

数字化转型驱动技术变革，传统的IT架构被颠覆，未知威胁变得更隐蔽，因此智能、坚固的安全体系比以往任何时候都重要，因此构建主动感知、敏捷智能、精准预警、全时可用的云网边端一体化安全防护体系成为关键。新华三技术有限公司安全研究院院长顾成杰强调，云智原生将赋予企业和组织与生俱来的云与智能的架构和能力，加速释放数据价值，企业要以原生的思维构建云安全体系，驱动安全与云计算深度融合；通过全域同构，实现公有云、私有云、边缘云多场景的安全统一、极简运营、一致体验；通过多云管理，打造同构/异构多云安全一体化服务，实现本地和公有云侧的安全能力。

随着人工智能技术步入快车道，人工智能芯片使用成本的快速降低，深度学习框架等核心技术的开源与共享，AIoT智能硬件的快速发展，均在助力人工智能行业成功破圈。在智能物联网（AIoT）时代，智能硬件产品正在逐步融入我们的生活，进一步改变我们的生活方式。360智慧生活集团技术中心总经理、360集团硬件专业委员会执行主席孙浩表示，这个趋势对应的是AI算力的平民化、边缘化，即使在算法理论没有进一步突破的前提下，AI也能够凭借更加低廉的硬件结合边缘，融入终端设备，走入生活给整个行业带来巨变。

可以预见，数字时代，人工智能作为最具颠覆性和战略性的核心关键技术，与网络安全相辅相成。人工智能可以提升网络安全工作的效率，网络安全也要为人工智能的发展保驾护航。但人工智能安全不是任何一家公司、社区能够独立解决的问题，因此，需要构建开放创新的AI安全生态，助力人工智能技术稳健发展。（语沐）

AI应用：OCR如何让日常办公更高效？

人工智能时代的来临，正在给社会的方方面面带来深刻变化。特别是面对具有大量数据处理需求的日常办公场景，人工智能往往可以“大展身手”。众所周知，文字是人们信息交流的重要载体，从吃穿住行到日常办公生活，乃至一部电影都需要字幕辅助人们理解各类内容。相较图像、视频中的内容，文字往往包含更强的语义信息，因此对图像中的文字提取和识别具有重大意义。与人工智能相结合的光学字符识别（OCR），在基础感知识别的基础上逐渐增添了在复杂自然场景下精准识别并理解各类有效信息的能力，可以将生活中的文字等非结构化数据转化为结构化、数字化的数据，大幅提高人们的日常办公效率。

何为OCR？根据业界公认定义，光学字符识别（OCR）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成数据的过程；即针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。目前，OCR最广为人知的应用是各类文档的扫描并将其输入为可编辑的数据，其已成为业界公认的OCR底层应用。

OCR概念早在1929年便被提出，时至20世纪六七十年代，世界范围内便有多个国家开始了OCR领域的研究，以日本为例，其在1960年前后开始研究OCR的相关识别理论，初期以数字为研究对象，经过10年左右的时间研发出部分功能简单的应用，如印刷文字的邮政编码识别系统，其可以识别邮件上的邮政编码，助力当地邮局进行区域分信作业。类似于上述识别邮政编码的简单应用，业界普遍认为OCR是有能力协助人类解决生活中一些感知层面问题的。什么是感知层面的问题？举例而言，做人脸、文字的识别，这些都是属于感知层面的问题。假如数据的体量足够大，做一个人脸识别的引擎，或者一个简单的印刷场景的文字识别引擎，是较为容易的。

OCR已经逐渐从感知识别“进化”到认知理解。随着OCR的应用越来越广泛，对特殊场景的文字进行识别的需求也迅速增多，目前的OCR已经无法满足需求。相较识别印刷体场景，在复杂场景中的识别往往面临以下三个难点：一是成像复杂，包括噪声、模糊、光线变化、形变。二是文字复杂，包括字体、字号、色彩、磨损、随机的字间距以及方向。三是场景复杂，包括版面缺失和背景干扰。

如若没有人工智能的加持，OCR很难达到使用者的预期目标。举例而言，我们想要识别一家烤肉店的门头，由于其招牌上的“烤肉”二字使用艺术字体，并且该OCR应用没有人工智能的辅助，则识别结果很可能是“火”“考”“肉”三个字，与原义相去甚远。因此，OCR不仅要识别文字，更要理解语义。华南理工大学电子与信息学院教授、广东省琶洲实验室OCR中心主任金连文对本报记者表示，只有利用数据和知识，才能使我们解决OCR认知理解的问题，“所谓知识就包括物理常识、各领域知识、语义知识，以及从海量数据中学习到的知识”。

在深度学习的加持下，OCR将继续发光发热。人工智能特别是深度学习技术的发展和迅速普及，给OCR带来了新的发展机遇。以人们日常生活中经常遇到的手持身份证照相识别的场景为例。由于身份证目标在图像中的所占比例往往是较小的一部分，直接提取微小候选目标无法保证精度。为了保证高召回和高定位精度，一般采用由粗到精的策略进行识别。第一步利用Faster R-CNN框架定位身份证在照片中所在区域，第二步在身份证区域位置对所需要的姓名、身份证号等信息进行精确的检测识别。而Faster R-CNN框架是目前深度学习领域较为火热的技术概念，其由RPN（候选区域生成网络）和RCN（区域分类网络）两个子网络组成。RPN通过监督学习的方法提取候选区域，给出的是无标签的区域和粗定位结果。RCN则引入类别概念，同时进行候选区域的分类和位置回归，给出精细定位结果。

在融入深度学习后，对于一些门头招牌、酒水菜单、发票等复杂场景的识别精准度会大幅提高。以智能报销系统为例，针对增值税发票，包括电子发票、普通发票、专用发票、卷式发票等，通过OCR识别以及与国家税务总局服务器发票验真接口的结合，可以极大提高发票识别校验的准确率和效率。OCR技术除了能够识别增值税发票上的发票号、发票日期、密码区、税率、金额、税额等信息之外，还能识别发票明细、备注栏等信息，以满足三单匹配等需要。金连文表示，一张发票中的信息有很多，如何提取其中最为关键的有效信息，是接下来智能报销系统的发展目标。

“我们不仅要教会计算机‘认字’，更要教计算机理解这个字后面的语义信息和结构化信息。”金连文表示，在不远的未来，OCR识别检测出来结果的同时可以自动提取有效信息，即文档的结构化理解，如若其能够得到落地实践，那么接下来更加智能化、商业化的OCR应用也将不断涌现，智慧办公必将成为现实。（赵乐瑄）

AI让老照片“笑”起来

“AI还原李焕英老照片动态影像”视频截图

电影《你好，李焕英》上映以来感动了万千观众，一组李焕英年轻时的黑白老照片亦在网上热传。近日，独立艺术家胡文谷借助人工智能技术（AI），将李焕英的老照片复原为彩色动态影像，她的一颦一笑惊艳了观众，网友纷纷留言“瞬间泪崩，这个微笑太美了”。

在“AI还原李焕英老照片动态影像”视频中，胡文谷借助人工智能，一步步还原照片色彩、增强清晰度、精修面部、手绘微调，最后让人物面部动起来，让老照片重新焕发生命力，“希望以此向每位母亲致敬”。在过去的一年里，胡文谷还曾用人工智能复原90年前的上海时装秀，还原兵马俑、苏轼、宋明清皇帝的立体动态长相等，不少作品引发网络热议。

“其实，我仍然是AI的入门研究者，学习人工智能是为了尝试能否为游戏开发节省时间和成本，后来发现AI能做的事情有很多。”胡文谷从很小的时候就对计算机产生了强烈兴趣，上初中、高中时在课余时间尝试制作了许多Flash动画短片和小游戏。从小学习钢琴的他，后来学习了电子音乐创作，还常常为自己的游戏作品配乐，让人工智能续写贝多芬、巴赫的旋律，可谓“程序员里最会画画的作曲家”。

将想象变成现实，是推动胡文谷持续创作的不竭动力。“人工智能具有深度学习能力，在社会人文科普方面有着很有意思的应用前景。”未来，他希望不仅让老照片、历史画像里人物的面部动起来，还能进一步让人物全身“复活”，让人工智能为历史人文科普做更多事。

化茧成蝶，人工智能引领新发展

原创文章，作者：Maggie-Hunter，如若转载，请注明出处：https://blog.ytso.com/209319.html

化茧成蝶，人工智能引领新发展

相关推荐

发表回复