2月29日,360集团创始人周鸿祎免费课开讲,并开启了AI系列课程第一讲——“预见AGI”。
该课较为系统地分享了AI最新发展趋势的洞察、多模态发展五个层次,以及AI发展五个阶段等硬核知识,以下是帮你整理的21条课程笔记。
今天大概讲四个部分:
第一,AI发展新洞察。
第二,Sora给我们带来的启发。
第三,我们该怎么做?
第四,360的AI新产品。
1、学习方法。当我进入一个新领域的时候,我先要学习框架,很多新技术层出不穷,首先要在整体上对它有一个整体的把握,这个整体把握住了,就不会出大方向的偏差。
2、大家为什么要来听我的课,?在人工智能的技能和知识面前人人平等,这是一种专业技能,就像学会开车一样。所以,我认为学会人工智能是每个人在未来自己职业发展生涯里一个必备的基本能力。
3、360AI三大心法。相信大模型是真智能;相信大模型是一场工业革命;相信所有业务都会被重塑;相信不拥抱AI的公司会被淘汰;相信不拥抱AI的员工会被取代;相信人工智能正朝着AGI快速前进。
第一部分:2024年十大AI发展趋势预测
4、2024年十大AI发展趋势预测。
a、开源大模型爆发;b、“小模型”涌现,运行在更多终端;c、大模型企业级市场崛起向产业化、垂直化方向发展;d、2024是大模型应用场景之年,ToC出现杀手级应用;e、多模态成为大模型标配;f、文生图、文生视频的AIGC功能突破性进展;g、具身智能赋能人形机器人产业蓬勃发展;h、大模型推动基础科学取得突破;i、大模型无处不在,成为数智化系统标配;j、Agent智能体激发大模型潜能,成为超级生产力工具。
第二部分:Sora的创新启示
5、Sora的出现确实超出我的预料,超出所有人的预料,看起来是一个剪视频的工具,其实不是。
6、Sora创新突破的本质是通过观察理解了世界常识。
7、Sora的训练过程中,Sora应该在多模态的输入,不仅理解了视频里有什么,它应该把它背后的一些规律做类似人类常识给学到了。所以,我认为,它“理解”了世界的一些运行规律。
第一、理解了规律,不见得理解了公式。第二,Sora做的视频里有些东西它理解的不太对,这跟训练有关系,因为毕竟现在算力有限。
8、为什么Sora对Pika和Runaway形成了降维打击呢?Sora的原理,它通过对图像和视频的学习和训练,它知道世界里面一些常见物体的交互关系。所以,它为什么是一个世界模拟器,你们模拟世界必先了解世界,而了解世界不一定是了解语言,要了解世界基本的规律。
9、如何定义理解?Sora完整能力曝光 证明其拥有理解力。OpenAl透露:Sora可对视频和图像进行识别、处理、分析、理解和生成。Sora是不是操纵像素?我已经给大家证明了,如只操纵像素,而不能理解,做不出这么逼真的图。
10、多模态发展的五个层次:
一、识别辨认物体,能够识别图片中的物体,例:能识别图片中有篮球和运动员;二、逻辑推理能力,增加大语言模型能力,具备推理力,例:可辨别是一场篮球比赛; 三、逻辑合理性,增加多模态能力,可识别不合理内容,例:3米高的球员不现实;
四、评价鉴别能力,可对事物进行评判,工作在语言层面,例:评价某个进球很漂亮;
五、具有世界常识,根据观察理解物理规律,工作在视频层,例:可以生成篮球比赛。
11、Sora“翻车很正常,就像人类做梦一样,存在“幻觉”。训练样本不够,说明没有内置3D引擎。
12、关于Sora技术实现的猜想。有一个哲学就是大力出奇迹,暴力美学,就是计算单元可以很简单,但是可以无限叠加,这个原理我觉得符合造物主造我们这个世界用的哲学是一模一样的。
13、OpenAI最近的一个成果,就是Sora证明了什么?它实际上用一个架构,对文字、图片、视频、音频统一的处理,这个很了不起,过去我们做多模态,很多多模态是假的,就是一个模型处理图片,一个模型处理视频,这样它互相无法打通,也无法帮助。
14、GPT解决机器和人的交流问题,Sora解决机器和世界的互动问题
15、Sora的出现加速AGI时代到来。Sora看起来是个吹风机 实际上是个刮胡刀。我理解的AGI–能像人一样沟通交流、分解任务、执行任务。
16、AI发展的五个阶段:
第一,人工智障,不理解语言。小模型阶段,能力单一,无法泛化,无法做到理解,第二,人工智能入门,理解语言。GPT出现,AGI迎来拐点,机器实现与人类的交流。 第三,通用人工智能,理解世界的互动。Sora的出现,打开了AGI的大门,能够认知世界,跟世界互动。
第四,强人工智能,与物理世界互动。附身于自动驾驶、机器人,获得与人类同样的感知、认知和行动力。
第五,超级人工智能,总结与发现世界运行的各种规律,总结公式。
17、为什么要发展AGI?第一,推动基础科学取得突破。人类基础科学研究面临巨大瓶颈,亟需AGI带来实质性突破;第二,反向解决能源自有问题。
第三部分:我们应该怎么做?
18、中国如何走出有特色的大模型发展道路?第一,超级通用大模型;第二,发展企业级大模型;第三,加速场景落地。
19、给创业者的建议。第一,创业者不要再去碰通用大模型了,没有意义。第二,也不要在通用大模型之上做一些简单的套壳、很薄的应用,这样传统大模型只要出一个工具,你就完蛋了。
建议做两个方向:
第一,在企业级上找方向,因为企业级的市场,场景非常丰富。我们这么多大型央企,大型民企,都要做数转智改,这里面会有非常多的机会。所以,过去很多SaaS小公司,如何用大模型把自己的SaaS能够两个结合,我觉得是很重要的方向。
第二,找这种To C的场景,一定要把场景做得非常重,做得非常垂直,做得非常浅的场景都没有价值的,因为别的公司稍微在浏览器里加一个功能,你就走了。
第四部分:360AI产品
20、2024年我觉得大模型必须跟场景结合,否则大模型永远都是大公司不断秀自己技术实力的一个玩具。所以,我们做了这两个场景:第一,试图重塑搜索的体验,让用户直接通过对话找到答案;第二,把浏览器定位成学习、生产力工具,能够帮你快速阅读长视频、万字论文、大部头书籍和长网页。
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/aigc/312289.html