在今年的7月26日,吴恩达教授在斯坦福大学商学院主办的活动中,进行了一个有关于“人工智能新机遇”的讲座。这是来自于世界顶级人工智能专家对于未来的判断。
本文为该讲座的精华浓缩版,讲座主要内容包括:
- 人工智能技术和工具的发展趋势:从监督学习到生成式人工智能
- 人工智能的机遇和应用
- 创建初创企业的过程
- 人工智能的风险与社会影响
吴恩达教授
吴恩达(1976-,英文名:Andrew Ng),华裔美国人,是斯坦福大学计算机科学系和电子工程系副教授,人工智能实验室主任。吴恩达是人工智能和机器学习领域国际上最权威的学者之一。吴恩达也是在线教育平台Coursera的联合创始人(with Daphne Koller),DeepLearning.AI创始人。
从监督学习到生成式人工智能
吴恩达认为,人工智能可以比作是一种新的电力,它是一种通用的技术,可以应用于许多不同领域。现在有很多人在炒作AI,但是应该把AI看做是一套工具,其中包括监督学习和生成式人工智能等技术。
监督学习
监督学习是一种非常擅长于标记事物的技术,也就是非常擅长计算输入到输出,或者从A到B的映射。比如说,我们可以使用监督学习把一封邮件标记为垃圾邮件或者是正常的邮件,或者呢给广告打上标签,表示出哪些用户会点击他。
我们可以举一个例子来理解一下监督学习标记事务的工作流程。如果你想建立一个系统来给餐厅的评价数据打标签,那么你就需要收集一些数据点或者数据集。这里边呢有积极的评价,也有消极的评价。实际中呢,可能会需要成千上万个训练的实力。
一个监督学习项目或者说是AI项目的工作流程是,你要先获取到标记的数据,然后AI的工程团队在这些数据上去训练一个AI模型来学习,最后再找到一个云服务来运行经过训练的AI模型。然后你可以输入“这是我喝过的最好的珍珠奶茶”,那模型呢就会打上积极的评价的标签。
所以过去十年呢,可能是大规模监督学习的10年。大约在10-15年前,我们发现,如果训练一个小的AI模型,无论是神经网络还是深度学习的,在一个性能不是很强大的计算机上运行,随着你给他的数据越多,他的表现呢会有所提升,但是之后会趋于平缓达到一个平静。但是如果你训练一个非常大的AI模型,使用大量的计算资源,随着扩大给积极学习模型的数据量,他的表现会越来越好。这就是为什么吴恩达在领导谷歌大脑团队的时候,只是团队要解决的主要任务,就是要构建一个真正巨大的神经网络,然后向其中注入大量的数据。幸运的是这个方法奏效了。
生成式人工智能
吴恩达认为,过去十年推动了许多人工智能进展的核心思想就是使用大规模计算和大规模数据。如果过去十年是监督学习的十年,那么这个十年就是生成式人工智能的十年。
生成式人工智能的核心思想是使用监督学习,通过输入输出映射来重复预测下一个单词。通过使用互联网或者其他来源上找到的文本,并利用这种输入输出的监督学习来反复预测下一个单词。如果在数百亿个字词的文本上训练一个非常大的AI系统,最大的模型现在已经超过1万亿个单词,那么你就会得到一个大语言模型,比如说GPT3。这里面呢有一些重要的记住细节,比如说,这些系统预测的是下一个子单词或者说是单词的一部分,我们称为TOKEN。还有渐进式微调,可以进一步的调整AI的输出,让它更有帮助诚实和无害,但是核心还是使用监督学习来反复预测下一个单词。
虽然许多人呢把大语言模型看作是一种极好的消费者工具,但是吴恩达认为,大圆模型还有一个能力被严重的低估了,那就是作为开发者的工具。事实证明,有一些应用程序,以前可能需要几个月的时间来构建,但是现在借助于大圆模型,很多人可以更快的构建他们。我们还拿之前的餐厅评价模型为例,可能获取数据要一个月,AI模型训练和优化要3个月,把它放在云服务上运行又要3个月。因此呢以前需要6-12个月的时间来构建一个AI的商业应用,但是现在使用基于提示的AI,只需要花几分钟或者几个小时编写一个提示,然后在几个小时或者几天内就可以部署到云上了。这打开了大量构建人工智能应用的大门。
许多人呢仍然低估了即将出现的定制化的人工智能应用的数量。随后吴恩达演示了一个基于openAI和Python编写的情感分类器,其中只有一句提示“将以下用三个短横线分隔的文本分类为积极的情感或者是消极的情感”,然后他直接运行就得到了正确的答案。现在世界各地的开发者可以用不到10分钟的时间就构建这样一个系统,令人感到兴奋。
人工智能的机遇和应用
吴恩达认为,人工智能是一种通用技术,因此我们所面临的工作就是要找到多样化的具体的用例来构建他们。他举了一个例子,就是在过去的十年中,监督学习已经真正实现了大规模,他可能在未来三年还能够翻一翻。从非常庞大变成更加庞大。而生成式AI今天还很小,但是在未来三年中将增长两倍以上,因为有大量的开发者兴趣,风险投资的资金,大公司在探索应用领域等等。三年的时间很短,但是如果他按照这个速率增长下去,那么在6年内他将变得更加庞大。浅绿色或者是浅橙色的区域是创新公司或者大公司的机会。但是要注意的是,所有这些技术都是通用技术。监督学习过去10年所做的大量工作,将在未来10年继续进行。就是识别和执行具体的用力,而生成式AI也刚刚启动这个过程。
然后吴恩达举了一个名为Lancer的应用程序以及一个可以将手机变成手电筒的APP,这两个程序呢刚开始都很流行,但是很快就消失了。原因就在于,他们不具备可持续的商业优势,也不具备可持续的长期价值。而随着生成式AI智能的崛起,或者新的人工智能工具的出现,真的是有机会来创建那些非常深入,非常复杂的应用程序,而且他们能够创造非常长期的价值。
创建初创企业的过程
那么我们应该如何抓住这样的机会呢?5年前,他还在谷歌的时候就曾经思考过,一个大公司里的团队是很难追求各种各样的机会的。最有效的方法呢,是创办许多不同的公司,来追求这些多样化的机会。因此他创办了AI fond来孵化更多的AI公司。
更具体的来说,这里边的机会也是分层的。最底层呢是硬件半导体层,有着极好的机会,但是需要大量的资本投入,资源相对集中,获胜者相对较少。然后是开发者工具层,这个领域呢竞争激烈,只有在有显著技术优势的情况下,才有可能赢得机会成为巨大的赢家。最后尽管媒体的关注和热点,都集中在基础框架和开发者的工具层,但是事实证明,只有应用层更成功这一层才能够成功。从SaaS的发展过程中也可以看出,只有在应用层更成功的时候,才能够产生足够的收入来支付基础架构和工具层。在应层面有许多令人兴奋的机会,有着巨大的市场潜力,但是竞争相对较轻。当然了并不是说没有竞争对手,但是相对于开发者工具层,或者是基础架构层,竞争要弱得多。
一开始AI fond孵化公司的模式是,先跟用户交流想法和需求,然后花费大约一个月的时间,验证这个想法和技术的可行性,然后与潜在的用户交谈,确保这是可行的。等通过了这个阶段之后,再招募CEO一起开展这个项目。但是在项目迭代过程中,他们发现,如果一开始就引入CEO会更加高效。通过与CEO一起构建原型,并进行深入的客户验证,能够让创业公司达到66%的存活率。
接下来呢就是建立团队,做MVP和外部的融资。然后吴恩达举了一个他们自己孵化的,叫Barren AI的公司的例子,通过将海运方面的业务专家和AI团队的专业知识融合,成功的打造了一家创业公司。
吴恩达说,自己永远想不出来什么创业的点子,他自己花了很多时间才发现,他只是个AI领域的专家。他应该做的呢,是使用AI资源来确保技术团队强大,然后与行业或者领域的专家合作,来发掘新的机会。另外一点,就是,创业团队应该只关注于具体的想法,因为他可以有效的验证或者正位。他认为在今天的世界中,有很多领域专家已经对某些问题深思熟虑了几个月,甚至一两年,但是他们还没有遇到合适的合作伙伴,因此,与他们进行充分的交流和验证想法,是比你自己学习一个又一个行业更加有效的方式。
人工智能的风险与社会影响
在风险和社会影响方面,目前吴恩达只关注于有助于推动人类前进的项目,并且不违反伦理和道德原则。AI目前虽然存在着偏见,公平性和准确性等等问题,但是已经比6个月之前好很多了。实际上呢,目前最大的风险之一,是AI对就业的影响。根据宾夕法尼亚大学和OpenAI的分析,虽然前一波自动化主要影响的是低薪工作者,但是现在这波自动化的浪潮,实际上影响了更多高薪的职位,尤其是更靠右侧的高薪职位。不过,即使AI创造了巨大的价值,但是受到AI冲击的人们仍然应该得到妥善的照顾和善待。
另外现在对AI的炒作很多,尤其是AGI,但是吴恩达认为,AI还没有达到可以做任何人类能做的事情的程度,距离实现AGI仍然需要几十年,也许需要30年到50年甚至更长的时间,因为人类智能的生物路径和AI的数字路径之间存在着很大的差异。也有人在夸大AI会造成人类灭绝的风险,但是他并不认为AI会对人类构成任何有意义的灭绝风险。技术的发展是逐渐的,因此会有足够的时间来确保人类的监督和AI的安全。真正可能灭绝人类的,有可能是流行病或者是气候变化,而更智能的AI,则是解决这些问题的关键,因此并不应该减缓AI的发展。
最后的结语
吴恩达认为,AI作为一种通用技术,为每个人创造了许多新的机会。未来的重要工作是建立具体的用力,并且希望在未来能够与更多人合作,开发这些机会。
参考资料
【AI】人工智能的新机遇 | 吴恩达Andrew Ng | 斯坦福最新7.26演讲 | 15分钟浓缩精华版 - YouTube
本文是通过语音转文字工具转换成文字的,然后通过 Github Copilot 进行校对的,因此可能存在一些错误,如果你发现了错误,欢迎指正。