2024年9月20日

在刚结束的英伟达 GTC 2023 大会上,英伟达 CEO 黄仁勋把这个观点反复说了 3 遍。

iPhone 搭载的多点触摸屏幕技术开创了一个全新的智能手机界面交互模式,由此孕育了移动互联网。

而 ChatGPT、Stable Diffusion 等 AI 超级应用的出现,标志着加速计算和 AI 技术的成熟已迈入成熟,AI 正以一个前所未有的速度渗入各行各业,推动一场新的产业。

经过近几年 AI 技术的不断发展,强大算力和先进模型为 AI 提供了合适的应用平台,促使各个厂商们重新构想自己的产品和商业模型,以及更新迭代的速度。

昨天晚上,英伟达、微软、Google、Adobe 等厂商在相差无几的时间里都推出了各自的 AI 服务,你追我赶之势仿佛在传达着同一个焦虑:

例如发布了一项名为 CuLitho 的 AI 辅助制芯技术,为 2nm 制程铺平了道路;与路特斯、奔驰、宝马等汽车厂商合作,用 Omniverse 搭建数字生产线等。

但要说到整场 GTC 大会最亮眼的内容,还得是英伟达发布的新显卡——带有双 GPU NVLink 的 H100 NVL。

H100 NVL 是专门针对算力需求巨大的 ChatGPT 而设计的显卡,H100 NVL 拥有夸张的 188GB HBM3 内存(每张卡 94GB),这也是目前英伟达发布的内存最大的显卡。

像 GPT 这样的大语言模型非常占用内存资源,理论上参数达到上千亿的 GPT 模型可以迅速占满一张 H100 显卡。

ChatGPT 的运行主要依靠由 A100 或 H100 组成的 DGX 超级计算机,微软为此花了数亿美金采购了上万张 A100 显卡组建 Azure 云计算平台。

为了降低用户部署大模型的成本,英伟达推出了 DXG Cloud 服务,每个月 36999 美元起,你就能获得一个由 8 张 H100 或 A100 显卡组成的云端超级计算机,轻松完成高负载的计算工作。

2016 年,老黄亲手向 OpenAI 交付了第一台 DGX 超级计算机电脑。7 年之后,顶尖的 AI 算力通过 DXG Cloud 有机会走进每家公司,完成在过去不可能完成的任务。

不难想象,像 ChatGPT 这样能够改善人类交流、提高工作效率的先进应用会持续涌现,为我们的生活带来更多的便利和惊喜。

B 站一直流行一句梗:视频不能 P,所以这是真的。但如今视频不仅可以 P,还可以从无到有直接用 AI 生成,不用画师、不用摄影、不用后期。只要你往 Runway 中输入一段文字,它便还你一段震撼人心的短片。

最早,Runway 是一款后期辅助工具,虽然借助了人工智能的神奇力量,但所能实现的,并不复杂:擦除物体、图像插帧、删除背景、运动追踪等,可以将它视作 Adobe Premiere 的傻瓜式插件。

而当 Runway 打开人工智能的新大门后,它拥有了点石成金的能力。在去年 9 月公布的 Gen 1 版本中,它有了文本转视频的能力。那时的人们,刚刚见识过文本转图像的魔力,而 Runway 直接能生成动态影像,简直是降维打击般的震撼。

比起 Gen 1 模型,它实现了更高的时间一致性和保真度,说人话就是画面之间的联接得更顺畅了,画质还更高清了。

Runway 的进步有目共睹,在对抗网络模型路上越走越远、越走越顺,如今的 Gen 2 版本已经算是“可看”的程度,虽称不上精致,但未来可期。

或许到了 Gen 3 版本,我们就能在它的帮助下,一键生成抖音爆款短片。到时候,这会是优质博主的噩梦吗?

如果说英伟达让我们看到了 AI 发展的未来,那 Google 的 Bard 就是 AI 的今天。

在大家被 GPT-4 和 Midjourney V5 震撼刷屏一周后、老黄展望未来 AI 时代的同时,Google 宣布正式开放 Bard 的访问:请尝试 Bard,并提供你的反馈。

根据 Google 的最新演示,相比 ChatGPT,Bard 更像是一个专注于工作学习的随身助理,你可以在它的协助下,激发想法、满足好奇心。

你可以让 Bard 用简单的语言解释量子物理学,或者让它提供头脑风暴,帮你在一年内阅读 20 本书。

Google 表示,用户可以在 Bard 的协助下,加速想法、激发好奇心。你可以使用 Bard 提供一些技巧,比如如何实现一年阅读 20 本书,或者用简单的语言解释量子物理学。

在演示中内容中我们还发现了一些细节,Bard 似乎会同时生成多个回答,你可以根据需求选择最适合你的那一个,并进行持续提问。

当然,ChatGPT 也可以生成多个回答,但它是在回答结束后重新生成,相较来看,Bard 更像是一个会同时提供多种方案的乙方。

Google 表示,虽然 Bard 由大型语言模型提供支持,并会随着时间推移而日渐强大,但它会学习到一些偏见或者刻板印象,导致它“自信满满”地说出一些不准确或者虚假的信息,比如它会将“ZZ Plant”理解为 Zamioculcas zamioculcas,而不是正确的 Zamioculcas zamiifolia。

有了 Bing Chat“疯了”的前车之鉴,Bard 的第一个测试版就限制了同一对话中的交流次数,从而保证内容的准确。当你第一次登陆 Bard 时,它就会告诉你这只是一个实验,并期待你的反馈。

作为 Bard 的第一个版本,它暂时还不支持更多语言(包括中文),Google 会持续更新写代码、识别/生成图片以及多语言支持。

Bing Chat 到底有多火,或许只有上线一个月就让 Bing 日活首次突破 1 亿的数据能说明了。从复杂问题到娱乐聊天,再到灵感创意的实现,Bing Chat 正在重塑我们网络搜索的体验。

微软表示,人脑处理视觉信息的速度比文本快约 6 万倍,Bing 的搜索数据中,图像是搜索最多的类型之一,而由 DALL·E 模型的高级版本提供支持的 Bing Image Creator,可以让我们通用自己的语言在 Bing Chat 中描述图片信息、选择艺术风格,Image Creator 就会联系上下文,将你的想象“画在纸上”。

Bing Image Creator 的加入,让 Edge 浏览器变成了第一个集工智能图像生成器的浏览器。

由人工智能驱动的 Stories 和 Knowledge Cards 2.0,可以让你在搜索后获得图像、短视频以及由人工智能驱动的信息图表,可以一目了然的获取事实和关键信息。

未来使用 Bing 搜索时,你获得的就不是一个个冷冰冰的网页链接,而是更加丰富、有趣的图片、视频以及视觉故事。

如果你已经通过新 Bing 申请,现在就可以在 Bing Chat 中体验 Bing Image Creator 了,如果从以下网址进去的话,则可以直接试用。

当科技公司卷到图片生成后,著名设计创意公司 Adobe 自然不甘人后。在这个疯狂的夜晚,Adobe 也推出了自己的创意生成式 AI 模型集:Adobe Firefly。

Adobe 用几个简单的例子展示了 Firefly 的能力。你可以用一句话,让正处于春天的风景,变成冬天的模样。

你也可以在草地上用笔刷随意刷一下,然后告诉 Firefly 这是一条河,它就会自动生成河流。

Firefly 能做的自然不只这些,框选狗狗的毛发,它可以将毛发变成画笔,现场帮狗狗改变发型;设计一个艺术字,它能帮你生成一个单词、一句话;设计好一款耳机,Firefly 还能把它放到场景中,变成产品展示图……

Adobe 认为,AI 正在提供一种打开世界的新方式,设计师可以用最顺手的方式来实现创意,“帮助创意人而不是取代创意人”。

同时,Adobe 还创立了“内容真实性倡议”CAI,建立了可信数字内容归属的全球标准,并对人工智能生成的内容进行标记,打造 Firefly 生态系统,“Adobe Firefly 是友军,更是友军里的最强辅助”。

这些扎堆出现的更新从侧面证明了,AI 领域迈进了一个高速发展的阶段。上一个月 AI 可能还画不好手指,下一个月凭借算力提升和模型升级,AI 已经能取代掉服装模特的工作。

无数的科幻作品都预言过 AI 在未来会成为我们生活的一部份,但没有人告诉过我们,我们离这个未来只有咫尺之遥。

我们的生活正在被 AI 一点点地改写。在 GTC 大会上,黄仁勋提出了一个很有意思观点,他认为生成式 AI 就是一种新型的计算机,我们可以用人类语言进行编程,任何人都可以命令计算机来解决问题。

过去的几个月里,我们见证了 AI 是如何逐步掌握画画、写作、剪辑、制表、做 PPT 等技能,按照这个进化速度发展下去,还有什么是 AI 不能做的吗?

OpenAI 的 CEO Sam Altman 最近在 Twitter 上大胆预测了新版“摩尔定律”,他认为全球人工智能运算量每隔 18 个月就会翻一番。

发表评论

邮箱地址不会被公开。 必填项已用*标注