巨头们想尽办法让有缺陷的人工智能变得实用。

文丨贺乾明 邱豪编辑丨黄俊杰

乔布斯曾将计算机比作大脑的自行车——人踩上脚踏板,速度就快了几倍;用上电脑,创作效率也成倍提升。在昨夜举办的微软 Build 开发者大会上,微软 CEO 萨提亚·纳德拉(Satya Nadella)重复了这个比喻,“随着 ChatGPT 出现,自行车变成了蒸汽机”。


(资料图片)

他认为这是人工智能的重要时刻。而微软占据着独特的位置。

过去 4 年,微软向 ChatGPT 开发者 OpenAI 投资了 130 亿美元,拥有独家商业合作权利。而微软靠着 Windows 系统、Office 办公软件等一系列应用,深刻影响着全球数十亿人如何工作,去年从中净获利 727 亿美元,是腾讯的五倍。

ChatGPT 的诞生颠覆了人们对未来工作的想象,但大语言模型存在缺陷,会一本正经胡说八道,给出错误建议。早已出发的微软,希望进一步扩大优势。

在 Build 大会上,纳德拉和微软的高管们展示了一个更宏大的规划:如何在人工智能技术有缺陷的情况下,把它融入到微软所有核心业务中,让更多人和人工智能一起工作。

人主导工作,AI 只是副驾

Copilot(副驾驶)是微软 Build 大会上的关键词。据微软解释,Copilot 是用现代人工智能和大语言模型(如 GPT-4)协助人们完成复杂任务的应用。

2021 年,微软借助 OpenAI 的 GPT-3 开发辅助程序员写代码的 GitHub Copilot,引入了这一概念。ChatGPT 出现后,微软先后把它用到 Dynamics、Office 等应用中。在今年的 Build 大会上,微软把它扩展到 Windows 操作系统和其他核心业务中。

人工智能早已大规模入侵现实世界,每一个社交、电商平台都在用人工智能算法推荐内容和广告、兜售商品。纳德拉上周接受采访说,这是人工智能的自动驾驶时代——人工智能作为一个黑匣子,自主决定最终结果。而微软正在做的事情,代表着人工智能从自动驾驶时代转向了副驾驶时代。

“虽然(人工智能)发展速度快,但方向正确,人类掌握着更多主导权。” 纳德拉说。“让人类参与其中至关重要,可以充分利用技术带来的好处。” 人工智能大模型仍有缺陷的现在,Copilot 也可以尽可能减少 AI 的负面影响。

微软 Office 365 部门负责人施洋(Jared Spataro)把 Copilot 称为一种工作方式:“它嵌入 Word、Excel、PowerPoint、Outlook、Teams 等程序中,与你一起工作。”

他提醒 Copilot 只是辅助人们工作,而不是取代人们。“它会给你一个不完美的想法,你在这个基础上动手”,毕竟 “有时它是对的,有时也会出错。”

在 Build 上,微软副总裁优素福·迈赫迪(Yusuf Mehdi)用 Word 协助起草一份加州的法律合同的 Demo,展示了 Copilot 如何提高工作效率。

用升级后的 Word 打开通用的合同文本后,点击工具栏右方的 Copilot 按钮,会出现供用户输入需求的对话窗口。用户希望知道法律条款是否符合加州的法规时,Copilot 会调用 WestLaw 插件给出分析。用户希望修改特定责任条款时,Copilot 会调用插件阅读文档,找到特定的段落修改,并给出修改的摘要。“这是一种更有力地起草法律合同的方式,” 迈赫迪说。

在 Word 中使用 Copilot 的场景。来自微软。

同样,Copilot 是低成本完善人工智能系统的方法:每个用户一边向微软付钱使用软件,一边帮着人工智能更有效完成自己的工作,也帮着人工智能变得更有用。

微软的首席技术官凯文·斯科特(Kevin Scott)称,过几年,软件没有 Copilot,就会像今天软件不联网那样匪夷所思。

事实上,早就有公司做到了这一点。比如特斯拉的 “全自动驾驶”(Full Self Driving)系统,把辅助驾驶系统卖给车主,让他们给出反馈。过去几年,这套辅助驾驶系统给特斯拉贡献了数十亿美元收入,帮助特斯拉的系统变得更强。

融入现有软件和服务生态,绕开 AI 解决不好的问题

“过去 20 年的科技行业中,我看到的一个错误是,人们经常专注于基础设施,而不是产品。” 斯科特说,他一遍又一遍地提醒微软内部团队这件事。

“技术是伟大的。它让一大堆不可能、不可行或昂贵的事情变得可能、可行、更便宜。但模型不是你的产品。”

ChatGPT 和它背后的大模型,吞掉了海量文本数据,但还有许多具体的事情处理不好。比如它很难给出所有数学题的正确答案。今年 3 月,OpenAI 推出 GPT-4 后不久,便上线了插件系统,借助现有的软件和服务生态,绕开它解决不好的问题。当用户寻求解答复杂的数学题时,可以选择计算知识搜索引擎 Wolfram Alpha 的插件,获取准确答案。

现在微软把 ChatGPT 的插件体系引入所有使用 Copilot 的核心业务中。纳德拉说,开发者只要编写一次插件,就能把它部署到 ChatGPT、Bing、Dynamics 365 Copilot、Microsoft 365 Copilot、Windows Copilot 等产品中,触及数十亿用户。

微软把插件视为桥梁,连接公开数据训练的大语言模型和不同公司的保密数据。当用户向人工智能 Copilot 提出特定场景的问题时,由特定公司开发的插件给出更好的回答。

插件也是微软扩充大模型能力的关键。“你或许经常听到,基础模型很强大,但它不能做所有的事情。”斯科特说,“即使模型本身并不完整或完美,你也可以用插件增强 Copilot 或人工智能应用程序,让它做更多的事情。”

这也是微软建立人工智能生态的尝试,其庞大的用户基础确保了开发插件对开发者有吸引力。

ChatGPT 已经成为一个超级入口,它是最快突破 1 亿月活用户的消费级应用(只花了两个月)。据流量监测网站 SimilarWeb 数据,ChatGPT 4 月全球访问量为 17.6 亿次,仅次于 Google、百度和 Yandex 三家搜索引擎。在 Build 大会上,纳德拉宣布的第一个重要进展,就是把 Bing 作为插件接入 ChatGPT Plus 中,未来开放给所有 ChatGPT 用户。

微软自己的用户数也足够多。据微软发布的一份统计报告,不算盗版用户,全球共有约 15 亿 Windows 操作系统用户、12 亿 Office 办公软件用户。微软和 OpenAI 完全有希望做出来一个人工智能时代的 App Store。迈赫迪说,现在微软和 OpenAI 的系统中已经有 50 多个插件,即将上线的插件有数千个。

如果说微软用 Copilot 改造业务是为了迎上技术革新的步伐,插件则展示了它希望在这次技术革新中向前一步。

斯科特说,这些插件就像是数字世界的执行器,可以增强人工智能系统,使其能够行动。演讲最后,他举了一个自己心目中 “传奇” 工程师如何用一次小的技术更新重塑行业的例子,“现在是我们所有人的时刻”,并用一句 “Do Legendary Shit” 作结语,引起整场观众热烈的回应。

尽管算力紧缺,微软依旧在线部署大模型

把大模型部署到更多场景中需要更多算力。据 The Information 等媒体报道,在全球 60 多个数据中心部署数十万张 GPU 的微软,因为 ChatGPT 掀起的需求激增而面临算力紧缺的局面。

斯科特现在负责协调微软的 GPU 预算和调配。他说这个工作 “既糟糕又痛苦”,因为 GPU 根本不够用。在 Build 上,微软的高管们没有明确透露如何解决未来算力可能更加紧缺的问题。

Google 选择将部分人工智能应用的算力消耗(比如查询和推理)转移至用户的电脑或者手机上。对于个人用户来说,最可靠的计算能力还是手里的手机、家里的电脑。如果你不玩游戏,这些设备中的算力都是冗余的。大模型如果能把这些冗余的计算资源变得有用,不仅可以让数十亿用户分担计算成本,还能推动终端硬件性能继续向前迭代。

在半个月前的 I/O 开发者大会上,Google 发布了新的大语言模型 PaLM2。PaLM2 分好几个版本,参数最少的版本壁虎(Gecko)可以在手机等移动设备上离线运行。

参数是大模型从大量数据中提炼的规律和特征。通常情况,参数越大,大模型的能力越强,消耗的算力会越多。Google 已经做到了用更少的参数实现更好的效果。但一个模型的参数如果少到足以在手机上快速运行,能力会有较大折扣,胡说八道的概率会提升。

微软和 OpenAI 看上去不打算选择这条路。GPT-4 没有参数规模更小的版本、不支持在终端离线运行,OpenAI 跟微软也都没透露将计算转移到本地的相关计划。斯科特在 Build 上介绍 Copilot 的技术体系时,指出微软的基础模型和人工智能基础设施能力,都会通过 Azure 输出。

Copilot 的技术堆栈。来源:微软

按照微软和 OpenAI 目前的设想,运算依然在微软的数据中心完成,用户联网获取答案。但他们预期随着算法进步、硬件迭代,完成一次运算需要的算力会降低。

OpenAI 曾做过一项研究,2020 年训练一个 AlexNet (一种用于图像识别的卷积神经网络)级别的神经网络所需计算量减少为 2012 年的 1/45,同期由摩尔定律代表的硬件效率提升只能带来 11 倍的成本优化。

OpenAI 总裁格雷格·布罗克曼(Greg Brockman)在 Build 上说,GPT-4 现在很贵,并不完全可用,但未来会发生变化,仅过去一年 OpenAI 就把 ChatGPT 的成本降低了 90%。他相信类似的降本效率能持续下去。斯科特也跟着强调,那些今天看上去很贵的事情明天可能就便宜下来。

在微软召开 Build 的同时,它的同行们也发布新进展。

OpenAI 前员工创办的大模型公司 Anthropic 宣布从 Google、Salesforce、Zoom 等投资方手中获得 4.5 亿美元资金。市场将 Anthropic 视为 OpenAI 最强的竞争对手。

Google 宣布将用生成式人工智能改造广告业务。当用户搜索时,Google 的大模型会根据搜索关键词生成有针对性的广告标题。

Adobe 发布了内置 AI 的测试版 Photoshop。用户只需要输入文字,它可以自动修改图片。Adobe 称,这一新功能会在今年下半年在 Photoshop 中全面推广。

没人能准确判断生成式人工智能究竟将如何重塑人类工作。但可以肯定的是,全球最重要的生产力工具平台都在向这个方向全力投入,从不同角度探索,尽快让改变成为现实。

推荐内容