top of page

深入 Microsoft 的 Hey Copilot 与 Windows 11 的 AI Agents

Inside Microsoft's Hey Copilot & AI Agents for Windows 11

科幻小说长久以来的梦想,一直是能与之对话的计算机——不仅仅是发出机械的命令,而是进行真正的对话。一个能理解你的语境、预判你的需求,并代表你采取行动的智能伙伴。随着 Windows 11 最新一波 AI 更新的发布,微软正朝着让这一梦想成为现实的方向迈出最大胆的一步“Hey Copilot”唤醒词、具备上下文感知的 Copilot Vision,以及强大的 Copilot Actions 功能的推出标志着一个根本性的转变:你的操作系统不再只是一个被动的平台,而是一个主动的智能代理。

然而,这一雄心勃勃的未来却笼罩在怀疑的阴云之下。在“Recall”功能因隐私强烈反弹而被迫重新思考之后,微软面临着严重的信任赤字。当它推出能够查看你的屏幕并代表你采取行动的功能时,核心问题不仅在于技术能力,还在于用户同意与控制。本文将深入探讨 Windows 11 的这些新 Copilot 更新,分析它们的工作原理、承诺,以及微软能否在突破性创新与现代计算中不可妥协的隐私要求之间取得平衡。

背景:Windows 中 AI 的演进

Background: The Evolution of AI in Windows

从 Cortana 的承诺到 Copilot 的崛起:简史

许多人会记得 Cortana,这是微软首次尝试在 Windows 10 中集成个人数字助理。Cortana 发布时备受瞩目,旨在与 Siri 和 Google Assistant 竞争,提供主动建议和语音激活控制。然而,其功能仍然有限,集成往往显得肤浅,用户采用率从未达到临界规模。最终,微软将 Cortana 从核心操作系统体验中剥离,将其重新定位为一个不太核心的生产力应用。

生成式 AI 的爆发改变了一切。随着 ChatGPT 的发布以及微软对 OpenAI 的大规模投资,该公司找到了一个全新且更强大的引擎来推动其 AI 雄心。Copilot 诞生了,它首先出现在 Bing 搜索和 Microsoft 365 应用中,随后直接融入 Windows 11 任务栏。与 Cortana 不同,Copilot 由大型语言模型 (LLM) 驱动,能够进行复杂对话、内容生成和摘要。然而,其最初的 Windows 集成仍主要局限于侧边栏,更像是一个能看到操作系统的聊天机器人,而非真正的原生助手。

为什么现在比以往任何时候都更需要深度操作系统集成

当前的 AI 军备竞赛不是关于谁拥有最好的聊天机器人,而是关于谁能创建最无缝、集成度最高且真正有用的 AI 生态系统。对微软而言,终极竞争优势在于操作系统本身。虽然 Google 和 Apple 等竞争对手将 AI 集成到应用和服务中,但微软拥有独特的能力,可以将其嵌入用户日常工作流程的结构中——桌面、文件系统和系统设置。

这种深度集成是最新更新的战略动力。将 Copilot 从被动的侧边栏转变为主动的、具备上下文感知的代理,可以通过语音(“Hey Copilot”)召唤,并能执行多步骤任务(“Copilot Actions”),这是直接为了让 Windows 成为个人计算中最智能、最高效的环境而采取的举措。这里的成功可能会重新定义用户生产力,并创造一个任何应用或网络服务都无法单独复制的强大护城河。

“Hey Copilot”:免手操作、具备上下文感知的革命?

"Hey Copilot": A Hands-Free, Context-Aware Revolution?

“Hey Copilot”与 Copilot Vision 在实践中的工作方式

通过这一新功能,用户只需说“Hey, Copilot”即可激活助手,然后它可以利用“Copilot Vision”来理解当前屏幕上的内容。语音与视觉的融合开启了新一类的交互。例如,在查看最近度假的照片时,你可以问:“Hey Copilot,这张照片是在哪里拍的?”或“帮我起草一封关于这次旅行的邮件发给家人。”

该系统设计为具备上下文感知能力。如果你在设置方面遇到困难,可以要求 Copilot 指导你完成整个过程。如果你打开了一系列图像,可以要求它帮助你撰写简历,融入你视觉作品的主题。这是一种从基于网络的聊天机器人的抽象知识,向理解你即时数字环境的实用助手的转变。通过与 Filmora 和 Manus 等第三方应用的集成,这一功能得到进一步增强,允许 Copilot 直接在这些应用中协助视频编辑和其他创意任务。

隐私困境:云端处理与 Recall 的幽灵

这里存在核心矛盾。为了让 Copilot“看到”你的屏幕并提供相关帮助,这些信息——你的桌面图像——必须被处理。这种处理发生在微软的云服务器上。对于仍对“Recall”功能心存警惕的用户来说,该功能曾提议在本地不断截取用户活动截图,这种基于云的屏幕分析立即引发了警报。

微软似乎吸取了惨痛的教训。该公司主动强调“Hey Copilot”是一项严格的选择性加入功能。它默认未启用,据报道,激活该功能的设置被相对深埋在系统菜单中。这一设计选择是对隐私倡导者的明确让步,也是对用户信任脆弱性的默许承认。通过让激活成为一个深思熟虑且有意识的选择,微软希望给用户一种完全控制的感觉,将这一新功能与导致 Recall 失败的“始终开启”感知区分开来。

Copilot Actions:将你的数字待办事项委托给 AI 代理

Copilot Actions: Delegating Your Digital To-Do List to an AI Agent

Windows 11 中自主任务执行的机制

Copilot Actions 将助手从向导提升为执行者。与其告诉你如何整理照片库,不如直接要求它完成。例如,用户可以提示:“将此文件夹中的照片按年份整理到不同的子文件夹中。”Copilot 随后会分析文件元数据,创建必要的文件夹,并相应移动文件

关键在于,这一切都在后台发生,允许用户继续进行其他工作。它就像将任务委托给一个独立工作的真人助手,并在完成后汇报。这一功能扩展到广泛的任务,从管理系统设置和清理文件到在应用内自动化重复操作。其目标是卸载消耗用户大量时间的繁琐数字家务。

平衡力量与风险:安全风险与缓解措施

授予 AI 对系统的控制权本质上是一个有风险的提议。一个主要担忧是恶意行为者或恶意软件可能劫持 Copilot Actions 框架,利用其权限执行有害命令。如果 AI 可以移动你的文件,那么什么能阻止恶意提示指示它删除它们?

微软声称已预见到这些风险。该公司表示,Copilot Actions 已经过广泛的安全测试,并正在逐步向 Windows Insider 计划推出以收集真实世界的反馈。整个过程设计时考虑了用户监督。用户可以实时监控 AI 的操作,并随时介入停止进程。此外,这些操作在受限或“沙箱”环境中执行,具有明确的权限,以防止 AI 影响关键系统文件或执行未经授权的操作。与语音功能一样,控制仍然至关重要,Copilot Actions 也将是另一个完全可选的功能。

竞争格局:微软 vs. AI 助手市场

Copilot 的新技能与 Siri、Alexa 和 Google Assistant 的对比

多年来,像 Apple 的 Siri、Amazon 的 Alexa 和 Google Assistant 这样的语音助手一直是手机和智能音箱的主流。虽然它们擅长设置计时器、播放音乐和回答一般知识问题,但它们在台式计算机上的实用性一直有限。它们在其母公司生态系统的范围内运行,但缺乏对核心操作系统的深度、细粒度控制。

“Hey Copilot”结合 Copilot Actions 是对这一范式的直接挑战。它不仅仅是一个用于搜索的语音界面,而是整个操作系统的控制层。查看屏幕上下文并操作文件、文件夹和设置的能力,是 Siri 在 Mac 上或 Google Assistant 在 Chromebook 上所能做到的量子飞跃。它将助手从简单的信息检索器转变为真正的生产力伙伴。

微软的独特优势:操作系统本身

这种深度集成是微软的王牌。虽然 Google 正在为网络构建强大的 AI 代理,Apple 正在慢慢将 AI 嵌入其应用,但微软正在将其构建到用户数字世界的基础中。通过控制操作系统,微软可以确保 Copilot 拥有第三方开发人员只能梦想的访问级别和能力。这创造了一个强大的自我强化生态系统:Copilot 在管理 Windows 方面越好,Windows 作为平台就越不可或缺。这一战略旨在使 Windows 体验本身成为 AI 的杀手级应用。

未来展望:通往真正环境操作系统的道路

Future Outlook: The Road to a Truly Ambient OS

专家对未来 1-3 年 AI 代理的预测

在不久的将来,专家预测这些 AI 代理将变得更加主动和个性化。操作系统可能不是等待命令,而是根据你的习惯预判你的需求。例如,它可能会在注意到你下载了几个相关文档后自动建议整理项目文件,或者提示你总结你刚刚打开的长文档。用户操作与 AI 协助之间的界限将开始模糊,创造更流畅、更直观的工作流程。我们还可以期待“代理”能力大幅扩展,处理从根据电子邮件内容预约到管理复杂软件开发工作流程的一切事务。

更广泛的影响:重新定义生产力和用户能动性

这一演变具有深远的影响。一方面,它承诺前所未有的生产力提升,自动化 mundane 事务,让人类用户专注于高层次的创意和战略思考。另一方面,它提出了关于用户能动性和控制的基本问题。当我们将更多任务交给自主代理时,我们是否冒着失去基本技能或过度依赖 AI 的“黑箱”决策的风险?

伦理和社会后果是重大的。当 AI 代理犯错——删除错误的文件或发送不正确的电子邮件时,会发生什么?谁来承担责任?这一新计算范式的成功不仅取决于技术实力,还取决于建立清晰且强大的问责、透明度和用户控制框架。

大胆的一步,前进中的微妙平衡

微软对 Windows 11 的最新更新代表了对个人计算未来的自信且雄心勃勃的愿景。“Hey Copilot”和 Copilot Actions 不仅仅是增量改进;它们是能思考、能看、能行动的操作系统的基础构建块。简化工作流程并解锁新生产力水平的潜力是巨大的。

然而,这一力量被信任的关键问题所笼罩。在后 Recall 时代,每一个请求访问用户屏幕或承诺代表用户采取行动的功能都会受到健康的审视。微软的成功将取决于其驾驭这一微妙平衡的能力——在提供变革性 AI 创新的同时,赋予用户透明、明确和绝对的控制权。技术几乎已经到来;然而,信任仍在构建中。

常见问题 (FAQ)

Frequently Asked Questions (FAQ)

1. “Hey Copilot”与 Cortana 或 Siri 等旧版语音助手的主要区别是什么?

关键区别在于上下文感知和能动性。虽然 Siri 和 Cortana 主要响应直接命令以获取信息或执行简单任务,但“Hey Copilot”使用 Copilot Vision 来理解屏幕上的内容,从而提供相关帮助。结合 Copilot Actions,它还可以自主执行操作系统内的多步骤任务,这超出了传统语音助手的范围。

2. 微软如何应对 Copilot Vision 扫描我屏幕的隐私担忧?

微软的主要策略是使这些功能严格可选。“Hey Copilot”和 Copilot Vision 必须由用户通过系统设置手动启用。通过使其成为“选择性加入”功能,微软确保在没有明确用户同意的情况下,不会将屏幕数据发送到云端进行分析,从而解决了之前“Recall”功能引发的担忧。

3. Copilot Actions 使用安全吗,还是可能被恶意软件劫持?

微软在设计 Copilot Actions 时考虑了安全性。所有任务都在受限环境中运行,以防止访问关键系统文件。用户可以实时监控所有 AI 活动,并有权随时停止进程。虽然没有系统是 100% 免疫威胁的,但这些措施旨在显著降低恶意劫持的风险。

4. 我必须在 Windows 11 中使用“Hey Copilot”和 Copilot Actions 吗?

不,你不必使用。“Hey Copilot”和 Copilot Actions 都是完全可选的选择性加入功能。它们默认禁用,你必须导航到设置菜单才能激活它们,从而完全控制是否要使用这些高级 AI 功能。

5. Copilot Actions 可以自动执行哪些具体类型的任务?

Copilot Actions 可以处理一系列数字杂务。示例包括根据日期或类型等标准整理文件和文件夹、通过单个命令调整多个系统设置、自动化重复数据输入,以及在集成的第三方应用(如视频编辑器)中执行工作流程。

6. 在 Recall 争议之后,微软为什么如此大力推动这些 AI 功能?

微软的策略是确立 Windows 作为集成 AI 的首选平台。虽然 Recall 争议是一个挫折,但该公司认为深度操作系统级 AI 是对抗 Apple 和 Google 的长期关键竞争优势。通过使新功能可选并强调用户控制,它正试图在重建用户信任的同时实现这一愿景。

7. “Hey Copilot”和 Copilot Actions 何时对所有 Windows 11 用户可用?

 
 

免费开始

一款本地优先的AI助手,具备个人知识管理功能

为了获得更好的人工智能体验,

remio 目前仅支持Windows 10+ (x64)M-Chip Mac

在你的大脑里添加一个搜索栏

Ask remio

记住一切

​无需整理

bottom of page