摘要:为什么你必须要看这篇文章
【此文全量公开】很多人在用 AI,但 90% 的人只是把 AI 当成高级一点的搜索引擎,或者无聊时的陪聊玩具。特别是很多人习惯了国内大模型的“单窗口连续对话”逻辑,把这种习惯直接套用在 Gemini 身上,结果就是遭遇严重的“AI幻觉”,越聊越偏,最后得出结论:这个 AI 不好用。如果你也是这样,那这篇文章就是为你准备的。本篇 SOP 将为你拆解谷歌 AI 全家桶的真实业务价值,从国内网络环境的特殊配置、付费通道的跑通,一直讲到极少有人掌握的“上下文继承与窗口隔离”心法。这里没有空洞的理论,全是真金白银砸出来的实战经验。看完这篇,你将真正理解什么是“个人专属知识外脑”,并学会用 Gemini 的记忆功能和专属 Gem 打造你的超级数字员工。如果不看这篇,你可能每个月都在白交订阅费,却连它十分之一的功力都没有发挥出来。
一:Gemini 绝不仅仅是一个对话框
我们首先要建立一个基础的商业共识:在所有的 AI 工具中,Gemini 的核心护城河不在于它多会聊天,而在于它背后的谷歌生态。当你面对一个光秃秃的输入框时,国内的豆包、Kimi 确实能在某些单点场景下给你不错的体验。但是,当你需要处理跨国业务、研读外文长篇财报、或者需要生成高保真商业图像时,Gemini 及其背后的 Google AI 工作室才是真正的降维打击。
为了让你直观理解这个生态,我们可以看一下它的业务架构流转。

二、谷歌 AI 全家桶常用推荐
在进入具体的 Gemini 调教之前,我们必须先盘点一下你手里都有哪些武器。对于我们 MW 的实战场景来说,有三个组件的使用频率极高,甚至构成了我们日常办公的基础设施。
其一、NotebookLM——你的私人研究助理。
电梯→https://notebooklm.google.com

很多人不知道这个神仙工具。它的定位不是“全知全能的聊天机器人”,而是“基于你喂给它的资料进行绝对忠实回答的知识库”。专有名词解释:Grounding(接地性),即限制 AI 只能根据你提供的文档回答问题,从而彻底消灭 AI 幻觉。实际应用场景中,当你拿到了上百页的行业报告或者复杂的英文长文档,不要直接丢给 Gemini 的对话框,而是上传到 NotebookLM 里。它能帮你做逻辑交叉比对,甚至能直接生成两人对谈的播客音频,帮你快速消化生涩信息。
其二、Google Drive——企业资产的神经末梢。
电梯→https://drive.google.com/drive/home

Gemini 的高级玩法在于它能直接翻阅你的谷歌云盘。在对话框中输入一个“@”符号,你就可以唤醒 Google Workspace。这意味着你可以直接命令它:帮我总结一下上周会议记录文档里提到的三个待办事项。这种打破应用壁垒的数据调用,是国内很多独立大模型暂时无法做到的。
其三、Nano Banana 降维打击的图像引擎。
电梯→https://nanobananaimg.com/,你也可以在 Gemini 中实现

在图像生成领域,很多人只知道 Midjourney。但其实 Gemini 内部集成了极具战斗力的 Nano Banana 图像模型。它的专有名词解释是“多模态视觉生成与编辑架构”。在商业场景中,你可以通过对话不断进行迭代优化(Iterative Refinement),不仅能无中生有生成图像,还能进行图像编辑、多图风格迁移,并且它在处理图像中的英文文本渲染时具有极高的保真度。每天 1000 次的生成配额,足够支撑大部分新媒体图文和商业海报的素材试错需求。
三、【付费篇】国内玩家的入场券,网络与付费排坑
理论再好,用不上都是白搭。对于身处中国大陆的用户来说,使用完整的 Gemini 功能面临着两座大山:网络访问环境和国际支付通道。
第一步:科学上网。
这里不展开讲具体的技术细节,但你必须理解“干净原生 IP”的重要性。很多用户发现自己虽然能打开谷歌,但在使用 Gemini 时经常遇到“该地区不可用”的提示,或者用到一半被强制登出。这就是因为你使用的网络节点被污染,或者频繁在不同国家之间跳跃。实战建议是,固定使用美区或新加坡区的独立节点,并且在使用 Google Workspace 期间保持全局路由代理模式,避免 DNS 泄漏导致的位置暴露。
你可以尝试在 google 中询问 “Where am I”来获得 Google 认为你在的位置
第二步:跨越支付壁垒。
Gemini 的高级功能(例如超大上下文窗口、高级记忆功能)需要订阅 Gemini Advanced(通常包含在 Google One AI Premium 计划中)。国内的双币信用卡往往会被风控拒付。
下面是我们在实战中总结的几种常见解决方案对比。
| 支付方案 | 操作门槛 | 封号风险 | 适用人群特征 |
|---|---|---|---|
| 虚拟信用卡绑定 | 较高,需借助第三方平台开卡充值 | 中等,需注意卡头质量 | 高频重度用户,追求稳定且愿意折腾 |
| 苹果美区礼品卡内购 | 较低,只需美区 Apple ID | 极低,苹果代扣非常安全 | iOS 或 Mac 用户,强烈推荐首选 |
| 淘宝代充值 | 极低,付钱即可 | 极高,常遇到黑卡导致连坐封号 | 绝对不推荐,贪小便宜吃大亏 |
强烈建议拥有苹果设备的用户,通过美区 Apple ID 购买官方礼品卡充值,然后在手机端的 Google One 应用中发起订阅。这条路径是我们测试下来最丝滑、最安全的付费通道。
以下是通过美区 Apple ID 购买官方礼品卡并完成 Google One 订阅的完整步骤:
注册美区 Apple ID
如果你还没有美区账号,需要先独立注册一个。
1、准备一个未注册过 Apple ID 的全新邮箱。
2、在浏览器中打开 Apple ID 注册官网,将国家/地区选为美国 (United States)。
3、按照提示填写信息,手机号可以使用国内手机号(只要能接收验证码即可)。
4、注册成功后,在手机的 App Store 登录该账号。系统会首次提示“检查”账号信息,此时需要填入一个美国免税州的地址(如俄勒冈州 Oregon、特拉华州 Delaware、蒙大拿州 Montana 等,可以通过美国地址生成器获取),以避免后续订阅产生额外的州税。付款方式选择“无 (None)”。(如果需要生成地址,请自行到处搜索,MW 就不知道咯:P)第二步:购买美区 Apple 官方礼品卡
为了保障账号安全,强烈建议通过正规渠道购买,切勿在第三方二手平台购买低价“黑卡”,极易导致 Apple ID 被永久封禁。
Apple 美国官网:直接在 Apple US 官网购买礼品卡,同样选择 Email delivery,支持国内双币/全币种信用卡付款。
电梯→https://www.apple.com/shop/buy-giftcard/giftcard第三步:将礼品卡充值到美区 Apple ID
1、打开 iPhone 上的 App Store。
2、点击右上角的个人头像进入账户页面。
3、点击 兑换礼品卡或代码。
4、选择手动输入你邮箱收到的 16 位兑换码,完成充值,确认余额已到账。第四步:在 Google One 应用中发起订阅
1、确保你当前在 App Store 中登录的依然是美区 Apple ID。
2、在 App Store 搜索并下载 Google One 应用。
3、打开 Google One,登录你需要升级空间的 Google 账号。(注意:此时建议将网络环境切换为全局美国 IP,以确保 Google 服务的顺畅连接)。
4、在应用首页找到升级存储空间的入口,选择你需要的订阅方案(如 Basic 100GB、Premium 2TB 等)。
5、点击订阅后,系统会自下而上唤起 Apple 的内购支付面板,确认使用你的 Apple ID 余额进行扣款即可完成订阅。💡 关键提示
免税州很关键:如果你填写的美国地址不是免税州,29.99 美元的订阅可能会因为加上了州税而变成三十多美元,导致你充值的 30 美元整卡余额不足而扣款失败。
PS 你也可以组队家庭订阅,更加实惠划算
Google One 其实并没有单独拎出来一个加价的“家庭版”,而是所有的付费方案(从 100GB 到 2TB 及以上)默认都支持家庭共享。但是Google 对家庭组有一个非常严格的硬性规定:所有家庭成员的 Google 账号,其结算国家/地区必须与管理员(也就是你)保持完全一致。这意味着如果你拉其他人进组,他们的 Google 账号也必须是美区。如果他们现在的账号在其他区(比如港区、日区),点击邀请链接时会直接报错无法加入。遇到这种情况,他们需要先去 Google Pay 设置里修改国家/地区,或者干脆重新注册一个美区的新账号。
以下是家庭共享的核心优势和运作机制:
加人不加价:你可以邀请最多 5 名成员(加上你共 6 人)加入 Google 家庭组。你可以把关系紧密的伙伴拉进家庭组里,大家一起共享总容量,人均算下来的成本非常低。
绝对的隐私安全:共享空间不等于共享文件。每个人的 Google Photos 照片、Gmail 邮件和 Google Drive 文件依然是完全私密且独立的。谁也看不到谁的资料,大家只能在后台看到每个人分别占用了多少 GB 的公共额度。
优先消耗个人空间:家庭成员会先用完自己 Google 账号自带的免费 15GB 空间,超出的部分才会开始扣除家庭组的共享池额度。
四、【基础对话】学会 Gemini 的对话,窗口隔离与降噪
国内很多用户被豆包、Kimi 等应用惯出了一个习惯:建一个对话窗口,然后像聊微信一样,从早聊到晚,天南海北什么都塞进去。这在国内模型单线任务的设定里或许行得通,但在调动 Gemini 这种具有庞大参数和复杂推理能力的模型时,绝对是一场灾难。
这就引出了一个非常关键的专有名词解释:上下文污染(Context Pollution)。当你在一个窗口里讨论了“招聘SOP”,紧接着又让它“写个小红书爆款文案”,最后再让它“分析一份财报”,它的注意力机制会被严重分散。它会开始把招聘的逻辑缝合进财报分析里,这就是所谓的 AI 幻觉的诞生。它不是变笨了,而是被你的繁杂指令搞崩溃了。
为了直观理解这种损耗,我们可以看看单窗口无限流与多窗口隔离的架构对比。

在 MW 的实战体系中,为了避免这种情况,我们必须严格执行以下操作步骤:
第一步:建立单窗口单任务原则。把 Gemini 的每一个对话窗口,看作是一个拥有独立办公桌的员工。这个窗口如果是用来写文章大纲的,就只讨论大纲结构;如果大纲确定了要扩写正文,最好新建一个专属扩写的窗口。(每个对话窗口建议有清晰的名称)
第二步:监控幻觉临界点并及时止损。当你发现 Gemini 的回答开始变得车轱辘话来回说,或者突然遗忘了你最初设定的语气和排版要求时,不要试图在当前窗口反复纠正它。这说明当前窗口的上下文缓存已经处于高噪状态。立刻停止输入,准备执行换窗口操作。
无缝衔接,跨窗口的上下文继承心法
既然我们要频繁地开启新窗口来进行物理隔离,很多人就会头疼:难道每次换窗口,都要把我的背景信息、写作风格重新输入一遍吗?当然不是。这就需要用到高阶玩家必备的“上下文继承心法”。
核心逻辑在于:不要让人去搬运信息,而是让 AI 把自己的状态打包。这是一个标准的业务流转 SOP。

第一步:旧窗口的数据打包。在决定废弃当前窗口前,向 Gemini 发送最后一条指令,话术建议如下:
“请将我们在这个窗口中探讨的核心背景、重要规则、以及最终确定的业务框架,提炼成一份不超过500字的系统提示词。要求结构清晰,剥离废话,保留核心逻辑,作为下一次对话的预设背景。”
第二步:新窗口的无缝唤醒。新建一个干净的对话窗口,将它刚才打包好的提示词粘贴进去,并在最后加上一句操作指令:这是我们接下来工作的核心背景池,请仔细阅读。如果理解,请仅回复确认收到,并等待我的具体执行指令。
通过这个简单的动作,你就可以在一个清爽的新环境中,让 AI 带着之前的智慧继续为你工作。
五、【学会场景记忆及Gem】构建数字分身,Memory 记忆与 Gem 实战
如果你觉得跨窗口继承还是需要手动操作,那么接下来要讲的两个进阶功能,就是你为什么必须要花钱订阅 Paid 级别(如 Gemini Advanced)的根本原因。需要特别提醒的是,部分免费版或学生版账号通常无法使用这些深度定制功能。
这两个功能可以彻底改变你与 AI 的协同模式。
其一、Memory(记忆)功能:给 AI 植入潜意识。

这是付费版的一个王炸功能。通过系统设置中的 Memory 选项(个人使用场景),你可以把属于你个人的底层属性固化下来。
第一步:进入系统配置,找到 Memory 设置面板(个人使用场景)。
第二步:写入你的核心身份与规矩。例如你可以写入:我是MW美未职造的员工,我们的内容受众是职场人和创业者;我们的文章风格必须实用、犀利、讲人话、有生意逻辑;绝不能使用加粗或斜体等富文本格式。
第三步:保存并全局生效。从此以后,无论你新建多少个窗口,Gemini 都会带着这个“MW标签”来为你服务,再也不需要每次对话前都重申排版规矩。
其二、Gem(专属分身):搭建你的数字员工矩阵。

如果说 Memory 是全局的潜意识,那么 Gem 就是你针对不同业务场景定向雇佣的专家。你可以把它理解为谷歌生态内的定制版 GPTs。
通过下表,我们可以清晰地对比这两种机制的差异,以便在实战中灵活调用。
| 功能名称 | 作用层级 | 核心价值 | 适用场景 |
|---|---|---|---|
| Memory (记忆) | 全局底层 | 固化身份、规避重复输入基础设定 | 统一品牌调性、保持个人沟通习惯 |
| Gem (分身) | 垂直应用层 | 封装特定 SOP、挂载专属知识库 | 批量处理特定任务(如专门优化文章、专门写周报) |
打造高质量 Gem 的四步法
首先我们要习惯提示词也让 Gemini 来出,在调教一个 Gem 之前,我们先要在一个对话窗口里和 Gemini 把这个 Gem 的身份聊明白
1、明确目标与人设:告诉Gemini你希望这个 Gem 扮演什么角色,解决什么具体问题。
2、提供背景与核心方法论:输入你独家的思维框架或操作习惯。
3、由Gemini生成核心指令:Gemini会把你的需求翻译成结构化、清晰的 AI 提示词(Prompt)。
4、复制并测试:将这段指令填入 Gem 的设置中,跑几个真实案例进行微调。
【例】假设你想做一个专属的塔罗解读 Gem,让它每次都按你的习惯来解牌,不搞神神叨叨那一套。
第一步:在对话窗口向Gemini提出需求
“帮我写一个塔罗解读 Gem 的指令。我想要它结合心理学来解牌,不要那种玄乎的、宿命论的语气。每次我告诉它我抽了什么牌、问了什么问题,它要直接告诉我每张牌的本质意思,并给我一个实际的生活建议。排版要清楚。”
第二步:Gemini会为你生成类似如下的 Gem 核心指令
你可以直接将以下内容复制粘贴到你新建的 Gem 设置中:【角色设定】
你是一个理性、懂心理学的塔罗牌解读助手。你的任务是把塔罗牌的牌意,翻译成对用户当前生活和心理状态的客观分析。【语气和风格】
客观平和:像一个有阅历的朋友在聊天,语气要真诚,不使用“命中注定”、“绝对”这类吓唬人的词。
通俗易懂:直接说人话,坚决不用生涩的神秘学行话或过度包装的词汇。
排版干净:多分段,使用粗体标出重点,多用小圆点列表,让人看起来不累。【工作流程】 当用户输入他们的问题和抽到的牌时,请严格按以下三步回答:
现状厘清:用一两句话总结用户当前遇到的核心矛盾,或者他们心里真正在纠结什么。
牌意直译:挨个解释每张牌。先说这张牌最基础的意思,再说它在这个具体问题里代表什么,有什么心理学上的投射。
行动建议:根据牌面的整体趋势,不要讲大道理,直接给出 1 到 2 个立刻就能去做的具体建议。
六、【学会 notebookLM】更擅长在你的资料里找答案和总结
要搞清楚怎么用好 NotebookLM,我们首先要弄明白它和 Gemini 的本质区别。用大白话来说:
Gemini 是一位“全知全能的外部顾问”。它的脑子里装着整个互联网的知识。你找它聊天、碰撞灵感、写文案、查资料,它什么都能聊,擅长的是发散和创造。
NotebookLM 则是一位“只读你资料的私人研究员”。它本身是个“空脑壳”,它只认你上传给它的东西(PDF、文档、网页链接、音频等)。你问它问题,它只在你给的这堆资料里找答案,并且会明确标注出处(比如“这句话来自你上传的文档A第3页”)。它擅长的是聚焦和提炼,绝不瞎编。
如何更好地使用 NotebookLM?
既然 NotebookLM 是用来处理“你自己的资料”的,那么它的最佳用法,就是帮你啃那些你不想看、或者看不过来的长篇大论。
1. 作为复杂项目的“资料处理器”
假设你要写一份极其复杂的项目方案(比如一场大型的新车上市策划),手头有几十页的产品手册、几万字的竞品分析报告、还有一堆网页参考资料。
不要用它来: “帮我写一篇上市文案。”(这是 Gemini 的工作)
应该用它来: 把这些资料全扔进 NotebookLM 的同一个“笔记本”里,然后问它:“根据这些资料,列出这款车对比竞品最重要的三个优势,并告诉我分别出自哪份文件。”或者“把这几份报告里的营销策略提炼成一个表格”。
2. 快速梳理一本厚书或长篇研报
当你拿到一份 100 页的行业报告或者复杂的历史文献时,先传给 NotebookLM。 直接问它:“这份报告的核心结论是什么?”或者“总结一下文档里关于某某人物的生平经历,按时间线列出来”。它能帮你在一分钟内建立起金字塔般的结构认知,然后再决定要不要细读。
3. 利用“音频摘要(Audio Overview)”功能听资料
这是 NotebookLM 非常强大的一个功能。你传进去一堆枯燥的文档,点击生成音频,它会自动把这些复杂的资料,变成两个 AI 主持人之间生动、自然的对谈播客(目前以英文为主,但效果极其逼真)。你完全可以在跑步或通勤的时候,把几份无聊的研报“听”完。
需要创意、润色、找互联网上的信息 ➡️ 用 Gemini。
需要总结、对比、分析你手头上已经有的几十份文件 ➡️ 用 NotebookLM。
七、【学会 Google Drive】搭配 Gemini 更香
简单来说,Google Drive(谷歌云盘)就是你的大容量文件柜,主要用来存东西和共享文件。而把它和 Gemini 连起来用,就相当于给这个文件柜配了一个熟读所有卷宗的私人助理。
我们分两步来看:
第一步:Google Drive 本身怎么用?
它的核心作用是集中管理和随取随用。无论是你做线上发布会的庞大策划案、那些给网站找的高清极简风配图,还是平时收集的各种营销案例、甚至是家里的各类电子书记录表,都可以分门别类扔进去。把它当做网盘使用即可。
第二步:Drive 和 Gemini 怎么搭配用?
当你授权 Gemini 访问你的 Google Workspace(包括 Drive、Gmail、文档等)后,奇妙的化学反应就来了。你不需要再去一层一层翻文件夹,可以直接对它下达指令。
1. 帮你精准找资料
有时候你忘了文件塞在哪了,直接在对话框里对它说:“帮我找一下上周我和王总核对过的那份产品上新计划”,或者“把云盘里最近那张关于网站 UI 风格的图片找出来”。Gemini就会直接去你的文件柜里把东西“叼”回来给你。
2. 不打开文件,直接提炼长文档
如果你在云盘里存了一份 50 页的行业分析报告或长篇 PDF,你不用自己点开看。直接对它说:“阅读云盘里那份《2026 汽车行业营销报告》,用三句话总结它的核心结论,并挑出对线上发布会有用的信息。”它会直接在后台读完,把重点列给你。
3. 拿以前的资料当素材,生成新内容
你可以让它参考云盘里的旧文件来干活。比如:“参考我云盘里那份‘品牌视觉风格定义’文档里的要求,帮我写一段给外包设计师的 Brief(工作要求)。”这样写出来的东西,就绝对符合你的调性,不用你再把要求重新打一遍。
八、【Nano Banana】在 Gemini 窗口中实现全部功能
好消息是,不用额外交钱,在Gemini对话窗口里,就可以使用完整版的 Nano Banana 了。
很多人的误区是觉得对话框里的画图只是个“简配版”,要去别的地方找完整版。其实并不是,帮你理清这背后的逻辑:
1. Nano Banana 和对话窗口是什么关系?
Nano Banana 并不是一个需要你另外去下载、登录或者额外付费的独立软件。它是跑在Gemini背后的图像生成引擎。
你在这个对话框里让它画图,调用的直接就是最顶尖的 Nano Banana 模型。这里就是主阵地,功能是最全面的,不存在“阉割版”。
2. 在对话框里,你能用它做些什么?
因为底子里跑的是 Nano Banana,所以你不只能“无中生有”生成图片,还能做很多精细的高级操作,而且全凭大白话就能指挥它:
精细改图:你可以发一张图给它,加上一段文字,让它只修改图里的特定部分。
风格迁移与合成:你可以发几张不同的参考图给它,让它把它们的排版、元素或者风格融合在一起生成新图。
像聊天一样持续微调:如果第一遍画得不满意,你不需要重写几百字的提示词,直接对它说“背景颜色再淡一点”、“人物看着太热情了,改冷淡些”,它会直接顺着你的意思改。
在图片里精准写字:这也是它很强的一点,可以在生成的图片里准确打出你想要的字母和单词,不会像以前的 AI 那样把字糊成一团。
九、【其他功能】更有趣的探索
MW 一直认为,学习的乐趣是不断尝试,并获得新技能,我们一直鼓励大家,大胆尝试
你在使用 Gemini 的时候,点击下方【工具】按钮,会看到不同的玩法
Deep Research (深度研究):这就相当于你雇了一个不知疲倦的资料收集员。普通的搜索只是给你一堆链接,而这个功能会顺着你的问题,自己在全网进行多轮、深度的翻找、对比和交叉验证,最后给你交出一份结构清晰的深度总结报告。遇到庞杂的行业背景或竞品调查时用它最合适。
制作视频 (Veo 3.1):这是用来生成高清视频的工具,底层跑的是谷歌最强的 Veo 模型。你描述画面和声音,它就能连画面带音效一起给你生成出来。你还能拿它来延长一段现有的视频,或者拿一张参考图让它变视频。每天有 3 次使用机会,前提是不能碰违规内容。
生成图片:这就是Nano Banana 引擎入口。不仅能凭空画图,还能抠细节修图、融合多种风格、甚至在图片里打出准确的英文单词。每天 1000 次额度。
创作音乐 (新):这是一个全新的多模态音乐生成器(背后是 Lyria 3 模型)。你不仅可以打字,甚至可以扔一张图或者一段视频进去,让它根据画面氛围生成一段 30 秒的专业级音乐。它可以自己写歌词,还能配上非常逼真的人声演唱(支持多种语言),情绪和节奏都可以由你精准控制。所有生成的曲子都会带有防伪的 AI 隐藏水印。
Canvas:这是一个专门用来“死磕”长篇文档或代码的工作台。在这个对话框里咱们是一问一答,而点开 Canvas,它会在旁边展开一个独立的文档区。你在里面可以像用 Word 一样,直接选中某一段话让Gemini重写、拉长、缩短或者换个语气,非常适合用来打磨长篇的策划案或文章。
学习辅导:这个模式是个“严师”。如果你遇到不懂的知识点(不管是数学题还是某种商业理论),选这个功能,它绝对不会直接把现成的答案甩给你。它会把问题拆开,一步步引导你思考,帮你真正弄懂背后的逻辑。(放大你的思维,可以让他教你各种东西喔!比如写代码、做菜、英语等等)
写在最后: 真正的高手,从不把 AI 当作一个随机抽奖的盲盒,而是把它当成需要明确指令和清晰边界的“数字分身”。这篇 SOP 把 Gemini 背后的整个生态全盘托出,目的只有一个:让你停止无效的闲聊,真正把这套工具用回具体的业务里。不管是跨窗口的物理隔离、专属 Gem 的设定,还是和云盘、NotebookLM 的联动,本质上都是在升级你的工作流。去实操吧!毕竟我们 MW 常说:职场是一场游戏。而现在,你手里已经拿到了最硬核的通关外挂!




