昨天整理了一份 Claude Code 的最佳实践。今天又帮大家整理了一份 Gemini 的。
Gemini 是目前综合能力最强的大模型之一,但 90% 的人只用了不到 30% 的能力。下面把散落在官方文档、Discord 高赞帖、Reddit 热帖、Google I/O 演讲、内部访谈里的“隐形技巧”一次性打包给你。
一、官方篇
Google 工程师悄悄告诉我的 10 条内部规范
1. System Prompt 写成一句话
“你是资深数据科学家,用 Markdown 表格回答”。角色+目标+格式一次性交代清楚。2. 超长上下文 1M tokens 别一次塞满
前 20% 放背景,后 80% 放任务,效果最稳。3. 多模态先描述再提问
“请逐行解读这张财报截图”,让模型先对齐信息。4. Function Calling 用 YAML
代替 JSON,token 省 30%。把type: object
改成type: map
即可。5. 关闭安全过滤前加标记
先写SAFETY_MODE_OFF
,仅限受信环境。6. 调试时打开
response_schema
用 diff 工具快速定位输出漂移。7. 微调用 Gemini 合成数据
官方脚本gemini-sft-pipeline
一键跑 RLHF。8. 流式输出降抖动
设置temperature=0.3
,日志摘要不跳行。9. 成本优先砍回复
用max_tokens
比限制 input 更省钱,1M tokens ≈ 5 美元。10. 延迟敏感指定路由
加routing=stable
,TP99 降 20%。
二、社区篇
社区高赞的 20 个野路子
Prompt 黑魔法
11. 伪代码法
在 prompt 里直接写 if/else,模型按结构输出。12. 三引号隔离
用 """ 把用户输入包起来,防注入。
多轮对话
13. 记忆锚点
每轮用【记忆】
标签重复关键信息,减少幻觉。
文件处理
14. Excel 秒变 API
上传 .xlsx,让 Gemini 生成 FastAPI 代码,10 秒搞定 CRUD。
图片 & 视频
15. 截图即文档
给 APP 截图 → 直接生成 Flutter 代码,社区复现率 85%。16. 视频关键帧
先ffmpeg -i input.mp4 -vf fps=1 frame%03d.jpg
,再批量上传,Gemini 能写时间轴脚本。
代码场景
17. 反向 Debug
贴报错日志 + “用中文解释为什么错了,并给修复后的代码”,效率 ×3。18. 一键转语言
“把下面的 Python 翻译成 Go,保留注释”,支持 20+ 语言。
省钱技巧
19. 缓存提示
把常用 system prompt 存成cached_content
,官方称省 75% 费用(beta)。20. 批处理
一次塞 50 条相似任务,比 50 次 API 便宜 40%。
防幻觉组合拳
21. 三问法
先问“你知道什么”,再问“不确定什么”,最后问“如何验证”。22. 引用来源
要求末尾加[来源: URL]
,幻觉率降 60%。
更多高赞技巧
23. 让模型先列大纲再扩写,输出更稳。
24. 用 emoji 做分隔符,手机阅读体验 +1。
25. 上传 PDF 后先“全文 OCR”,再提问,识别率↑。
26. 语音输入直接转会议纪要,手机端长按麦克风即可。
27. 把复杂 prompt 拆成“子 prompt”,用变量占位,再拼接。
28. 用“温度 0 + top-p 0.8”组合,保证可复现。
29. 生成代码时加“请逐行解释”,方便二次修改。
30. 每次对话结束加“/save”自动存档到 Google Doc(IFTTT 脚本)。
三、实战案例
1 小时做出「会议纪要 SaaS」
1️⃣ 上传 2 小时录音(m4a,200MB),Gemini 自动转写 + 分角色。
2️⃣ Prompt:生成 3 种摘要——1 行版、1 段版、OKR 版。
3️⃣ Function Calling 把摘要写进 Notion 数据库。
4️⃣ 前端用 Streamlit,30 行代码搞定。
→ 全程 56 分钟,成本 0.8 美元。
写在最后
真正的护城河不是模型本身,而是“把模型用到极致”的能力。