AI重塑商业系列（4）

2025-10-22hzqiuxm阅读(179)

是不是值得做？

AI智能化落地，大致有两条主线：

基于已有产品或业务链路，用AI替代人力，实现降本；
基于实际业务场景，构建新产品或新链路，实现增效。

前文中，我们已经完成了需求挖掘，找出了有智能化潜力的业务部分。现在问题来了：这些改造，值不值得做？

企业的本质是逐利，所有AI智能化的投入都要回到一个最核心的问题上：投入产出比怎么样？

智能化带来的是一套“新成本结构”：

一次性成本：设计、开发、测试；
持续性成本：模型调用费用（token）、维护、数据更新等；

它带来的价值则主要是：

成本节约：替代人力、降低流程冗余；
效能提升：缩短链路、提升响应、增强体验。

所以，只有当智能化带来的价值显著高于成本时，它才值得做。

AI产品价值评估整体可以分为两步：

评估原有流程的成本；
评估AI智能化后的新增价值。

本文聚焦第一步：如何系统评估现有业务的原始成本？

三层原始成本评估模型

我推荐使用一个三层评估模型，从单体 → 公司 → 市场，逐层拉升评估视角，既能看到局部可替代性，也能预测全局的ROI。

第一层：单体视角——评估一环成本

单体评估是指对流程中某一个环节、岗位或任务的单位成本进行测算。它是判断“AI是否具备替代价值”的第一步。

如果AI的一次使用成本，高于当前人力成本，那么从经济上来说，没必要改造。

这里举个智能简历匹配的例子，假设只考虑简历和JD的AI化匹配。

成本结构包括：每次使用大模型token成本，设计开发测试的人力成本，训练和数据成本（此处暂忽略）。

Token成本：根据调用的大模型价格表进行估算就行，每个大模型厂商都有详细的计算方式。我们以DeepSeek为例，不考虑折扣和优惠，不考虑缓存命中等情况。

假设我们匹配过程需要进行基本介绍，职位分析，匹配度分析，简历改成输出这四个步骤。我经过模拟统计，平均输入 token 为 4000，输出为 2000，计算后成本约为 0.023元/次。

按照“常识十倍法”粗评（即即便成本乘以10倍也远低于人工），0.23元/次仍远低于市场上300元/份的人工价格，这一阶段评估通过。

设计开发测试人力成本：如果需求量太少，导致单次的开发成本无法进行有效分摊，那依然没有切换的经济价值。

我们以最基础的智能体开发为例(不考虑系统集成，多轮对话，知识库构建，微调等)，根据经验大约需要 7人天，按2万元月薪估算，总成本约 6500元。

因为不设计微调，训练和数据成本暂不考虑，所以现在成本结构：一次性的开发成本(6500元)+单次使用成本(0.2元)。

那这块能等到收益是多少？我们需要通过相应的服务在市场的公开价格为基准进行评估。

市场上人工成本平均300元每份，以NovaCV产品为例子，AI化的价格每份大约1元。

目前开发成本是6500元，每份相比AI带来的价格差为0.8元。意味着我们需要完成8125次服务才能绘本。

如果你现在使用人工服务的，每条成本节约299.8元，只要22次就能完成技术成本摊销了。

所以一个项目要不要做智能化核心评估依据在于：单次使用是否大幅度提升效率，是否有足够的使用量摊销开发成本。

第二层：公司视角——评估整体ROI

单体可替代不代表一定值得做，还要看公司级别是否划算。

假设你在一个提供修改简历服务的公司，每月有200分修改简历的需求，请问值不值得做？

场景一：小型需求

假设公司每月处理200份简历：

人工总成本：200 × 300 = 6万元
AI token 成本：200 × 0.2 = 40元
智能体开发成本：6500元

一个月直接回本，这种情况果断上AI。

场景二：大型系统替换

若企业希望开发一整套智能系统：

开发成本：30人月 × 2万元 = 60万元
Token调用：3000次/月 × 0.2元 = 600元
保留部分人力：约2万元/月
总月成本 = 20600元

对比人工60万 → 改造后成本2万出头，每月节省近4万元，预计 15个月回本。这个周期是可以接受的，特别是在长期规划中。

第三层：市场视角——评估规模空间

从市场层面评估，是为了判断是否值得作为一个独立产品线来投入。

整体上我们需要考虑的有：市场定价、竞争态势，市场成本。

简历这个产品市场规模有限，不适合做市场评估的例子，我们换成私域智能体这个市场。

一般大模型进入一个细分行业，我们是很难拿到一个完整的行业分析报告的。我们可以通过费米估算法，快速做一个规模测算：

方法一：基于企业招聘

首先我们根据2019-2024年企业发布私域相关岗位薪酬分布，可以证明企业招募一名私域工作者，一年将要付出10万左右成本。

接着我们可以从企业微信的真实企业数量从侧面推算：2022年企业微信真是企业1200w家，按照只有30%的比例算，有360w家，每家1名运营人员，年成本12w计算。总成本在4320亿左右，按照AI替代率40%算，且成本要求控制在原来20%计算，市场规模大约为345.6亿。

关键评估步骤如下：

企业年均投入：1个私域岗位 ≈ 10万元
企业数量：企业微信真实企业数 1200 万 × 30% = 360 万
年总成本：360 万 × 12 万 = 4320 亿元
假设AI替代率 40%，目标成本为原来的 20%
可释放市场规模 ≈ 345.6亿元

方法二：基于私域日活

我们再从私域日活来测算下市场规模。私域日活5亿，按照常规C端逻辑日活大概是月活60%计算，则月活12.5亿。按照1:1000服务比例算，运营人员大概是125w人，总成本1500亿。还是按照40%替换率，成本控制在20%算，市场规模约240亿。

这个评估步骤如下：

私域日活：5亿 → 月活 ≈ 12.5 亿
运营人员按 1:1000 配置 → 125 万人
年成本：125 万 × 12 万 = 1500 亿元
替代率40%，成本控制20% → 市场规模 ≈ 240亿元

经过多种方式预估测算，可以说中性悲观预测私域AI智能体的市场规模在240-340亿左右。再叠加未来3年内的增长态势，市场规模应该在500-700亿左右。

假设一家公司哪怕只吃下3%的市场份额，年营收也可能达10亿级别。

这就回到产品投资的基本逻辑：

市场足够大 + 替代效率足够高 + 使用量足够稳定 → 才值得产品化投入。

小结：三层评估还原成本本质

在进行AI产品立项前，必须先穿透现有流程的“成本底盘”，逐层评估是否值得替换：

单体层面：AI的单次调用成本是否显著低于人工？
公司层面：业务量是否能有效摊销开发与维护成本？
市场层面：是否具备可规模化放大的潜力？

只有这三关都大致打通，AI改造才有“现实价值”，而非空中楼阁。

如果你还在犹豫AI值不值得做，建议回到成本结构这个“第一性原理”上来，用冷静的财务逻辑，为热情的AI落地，打下一副坚实的骨架。

AI重塑商业系列（3）

2025-08-29hzqiuxm阅读(431)

03 AI需求挖掘场景就这么拆

MAIR模型回顾

MAIR 是一套专门用来挖掘 AI 能介入的好场景的思考框架，适用于任何想把 AI 应用到实际产品或工作流程中的人。

它的核心思路是四步走：

M - Map（梳理流程）
把一件事的完整流程拆得足够细，比如做内容、处理客服、写报告，从头到尾列出来。
A - Access（识别脑力劳动）
在这些流程中，找出哪些步骤需要用脑子，比如判断、分析、写作、决策——这才是AI能帮忙的地方。
I - Identify（评估值不值）
判断这些脑力劳动到底有没有“被AI替代”的价值，比如难不难、花不花时间、值不值钱。
R - Replace（构造替代方案）
最后，试着用提示词+大模型去验证，AI能不能胜任，效果如何，甚至构建一个AI流程原型。

案例解析

最近小红书、小绿书上关于治愈图文的公众号或文章非常火，我们就举制作一个治愈图文的小视频这样的产品作为例子。

我们拆解下从0到1发布一个这样的小视频业务流程是怎么样的：有选题、文案撰写、视频制作、视频发布、数据分析这几个大流程组成。

要注意，我们的目标是要按照最小颗粒度拆解，所以我们以选题为例，还要继续拆。

比如看媒体平台当前社会热点，从热点事件判断是不是有矛盾和人群心理问题，有的话是否适合进行选题，适合的话选用什么场景最好等等。

除了媒体平台，是不是可以让用户的热点评论来做选题，根据用户的评论反馈判断最多用户最近是在工作、生活还是情感上遇到了问题，然后选择一个最佳场景进行选题。

如果还有其他的选题方式，也只要做类似拆分即可，越细越好。对文案撰写，视频制作，视频发布等其他几个大环节也如法炮制，假设拆完后我们得到了下面这么一个表格。

注：由于拆解较细内容较多，这里有些维度的拆解内容就省略了。

接下来，我们进入 MAIR 模型的第二步：在这些拆分好的步骤中，标注出哪些动作属于“脑力劳动”。比如：

在选题阶段，判断热点是否具有心理共鸣、匹配合适场景就是典型的脑力劳动；
在文案阶段，提炼情绪关键词、构建故事性结构需要分析力与表达力；
在视频制作阶段，构图、配乐风格选择也依赖创意思考与审美判断；
发布和数据分析阶段，虽然包含很多技术操作，但复盘观众留言中传达出的情绪趋势依然属于较深的认知判断。

然后我们根据“难度 × 时长”维度评估每项脑力劳动的价值：

比如，选题判断虽然每次不长，但一旦判断偏差，整体方向就错了，属于高价值高敏感区域；文案撰写耗时较多且对共鸣有决定性影响，也具备被AI辅助甚至部分替代的潜力；而像“生成封面图”这类视觉工作，如果审美要求不特别高，也许可以直接交由AI图像工具快速输出。

最后，我们尝试设计编写好提示词，搭建好工作流程去测试可替代的环节。

我这里选用了扣子平台，花了半个多小时，完成了一个简单的demo。

工作流根据用户的评论，完成意图识别，情感分析，场景设计，插画绘制，字幕配音，视频制作。

下面的视频是根据用户评论内容："已经单身好多年了，夜深人静时候就感到孤独。"来生成的。

当然最后的视频效果还有很多可提升的地方(我们重点关注的是需求挖掘与验证流程)，但是确实可以迅速帮助我们来验证AI产品需求挖掘后的构建。

结语

在这节案例中，我们借助 MAIR 模型，从一个看似简单的“治愈系小视频”出发，逐步拆解出它背后的完整业务流程与脑力节点。

通过对用户评论的洞察，我们成功识别出情绪线索与表达意图；再结合AI在语言、图像、声音等多模态能力，我们搭建出一套从意图识别到视频成品的自动化创作工作流。

这一过程中，我们不仅验证了 MAIR 模型的实用性，更重要的是相信你也意识到了：这正是构建AI产品的核心价值，也是你作为构建者与使用者的分水岭。

你教AI读懂流程，它便能陪你共创作品；你拆解得越深，AI飞得越高。

AI重塑商业系列（2）

2025-08-08hzqiuxm阅读(497)

开篇引子：不是AI做不到，而是你没想到

在AI技术突飞猛进的今天，真正拉开人与人差距的，不再是“你会不会用AI”，而是“你能不能构建AI产品”。

如果说第一波AI浪潮是工具红利，人人可用；那么接下来的核心竞争力，就是谁能把AI融入流程、嵌入产品、重构场景。

但这就引出一个关键问题——AI该用在哪里？又该怎么用？

这正是本篇所聚焦的主题：AI需求的系统化挖掘方法。

AI需求挖掘与传统IT产品差别

我们太熟悉传统IT了，熟悉到很多流程、动作已经变成了“无意识能力”——这在心理学中被称为“不知道自己知道”。

这种熟练本来是优势，却会让人在设计AI产品时进入盲区：

“我们总是用旧眼光看新事物”，于是就看不到AI真正能带来的结构性价值。

我们需要的是一套新的思维框架，帮助我们突破习惯的思维路径，重新识别业务中那些看似“理所当然”的脑力环节。

于是，我们引入 MAIR 模型。

MAIR：一套用于AI需求挖掘的思维工具

MAIR 是一个横跨业务与技术的四步法，帮助你识别可被AI替代的脑力劳动点。

Map Business Processes：梳理流程
Access Mental Labor part：寻找脑力劳动
Identify Value of Mental Tasks：确定脑力价值
Replace with AI Solution：设计替代方案

M 梳理业务流程

这一步的动作是梳理业务流程，把“思维动作”挖出。

挖掘过程中要做到尽量拆到最小颗粒程度。为了帮助大家拆的尽可能细，这里推荐使用5W工具去拆，一直连续追问五个为什么（杰斐逊纪念堂外墙清洁问题）。

**Why1**‌：为什么纪念堂外墙腐蚀严重？  
→ 清洁人员频繁使用高压水枪+强碱清洁剂冲洗

‌**Why2**‌：为什么需要使用强效清洁剂？  
→ 普通清洁剂无法清除顽固的鸟粪痕迹

‌**Why3**‌：为什么外墙有大量鸟粪？  
→ 燕子群在墙面筑巢栖息

‌**Why4**‌：为什么燕子在此聚集？  
→ 墙缝蜘蛛数量暴增（燕子主要食物）

‌**Why5**‌：为什么蜘蛛异常繁殖？  
→ 夜间灯光吸引趋光昆虫（蜘蛛的食物源）

‌**根本解决方案**‌：调整纪念馆夜间照明方案（减少开灯时间/更换灯光波长），从源头阻断生态链。

这一步拆解的工作其实也是为后续写提示词做好准备，后面借用提示词框架，你需要做的就是对业务规则和流程进行翻译，而不是创造。

A 寻找脑力劳动

完成梳理后，在流程中寻找哪些部分是通过脑力劳动来完成的。

“脑力劳动”并不等同于“所有非体力劳动”。这里特指的是依赖人类经验、理解、创造性或归纳判断的环节。

你可以用以下四类关键词来快速定位流程中是否有“脑力成分”：

思考类：推理、分析、筛选、归因
判断类：评分、优先级排序、异常识别
创作类：文案撰写、提案草拟、设计命名
沟通类：客户回复、邮件编写、报告生成

注意区分：

若该任务规则固定、路径明确（例如：填写快递单、审批单流程），更适合 RPA 自动化或低代码平台；
若该任务依赖人脑临场判断、涉及语义或情绪理解，才是 AI 大模型发挥作用的机会点。

I 确定脑力价值

不是所有脑力劳动都值得被 AI 替代。你需要从价值/成本比的角度来评估是否“值得动手”。

我们可以参考两个主要维度：

难度评估（单位时间产出成本）
- 岗位人力成本：是否是高薪岗位？
- 替代难度：是否已有成熟模型能应对？
- AI正确率容忍度：如果偶尔出错，是否能容忍？

时间评估（总时长）
- 该任务在整个流程中耗时占比高吗？
- 是不是高频发生？
- 是否可批量处理？

优先替代的任务画像：人力成本高（如咨询、分析、创作类任务）；每天/每周都要做；即使AI生成的结果需要二次校对，但已经节省了80%时间

简化评估模型公式：

替代优先级 = 难度 × 频率 × 人力成本

R 寻找替代方案

最后一步是把已经识别出的“高价值脑力劳动”进行产品化尝试，用大模型、工作流或外部工具初步实现替代。

这个过程可以拆分为三个步骤去做：

确定输出：以终为始，确定 AI 输出物
确定输入：回溯输入信息，确定输入的内容、来源、风格等
构建提示词 + 验证流程：采用熟悉的 Prompt 模板（如 CRISPE、Expert Chain、Role-Based Prompt 等），分段测试大模型表现，逐步逼近目标效果。最好进行“盲测”：将 AI 结果直接嵌入真实流程中，观察是否被识别为“机器生成”。

如果模型效果一般，不急着做系统化产品，可以先作为辅助决策工具；如果模型表现稳定，可考虑用 API 封装，嵌入后台流程中自动调用；如果模型生成部分可用，部分不稳，可结合“人机协作”设计来优化流程效率。

结语

MAIR的理论部分就介绍到这里，下一篇我会举一个具体的例子，完整的进行MAIR的拆解，并输出一个产品demo验证。

AI需求挖掘，不只是找场景，更是重构“人机分工”。

MAIR模型不是教我们“怎样用AI做点事情”，而是帮助我们重新梳理人与AI的协作边界：

把人从低效的判断和重复的脑力任务中解放出来，
把AI放进那些“能理解规律、能产生价值”的环节里，
最终构建出更流畅、高效、有智慧感的工作与产品流程。

AI不会自动告诉你它该做什么，真正的产品洞察，依然来源于对业务的熟悉、对流程的敏感、对脑力成本的精算。

当我们学会了用结构化方式识别“脑力密集区”，就真正具备了打造AI产品的第一性能力。

AI替代的浪潮不会因为我们的迟疑而停下。

于其问自己“AI能不能替代我”，然后恐慌，不如追问自己：我的思考方式，是不是还有改进和重构的空间？是不是可以借助AI完成同步升级。

AI重塑商业系列（1）

2025-07-03hzqiuxm阅读(466)

引子：为什么是现在？

十年前，当你打开软件，看到的是界面和功能；十年后，当你与软件对话，它看到的是你。

曾经的软件，定义了功能，用户只能去学习和适应它；
今天的AI，理解你的话语、你的习惯、甚至你的潜在需求。

当产品不再局限于界面按钮，而变成了一个能听懂你、理解你、甚至预测你的私人助理，商业的规则也注定要被彻底改写。

我们正处于一个新旧交替的关键时刻，从“功能软件”迈入了“意图驱动”的新世界。
而AI，就是这场商业与产品哲学大变革的核心推手。

AI究竟如何重塑商业世界？我们先回到商业的八大核心要素，来看看AI究竟能带来怎样的转变。

商业八要素的AI升级

大模型时代，我们可以围绕商业核心八要素系统性地实现AI升级。这八个核心要素贯穿了商业活动的全部环节，任何一家企业都离不开它们。

通过收益视角，我们可以探讨每个要素如何利用AI技术降本增效，实现商业转型和价值升级。

定位：通过AI自动分析用户画像与需求数据，降低传统定位调研的人力与资金成本。实时动态调整产品与品牌定位，快速响应市场变化，提升竞争力。
市场：利用AI进行市场趋势预测和精准用户洞察，减少市场调研和分析所需的人工和周期。通过AI洞察与预测，发现新的市场机会与竞争要素，更快进入有潜力的新领域。
产品：AI加持，对老产品提升溢价。创造新产品新增收益，为个性化产品增加利润空间，增加用户粘性和产品竞争力。
营销：进行人力替代，物料成本替代。使用AI智能推荐与自动化内容生成，减少传统营销策划和渠道运营的人工投入。增加物料输出，通过媒体矩阵流程获取。
生产：AI自动化生产流程，完成人力替代，质量控制损耗降低；利用AI提升产能和效率。
决策：利用AI分析海量数据，降低决策错误风险成本；利用AI实时洞察、模拟、预测，提升决策能力，提升投资收益率。
资源：AI优化资源配置，避免冗余与浪费，节约运营成本；AI自动发现资源使用的最佳路径，提高资源的产出效率与利用率。。
管理：AI支持智能化管理，完成部分人工替代，优化内部流程，提升管理覆盖度，提升组织效率。

AI时代的每个商业环节，都在被重新定义，推动企业进入全新发展阶段。

AI重塑产品价值的启示

现有软件应用的特点：有限Input，用户适应产品；站外搜索，多产品切换；处理结构化数据；服务撮合、促进交易；人和人对话；功能迭代；

大模型时代软件应用：无限Input，产品适应用户；贴身助手、辅助驾驶；处理非结构化数据；直接提供服务；人VS机器、机器VS机器；模型迭代；

我们再看几个具体的例子：

会说话的仙人掌变成FoloToy之后，售价从13元涨到398元，还搭配了语音陪伴服务；
传统地球仪加上AI讲解和问答功能，从10元变为529元，变成了“可以互动的地理老师”；
直播网红与MCN机构，利用AI创造出语音陪聊账号、内容策划助手、AI合成主播，提升效率。

这些商品因为AI而升级，本质上不是打造了全新的产品，而是给原有产品赋予了“灵魂”和“陪伴感”。

AI新产品系统化设计

简单说AI产品构建包含三个核心层次：

AI替代层：用AI代替人工操作，直接降低运营成本，比如AI客服。
AI增强层：用AI提升产品效果，显著提高业务效率，如智能推荐和精准营销。
AI重构层：用AI打造新产品，创造新的市场需求，例如AI伴读、AI编程助手。

那么从商业层面构建一个AI产品，大概可以分为七个步骤。

1 需求挖掘：解决AI从哪里入手的问题。
2 价值评估：判断这样做值不值的问题。
3 产品构建：解决AI产品设计问题。
4 产品架构：解决AI产品能力和适应问题。
5 产品实施：解决AI产品落地问题。
6 商业策略：解决AI产品赚钱问题。
7 产品迭代：解决AI产品精度和后续提升问题。

因此，AI产品的构建不再凭感觉，而是可以遵循明确的方法论。

之后的文章里，我会对每个步骤进行详细的拆解与举例。这样大家就会有更加清晰的认识，当你工作中碰到某个环节时，只要拿上对应的模型，就能进行有效的思考与分析了。

结语

AI产品的核心变革，不止于技术，更是产品、用户与商业关系的全面重塑：

产品，不再只是工具，而是理解你意图的伙伴；
商业，不再只是买卖关系，而是持续的陪伴与共生。

AI正在赋予商业『生命感』，让商业不仅『更聪明』，更『有人情味』。

未来的竞争，从不是谁的AI更强大，而是谁的AI更懂人心。

你和你的团队，准备好迎接这场『从功能到智能，从交易到共生』的商业革命了吗？

工程师工具箱系列(4)

2025-07-03hzqiuxm阅读(421)

Gemini-cli快速使用教程

收费丝滑免费也香

说实话，现在有些大模型和工具是真的好用，比如Cursor、GPT-4O等。但是所有付费工具加起来，也是一笔不小的费用。

平时工作、生活中我们遇到的问题，并不一定非得上最好的大模型或最好的工具，有时候稍微次一点的大模型或工具也完全能够胜任了。

所以收费用着确实丝滑，但免费的也香啊。

Google这次推出的Gemini CLI直接解决了这个痛点。你只需要用个人Google账户登录，就能获得免费的Gemini Code Assist许可证，每分钟60次调用，每天1000次调用，完全免费使用Gemini 2.5 Pro的完整版本这个额度对个人开发者来说真的很够用了。

很多小伙伴在使用过程中，还是难免会踩一些坑，这里做个入门使用说明，希望可以帮助到大家。

1 准备阶段

需要一个代理梯子，这个我就不额外说明了，用你自己喜欢的就好
找到自己代理梯子代理端口

2 配置环境

根据自己工作电脑环境进行配置即可

Windows (CMD/PowerShell)‌:

[CMD]
set http_proxy=http://127.0.0.1:你的代理端口 
set https_proxy=http://127.0.0.1:你的代理端口

[PowerShell]
$env:http_proxy="http://127.0.0.1:你的代理端口"  $env:https_proxy="http://127.0.0.1:你的代理端口"

‌macOS/Linux‌:
export http_proxy=http://127.0.0.1:你的代理端口
export https_proxy=http://127.0.0.1:你的代理端口

完成后测试下自己命令行下是否可以访问谷歌：curl google.com

3 设置项目编号

本来我以为开通了gemini-cli的API就好，后来测试发现还是必须要设置下项目的ID才行。

访问谷歌控制中心 https://console.cloud.google.com/home/dashboard

复制项目ID，按照下面命令完成设置：

- CMD: `set GOOGLE_CLOUD_PROJECT=你的项目ID`
- ‌PowerShell‌: `$env:GOOGLE_CLOUD_PROJECT="你的项目ID"`
- ‌macOS/Linux*: `export GOOGLE_CLOUD_PROJECT=你的项目ID`

5 启动gemini-cli

建议使用： npx https://github.com/google-gemini/gemini-cli 来启动
使用全局npm的方式因为大家node环境以及依赖问题，可能会遇到莫名其妙的坑
启动后随便聊个天，有回复说明OK了

还剩下多少免费额度，你可以通过右下角的百分比来跟踪

遇到错误

遇到错误不要慌：根据命令gemini -d 或提示，ctrl + o ctrl +s 查看详情
一般应该都是超时，说明代理端口可能设置的不对
使用 curl google.com 在命令行窗口里看看是否能通

自动化脚本

每次都要执行这些命令明显太繁琐了，所以我们需要编写一个脚本，然后下次在任何项目里启动就行。

这里以window为例，linux和mac下就和正常shell脚本类似，不特殊说明了

1.编写脚本

### PowerShell 脚本示例：start-gemini-cli.ps1

# powershell
# 设置 HTTP 和 HTTPS 代理环境变量
$env:http_proxy = "http://127.0.0.1:代理端口"
$env:https_proxy = "http://127.0.0.1:代理端口"

# 设置 GOOGLE_CLOUD_PROJECT 环境变量
$env:GOOGLE_CLOUD_PROJECT = "项目ID"

# 使用 npx 启动 gemini-cli
npx https://github.com/google-gemini/gemini-cli

2.配置环境变量和放开权限

将脚本目录设置到环境变量path中

执行：Set-ExecutionPolicy Unrestricted -Scope CurrentUser

3.执行脚本

start-gemini-cli.ps1

好了，使用说明就到这里，希望对你有所帮助~

对个人而言AI时代机遇是什么？

2025-06-29hzqiuxm阅读(492)

对个人而言AI时代机遇是什么？

是什么构成了AI时代普通人的机遇

技术一路从蒸汽机，到电动机，到信息互联网，再到人工智能。到现阶段，构成我们普通人的机遇是什么呢？

根据黄金思维圈的法则，要想弄清楚 What 的问题，我们先想清楚 Why。为什么AI时代可以带给普通人机遇？

我认为有三个原因，它们分别是生产力的大幅度提升、广泛的使用场景、参与门槛很低。

生产力大幅度提升

生产力的大幅度提升，是撬动机会的杠杆。

技术革命的每一次进化，本质上都是生产力的飞跃，而每一次飞跃，都会打破一批人的局限，也成就一批人的崛起。

在AI面前，很多传统上需要大量人力的任务变得轻松可行。一人就是一个团队，不再需要写手、画手、剪辑师、翻译……只要你有想法，AI就是你的手脚和羽翼。

《荀子·劝学》有言：“不积跬步，无以至千里；不积小流，无以成江海。”而今，我们终于拥有了一条可以迅速流动的小溪，它叫“AI工具”。问题只是：你是否愿意迈出那第一步？

广泛使用场景

场景的广泛应用，是遍地的微型矿脉。

AI的能力广，广到你很难设限：文本、图像、音频、视频、代码、翻译、数据分析、客服辅助……这些看似普通的场景，每一个背后，都藏着细碎但真实的价值。

也正因为场景广泛，AI的产业链也足够长、足够广。
从模型训练、工具开发、平台运营，到客户服务、内容优化、交互设计，整条链路上涌现出无数岗位、无数需求。这就像一张被撒开的大网，捞起的不只是高薪岗位，还有属于普通人的可及机会。

而对于个体而言，这些广泛场景带来了两种真正的核心机遇：

一是直接进入新兴行业。AI工具本身就是一门手艺，内容生成、AI运营、AIGC顾问、提示工程师……都是这几年才诞生的新岗位；
二是成为传统行业的技术转型推动者。你不需要离开原本的领域，但你可以用AI去优化工作流程、提升效率、创造差异化优势。这是普通人真正能够“从内而变”的路径。

“世上本无路，走的人多了，便成了路。”如今这路就摆在眼前，关键在于：你是否肯走上一程。

参与门槛低

参与门槛的下降，是平民百姓的入口。

过去的技术红利，总是留给了少数受过高等教育、有资源、有背景的人。而AI不一样，它是一种“傻瓜式普惠技术”，越来越多的AI工具已经足够友好到“对话即可完成任务”。

而这，恰恰才是机遇扩散的关键。

只有当参与门槛足够低，价值的集中度才会高。
如果只有极少数人掌握入口，那岗位和机会也终将稀少。相反，门槛低，意味着千千万万普通人可以一同参与、共同创造，于是岗位才会多、场景才会活，活力才能持续。

要知道，大模型之前的AI，其实并不“亲民”。它非常垂直和孤岛化：你要搞清楚数据采集、算法建模、算力部署、软件开发、测试运维，最后还得做实际应用，哪一步都难如登天。AlphaGo虽然震撼世界，但它的能力只颠覆了围棋，换一个棋类，得从头来过。

大模型的意义，正是打通了从“技术”到“可用”的距离，让普通人得以使用、得以创造、得以受益。

AI的进步也许不会让人人皆成大师，但至少——人人皆有可能

AI时代个人机遇在哪

所以，AI时代的机会，不在“高处”，而在你脚下。

《传习录》中讲：“人须在事上磨，方立得住。”如今这“事”，便是你用AI能做出来的小结果、小产品、小解决方案。不是写PPT写出绝美模板，就是生成一页商业文案、五条短视频脚本、一个公司logo的初版、一份十分钟会议纪要的浓缩……

这些细碎的结果，就是新一代“微型商业体”的雏形。它也许不大，也许不高光，但它是真实的，它的门槛低，它能带来收入，它属于你。

如果AI是未来，那么LLM时代会出现AI时代的基础设施。

AI时代属于每一个参与它的人，肯把时光磨旧物，也将微火照苍茫。

为什么说AI是第四次工业革命

2025-06-27hzqiuxm阅读(211)

为什么说AI是第四次工业革命

引言

“知来者之可追，察往者之可鉴。”要理解AI何以被称为第四次工业革命的标志，我们不妨先回望前三次工业革命的来路。

理解这条演进的脉络，才能看清我们身处时代的浪潮与方向。

理解了每次工业革命的底层逻辑后，就会更加清楚AI大模型的核心价值，才能被我们正确使用，而发挥出自身核心价值。

第一次革命：蒸汽的咆哮

18世纪60年代，英国引领了第一次工业革命的浪潮，蒸汽机的发明使马车让位于火车，帆船演化为汽轮船。
这次革命的底层逻辑，是劳动力的转变：人力、畜力、自然力被高密度、可控的化石能源所替代。由此，人类的生产效率突飞猛进，第一次真正摆脱了“靠天吃饭”的宿命。

正所谓“天行健，君子以自强不息”，这是人类第一次以技术之力，握住命运的缰绳。

第二次革命：电的光明

到了19世纪70年代，美国与德国推动了第二次工业革命的进程，电的广泛使用改变了世界的夜晚，催生了电灯、广播、电视等新兴产业。

它的底层逻辑，在于电的廉价与泛用性。这种能源不仅强大且便于传输，催生了传媒、娱乐等多个产业的变革，也为现代城市化铺设了基石。

若用古人的话说：“无垠万象，一电而通。”敏感的你是否开始联想到现在AI大模型的特点是不是也有着类似的味道？廉价的token，预训练大模型极强的泛化能力。电之于那个时代，如今日AI之于我们：低成本、高泛化、强传导性。token如电，模型如机，AI如光入万家。

此时此刻就如彼时彼刻。

第三次革命：信息之潮

20世纪40年代，美国率先开启了信息革命。第一台电子计算机虽庞大，但它带来的，是人类计算能力的指数级跃迁。

这一时期的关键转变，是从体力劳作的替代，进入了脑力计算的延伸。芯片如同大脑的外接硬盘，而网络使信息如水般流通。

它的底层逻辑，劳动力的提升从体力开始变为了脑力，彻底改变了人类的通讯方式与工作、生活方式。我们第一次意识到：工具不再只是手足的延伸，更成为思维的延伸，人类开始以思维之力重构世界。

第四次革命：AI到来

现在，我们站在第四次工业革命的门槛上。核心技术不再是单一能源或硬件工具，而是人工智能。这是一个融合5G、IOT、大数据与算法的新时代。

AI的核心变革，在于它不再仅仅辅助工作，而是进入“脑力劳动”本身，脑力多次重复劳动的基础性决策开始被替代：文本生成、数据分析、辅助决策、基础创意设计……

它的底层逻辑，标志着AI开始替代创作和决策这两个关键性的人类脑力劳动了。如果说前几次工业革命，是“手”与“足”的延伸，这次，则是“心”与“意”的激荡。AI的本质，是对“认知成本”的再革命。

人类千百年来思虑的问题——“我思，故我在”，正在被技术轻轻叩问：“机器亦思，你将如何在？”

吾将何在？革命正当时

每一次技术飞跃，都是一次文明的重组。要避免对AI的误解和盲目狂热，我们就必须像王阳明所言那样，“致良知”，知其所以然，而非仅见其然。

AI不是神话，它是逻辑的产物，是算力、数据与算法三者交汇的必然结果。理解这三者之间的耦合方式，才能真正把握AI的核心价值与边界，而非迷信它能“替代一切”。

历史上，大多数人终其一生所处的社会形态，并无太多改变。一位宋代农人，其生活与其父祖并无太大差别，其一生所知所见，也不过百里之地。

而我们，却生在了一个“千年一遇”的时代。

“江山代有才人出，各领风骚数百年。”工业革命的浪潮，正如那滚滚长江水，奔涌向前。未来的工业革命，也许不会有太多轮次了。而这一次，或许就是你我亲历的最后一次。

这不只是工程师的时刻，也不只是科技公司的浪潮——它是全人类的拐点时代。

我们需要的不只是技术能力，更是价值判断与自我省察。正如《大学》所言：“格物、致知、诚意、正心”，我们需要用理性之光照亮技术的黑箱，以温柔的心性守护时代的锋利。

参与这场革命，正当其时。

Redis之路系列原理篇（5）

2021-09-15hzqiuxm阅读(2481)

5 原理篇—问渠哪得清如许

单线程模型

Redis的线程模型：基于NI/O、单线程、异步的线程模型
Redis基于Reactor模式开发了网络事件处理器，这个处理器叫做文件事件处理器（file event handler）。

这个文件事件处理器，是单线程的，采用I/O多路复用机制同时监听多个socket，它根据socket上的事件，来选择对应的事件处理器来处理这个事件。

下方是Redis单线程模型示意图：

文件事件处理器的结构包含4个部分：多个socket，I/O多路复用程序，文件事件分发器，事件处理器
客戶端与Redis通信的流程大致如下：

1：客户端发出连接Redis的请求，产生 AE_READABLE事件，最后会关联到连接应答处理器，由它来负责真正处理跟客户端的连接
2：客户端向Redis发出命令请求，产生 AE_READABLE事件，最后会关联到命令请求处理器，由它来从socket中获取相关数据，然后进行真正的执行处理
3 ：Redis处理完成请求过后，会准备好返回给客户端的数据，产生 AE_WRITABLE事件，最后会关联到命令回复处理器，由它来把数据写入到 socket，返回到客户端
4 ：命令回复处理器完成后，就会删除这个socket的 AE_WRITABLE事件和命令回复处理器之间的关联关系

事务

基本特点

Redis中的事务本质就是一组命令的集合，被依次顺序的执行，当然可以放弃事务的执行，那么所有事务里面的命令都不会执行。
Redis中的事务特点：

单线程架构保证了执行完事务内所有指令前是不可能再去同时执行其他客户端的请求的
Redis的事务没有隔离级别的概念，不存在”事务内的查询要看到事务里的更新，在事务外查询不能看到”这种问题了
Redis的事务不保证原子性，只有决定是否开始执行全部指令的能力，没有执行到一半进行回滚的能力

基本过程

1 发送事务开始指令：multi
2 依次发送执行命令
3 依次执行命令：exec

注意：如果某命令有语法错误，那么所有命令都不会执行；如果某命令只是执行错误，其它命令会正常执行，之后返回错误信息，无法回滚

持久化

Redis持久化分成三种方式：RDB（Redis DataBase）、AOF （Append Only File）和AOF+RDB混合持久化

RDB：在不同的时间点，将Redis某一时刻的数据生成快照并存储到磁盘上(缺省打开)
AOF ：只允许追加不允许改写的文件，是将Redis执行过的所有写指令记录下来，在下次Redis重新启动时，只要把这些写指令从前到后再重复执行一遍，就可以实现数据恢复了(缺省关闭)
混合方式：混合方式是先使用RDB进行快照存储，然后使用AOF持久化记录所有的写操作(redis6后推荐使用，缺省开启依赖RDB和AOF)。

RDB

默认情况下就是开启的

RDB方式，Redis会单独创建（fork）一个子进程来进行持久化，会先将数据写入到一个临时文件中，待持久化过程都结束了，再用这个临时文件替换上次持久化好的文件。

主进程不进行任何的IO操作，确保了极高的性能
RDB是快照读取，大规模数据效率比AOF好，但可能会丢失最后一次持久化数据
适合对数据完整性不是很敏感的场景，比如冷备份，可以高性能快速恢复数据

AOF

将配置项appendonly设置为yes就可以打开AOF功能，默认是关闭的。

默认的AOF持久化策略是每秒钟fsync一次，fsync是指把缓存中的写指令记录到磁盘中，在这种情况下，Redis仍可以保持很高的性能。

OS会在内核中缓存Redis的写操作
缓存不会立即写到磁盘上，会有一定的延迟，理论上是有数据丢失的可能性
你可以修改配置，强制不要缓存直接写入磁盘中
Fsync的方式有三种，推荐每秒启用一次的everysec
优点：更好的保护数据不丢失、性能高、可做紧急恢复
缺点：文件比RDB文件大、写的QPS比RDB低

混合模式

先使用RDB进行快照存储，然后使用 AOF持久化记录所有的写操作，当重写策略满足或手动触发重写的时候，将最新的数据存储为新的RDB记录。

这样的话，重启服务的时候会从RDB和AOF两部分恢复数据，既保证了数据完整性，又提高了恢复数据的性能。

通过 aof-use-rdb-preamble 配置项可以打开混合方式，默认是yes。
所以日志文件中会同时包含了RDB数据和AOF数据

数据恢复顺序：

1 判断是否开启AOF持久化，若开启了AOF，则使用AOF持久化文件恢复数据
2 如果AOF文件不存在，否则使用RDB持久化文件恢复数据
3 如果AOF文件和RDB文件都不存在则直接启动Redis
4 如果AOF或RDB文件出现错误，则启动失败返回错误信息

附录1：Redis事务基本命令

1：multi：设置事务开始
2：exec：执行事务
3：discard：放弃事务
4：watch：监控键值，如果键值被修改或删除，后面的一个事务就不会执行
5：unwatch：取消watch

关于watch：Redis使用Watch来提供乐观锁定，类似于CAS；可以被调用多次；当 EXEC 被调用后，所有的之前被监视的键值会被取消监视，不管事务是否被取消或者执行。并且当客户端连接丢失的时候，所有东西都会被取消监视

Redis之路系列拓展篇（4）

2021-08-25hzqiuxm阅读(2936)

4 拓展篇—功夫在诗外

6.0新特性

相对都比较鸡肋，谨慎在生产环境使用

ACL安全策略

Redis6版本推出了ACL(Access Control List)访问控制权限的功能，基于此功能，可以设置多个用户，并且给每个用户单独设置命令权限和数据权限。

ACL文件配置方式有两种，一种是在config文件中直接配置，另一种是在外部aclfile中配置，配置命令是一样的
ACL是使用DSL定义的，该规则是从上到下，从左到右的，具体可以参考附录中的具体规则说明

RESP3和客户端缓存

RESP（REdisSerializationProtocol），是 Redis服务端与客户端之间通信的协议。
在Reds6之前的版本，使用的是RESP2协议，数据都是以字符串数组的形式返回给客户端，客户端需要根据类型进行解析，增加了客户端实现的复杂度。
RESP3协议可以按类型返回数据。可以使用HELLO命令在RESP2和RESP3协议之间进行切换

新增的客户端缓存的设计导致客户端缓存和redis缓存绑定，十分不灵活，会导致资源浪费，没有很大的实际使用价值。

Redis中值的变化每次需要同步到客户端缓存，但是客户端并非会用到没的变化，导致资源浪费，数据管理更加复杂了，实际价值不大

I/O多线程

注意：主流程操作还是单线程
开启IO多线程：io-threads-do-reads yes 配置线程数量，如果设为1就是主线程模式：io-threads 4

目前官方建议：至少4核的机器才开启IO多线程，并且除非真的遇到了性能瓶颈，否则不建议开启此配置。建议配置的线程数少于机器总线程数，线程并不是越多越好，多于8个线程意义不大

集群代理

集群代理把集群抽象成为单个Redis实例，客户端通过集群代理访问集群，就像访问单个Redis一样，不去关心很多集群上的问题，比如：集群模式下multiple操作的限制及跨slot操作限制等等，这些由集群代理去处理。

目前是一个实验性的功能，需要单独安装、单独配置、单独运行，不建议生产环境使用。

Lua脚本

Lua是一个高效、简洁、轻量级、可扩展的脚本语言，可以很方便的嵌入到其它语言或中间件中使用，Redis从2.6版支持Lua。

使用脚本好处

1：减少网络开销
2：原子操作：Redis会把脚本当作一个整体来执行，中间不会插入其它命令
3：复用功能

基本数据类型

Lua是一个动态类型的语言，一个变量可以存储任何类型的值

基础语法

默认全局变量，但是在Redis中不允许使用，局部变量使用local关键字进行声明
变量名必须是非数字开头，只能包含字母、数字和下划线
变量名是区分大小写
逻辑操作符用单词表示：and、or、not
单行注释使用 --来表示，多行注释使用--[[ 开始，到 ]] 结束
支持多重赋值：local a,b = 1,2,3 (a=1,b=2)，不过不建议，难维护易错
使用 .. 用来连接字符串
使用 #来获取长度，比如：print(#'helloworld')
只有nil和false是假，其它都是真
循环语句有for、while、repeat三种

与Redis结合

在Redis中执行lua脚本命令： redis-cli --eval 脚本 [key...] , [arg...]
在脚本中调用Redis命令：redis.call，遇到错误会直接返回；想要继续执行使用redis.pcall命令

Lua数据类型与Redis返回值类型对应关系：

其它命令：

evalsha：可以通过脚本摘要来运行，作用同eval
script load：将脚本加入缓存，返回值就是SHA1摘要
script exists：判断脚本是否已经缓存
script flush：清空脚本缓存
script kill：强制终止脚本的执行

发布订阅模式

Redis支持简单的发布订阅模式，可以实现进程间的消息传递，对业务要求不高的可以选择使用
下面是一些常用的操作命令：

1：publish：发布消息，格式是publish channel 消息
2：subscribe：订阅频道，格式是subscribe channel，可以是多个channel
3：psubscribe：订阅频道，格式是psubscribe channel，支持glob风格的通配符
4：unsubscribe：取消订阅，格式是unsubscribe channel，不指定频道表示取消所有subscribe命令的订阅
5：punsubscribe：取消订阅，格式是punsubscribe channel，不指定频道表示取消所有psubscribe命令的订阅

注意这里匹配模式的时候，是不会将通配符展开的，是严格进行字符串匹配的，比如:punsubscribe * 是无法退定 c1.* 的，必须严格使用punsubscribe c1.*才可以

常用优化手段

使用管道Pipeline，有利于减少网络通信和传输
精简键名和键值
合理设计存储的数据结构和数据关系，减少数据冗余
尽量使用mset来赋值，类似还有lpush、zadd等批量操作的命令
如果可能，尽量使用Lua脚本来辅助获取和操作数据
尽量使用hash结构来存储对象
使用hash结构时，应尽量保证每个key下面<field,value>的数目不超过限制(默认值是64)
配置使用类似ziplist以优化list等数据结构
一定要设置maxmemory，保证redis不会因为内存导致崩溃

客户端

Lettuce简介

Lettuce是一个可伸缩线程安全的Redis客户端。多个线程可以共享同一个RedisConnection。它利用优秀netty NIO框架来高效地管理多个连接。

Lettuce核心组件有：RedisURI、Connection、RedisClient、RedisCommands

RedisURI：封装Redis的连接信息
Connection：Redis的连接，包含一些具体方式（单机、哨兵、集群、订阅发布等）
RedisClient：Redis的客户端，如果连接集群则为RedisClusterlient
RedisCommands：Redis的命令操作API接口，提供了三种调用方式：同步、异步、响应式

基本使用

官网地址：https://lettuce.io/docs/getting-started.html

基本依赖：

dependencies {
  compile 'io.lettuce:lettuce-core:6.1.4.RELEASE
}

基本使用示例：

RedisClient redisClient = RedisClient.create("redis://password@localhost:6379/0");
StatefulRedisConnection<String, String> connection = redisClient.connect();
RedisCommands<String, String> syncCommands = connection.sync();

syncCommands.set("key", "Hello, Redis!");

connection.close();
redisClient.shutdown();

与Spring的集成

@Configurationclass AppConfig { @Beanpublic LettuceConnectionFactory redisConnectionFactory() { return new LettuceConnectionFactory(new RedisStandaloneConfiguration("server", 6379)); } }

附录1：Lua脚本常用标准库与函数

Lua的标准库提供了很多使用的功能，Redis支持其中大部分：

1：Base：提供一些基础函数
2：String：提供用于操作字符串的函数
3：Table：提供用于表操作的函数
4：Math：提供数据计算的函数
5：Debug：提供用于调试的函数

除了标准库外，Redis还会自动加载cjson和cmsgpack库，以提供对 Json和MessagePack的支持，在脚本中分别通过cjson和cmsgpack两个全局变量来访问相应功能

在Redis中常用的标准库函数：

1：string.len(string)
2：string.lower(string)
3：string.upper(string)
4：string.rep(s, n)：返回重复s字符串n次的字符串
5：string.sub(string,start[,end])，索引从1开始，-1表示最后一个
6：string.char(n…)：把数字转换成字符
7：string.byte (s [, i [, j]])：用于把字符串转换成数字
8：string.find (s, pattern [, init [, plain]])：查找目标模板在给定字符串中出现的位置，找到返回起始和结束位置，没找到返回nil
9：string.gsub (s, pattern, repl [, n])：将所有符合匹配模式的地方都替换成替代字符串。并返回替换后的字符串，以及替换次数。四个参数，给定字符串，匹配模式、替代字符串和要替换的次数
10：string.match (s, pattern [, init])：将返回第一个出现在给定字符串中的匹配字符串，基本的模式有：. 所有字符，%a字母， %c控制字符，%d数字，%l小写字母，%p 标点符号字符，%s 空格， %u 大写字母，%w 文字数字字符，%x 16进制数字等
11：string.reverse (s)：逆序输出字符串
12：string.gmatch (s, pattern)：返回一个迭代器，用于迭代所有出现在给定字符串中的匹配字符串
13：table.concat(table[,sep[,i[,j]]])：将数组转换成字符串，以sep 指定的字符串分割，默认是空，i和j用来限制要转换的表索引的范围，默认是1和表的长度，不支持负索引
14：table.insert(table,[pos,]value)：向数组中插入元素，pos为指定插入的索引，默认是数组长度加1，会将索引后面的元素顺序后移
15：table.remove(table[,pos])：从数组中弹出一个元素，也就是删除这个元素，将后面的元素前移，返回删除的元素值，默认pos是数组长度 table.sort(table[,sortFunction])：对数组进行排序，可以自定义排序函数
16：Math库里面常见的：abs、ceil、floor、max、min、pow、sqrt、 sin、cos、tan等
17：math.random([m[,n]])：获取随机数，如果是同一个种子的话，每次获得的随机数是一样的，没有参数，返回0-1的小数；只有m，返回1-m的整数；设置了m和n，返回m-n的整数
18：math.randomseed(x)：设置生成随机数的种子

附录2：ACL规则

启用和禁用用户

on：启用用户
off：禁止用户

允许和禁止调用

+：将命令添加到用户可以调用的命令列表中
-：将命令从用户可以调用的命令列表中移除
+@：允许用户调用类别中的所有命令
-@：禁止用户调用类别中的所有命令
+|subcommand：允许使用已禁用命令的特定子命令
allcommands：+@all的别名，包括当前存在的命令以及将来通过模块加载的所有命令
nocommands：-@all的别名，禁止调用所有命令

允许或禁止访问key

~：添加可以在命令中使用的键模式
- resetkeys：使用当前模式覆盖所有允许的模式

为用户配置有效密码

>：将此密码添加到用户的有效密码列表中
<：从有效密码列表中删除此密码
#：将此SHA-256哈希值添加到用户的有效密码列表中
!：从有效密码列表中删除该哈希值
nopass：移除该用户已设置的所有密码
resetpass：清空该用户的所有密码列表
reset：重置用户状态为初始状态

PS：具体命令可以通过acl help 查看

Redis之路系列集群篇（3）

2021-08-10hzqiuxm阅读(2510)

3 集群篇—众人拾柴火焰高

复制

基本概述

Redis支持复制的功能，以实现当一台服务器的数据更新后，自动将新的数据异步同步到其它数据库。

Redis复制实现中，把数据库分为主数据库master和从数据库slave ，主数据库可以进行读写操作，从数据库默认是只读的，当主数据库数据变化的时候，会自动同步给从数据库。

主从复制的结构支持一个Mater带多个Slave，也可以Slave带Slave模式

复制的好处：

可以实现读写分离
在主数据崩溃时可以实现数据恢复
可进行水平扩容支撑高并发

基本配置

配置原则 ：主数据库不做配置，从数据库中设置 replicaof 主数据库ip 主数据库port

具体的配置请查阅附录一

基本原理

全量复制

slave启动时，会向master发送psync请求，如果这是slave重新连接master，那么master仅仅会复制给slave缺少的数据; 如果是第一次连接master，那么会触发一次全量复制
主数据库接到psync请求后，如果是全量复制，会在后台保存快照，就是实现RDB持久化，并将保存快照期间接收到的命令缓存起来
快照完成后，主数据库会将快照文件和所有缓存的命令发送给从数据库
从数据库接收后，会载入快照文件并执行缓存的命令，从而完成复制的初始化
增量复制

如果是重新连接，Master会检查backlog里面的offset， master和 slave都会保存一个复制的offset还有一个master id，offset是保存在backlog中的。Master只会把已经复制的offset后面的数据复制给Slave，类似断点续传
在数据库使用阶段，主数据库会自动把每次收到的写命令同步到从服务器
Slave在复制的时候，不会阻塞Master的正常工作；也不会阻塞对自己的查询操作，它会用旧的数据集来提供服务; 但是复制完成的时候，需要删除旧数据集，加载新数据集，这个时候就会暂停对外服务了

PS：Master一定要持久化

乐观复制策略：Redis采用乐观复制的策略，容忍在一定时间内主从数据库的内容不同，当然最终的数据会是一样的。

这个策略保证了性能，在复制的时候，主数据库并不阻塞，照样处理客户端的请求。 Redis提供了配置来限制只有当数据库至少同步给指定数量的从数据库时，主数据库才可写，否则返回错误。配置是：min-replicas-to-write、min-replicas-max-lag

无硬盘复制：Master直接创建一个子进程，来生成RDB文件的内容，并通过网络直接传送给Slave，也就是RDB文件不保存到磁盘上。

数据丢失解决方案

异步复制导致丢失：master宕机，在主备切换的过程中，可能会导致数据丢失。
主从脑裂导致丢失：网络原因导致master短时间脱离集群，集群产生了新master，但客户端仍然往旧mater写数据，网络恢复后，旧master变成slave与新mater同步导致数据丢失。

解决方案：配置min-replicas-to-write和min-replicas-max-lag两个参数，比如： min-replicas-to-write 1 、 min-replicas-max-lag 10。

要求至少有1个slave，数据复制和同步的延迟不能超过10秒。

一旦所有的slave，数据复制和同步的延迟都超过了10秒钟，那么这个时候，master就不会再接收任何请求了。

脑裂情况下，一个master跟其它slave丢了连接，那么这两个配置可以确保，如果不能继续给指定数量的slave发送数据，而且slave 超过10秒没有给自己应答消息，那么就直接拒绝客户端的写请求。

哨兵

基本概述

哨兵是Redis 复制集集群的重要组件，它的主要作用有：

集群监控：监控主从数据库运行是否正常
故障转移：当主数据库出现故障时，自动将从数据库转换成为主数据库
配置中心：客户端通过连接哨兵来获得当前Redis服务的主节点地址
消息通知：哨兵可以将故障转移的结果发送给客户端

开启哨兵功能需要建立一个个sentinel.conf文件，里面设置要监控的主数据库的名字，比如：sentinel monitor 监控的主数据库的名字 127.0.0.1 6380 1

其中数字1表示的是哨兵判断主节点是否法神故障的最低票数，这个文件在运行期间会被sentinel动态进行更改，可以同时监控多个主数据库，一行一个配置即可，详细的配置参考附录二。

哨兵集群在整个主从集群中的功能关系结构图如下：

主从节点存放数据，而哨兵节点用来自动监控和维护集群，不存放数据
每个哨兵节点维护了3个定时任务：

1 哨兵向master-slave节点发送info命令来获取复制集的结构
2 哨兵之间通过pub/sub系统来互相感知装态和信息
3 哨兵向master-slave节点发送ping命令来进行心跳检测

基本原理

SDown：主观下线，在心跳检测的定时任务中，如果其它节点超过一定时间没有回复，哨兵节点就会将其进行主观下线。也就是说，主观下线的意思是一个哨兵节点“主观地”判断某个节点下线
ODown：客观下线，哨兵节点在对主节点进行主观下线后，会通过sentinel is-master-down-by-addr命令询问其它哨兵节点该主节点的状态；如果判断主节点下线的哨兵数量达到一定数值，则对该主节点进行客观下线。

哨兵四大基本原理：自动发现、选举领导、故障转移、配置传播

自动发现
哨兵互相之间的相互自动发现，是通过redis的pub/sub系统实现的，每个哨兵都会往sentinel:hello这个channel里发送一个消息，这时候所有其他哨兵都可以消费到这个消息，并感知到其他的哨兵的存在。

每隔两秒钟，每个哨兵都会往自己监控的某个master+slave对应的 sentinel:hello channel里发送一个消息，内容是自己的host、ip和 runid还有对这个master的监控配置。

每个哨兵也会去监听自己监控的每个master+slaves对应的 sentinel:hello channel，然后去感知到同样在监听这个 master+slave的其他哨兵的存在。

每个哨兵跟其他哨兵交换对master的监控配置，互相进行监控配置的同步

选举领导：选举出领导者哨兵

哨兵选举涉及两个参数：quorum(确认客观下线的最少的哨兵数量)，majority(授权进行主从切换的最少的哨兵数量)

每次一个哨兵要做主备切换，首先需要quorum数量的哨兵认为master客观下线，然后选举出一个哨兵来做切换，这个哨兵还需要得到majority哨兵的授权，才能正式执行切换

当主节点被判断客观下线以后，各个哨兵节点会进行协商，选举出一个领导者哨兵节点，并由该领导者节点对其进行故障转移操作。

监视该主节点的所有哨兵都有可能被选为领导者，选举使用的算法是Raft算法；Raft算法的基本思路是先到先得：即在一轮选举中，哨兵A向B发送成为领导者的申请，如果B没有同意过其他哨兵，则会同意A成为领导者

故障转移：选举出的领导者哨兵，开始进行故障转移操作，选举出新mater节点，大体可以分为3个步骤

1 在从节点中选择新的主节点：选择的原则是，首先过滤掉不健康的从节点；然后选择优先级最高的从节点(由slave-priority指定)；如果优先级无法区分，则选择复制offset最大的从节点；如果仍无法区分，则选择runid最小的从节点

2 更新主从状态：通过slaveof no one命令，让选出来的从节点成为主节点；并通过slaveof命令让其他节点成为其从节点

3 将已经下线的主节点设置为新的主节点的从节点，当其重新上线后，它会成为新的主节点的从节点

配置传播
新的master选出过后，执行切换的那个哨兵，会从要切换到的新master那里得到一个configuration epoch，这就是一个 version号，每次切换的version号都必须是唯一的。

如果第一个选举出的哨兵切换失败了，那么其他哨兵，会等待failover-timeout时间，然后接替继续执行切换，此时会重新获取一个新的configuration epoch，作为新的version号。

哨兵完成master切换之后，会在自己本地更新生成最新的master配置，然后同步给其他的哨兵，就是通过之前说的pub/sub 消息机制。

这时version号就很重要了，因为各种消息都是通过一个 channel去发布和监听的，所以一个哨兵完成一次master的切换之后，新的master配置是跟着新的version号的。

其他的哨兵都是根据版本号的大小来更新自己的master配置的。

使用建议

哨兵节点的数量应为多个，哨兵本身应该集群，保证高可用
哨兵节点的数量应该是奇数
各个哨兵节点的配置应一致

另外如果哨兵节点部署在Docker等容器里面，尤其要注意端口的正确映射，还需要知道哨兵集群+主从复制，并不能保证数据零丢失

分片

由于复制中，每个数据库都是拥有完整的数据，因此复制的总数据存储量，受限于内存最小的数据库节点，如果数据量过大，复制就无能为力了。

这个时候就需要用到分片技术，分片是将数据拆分到多个Redis实例的过程，这样每个Redis实例将只包含完整数据的一部分。

常见的分片方式有：按范围分片和哈希分片

分片实现方式

在客户端进行分片
通过代理来进行分片，比如：Twemproxy
查询路由：就是发送查询到一个随机实例，这个实例会保证转发你的查询到正确的节点，Redis集群在客户端的帮助下，实现了查询路由的一种混合形式，请求不是直接从Redis实例转发到另一个，而是客户端收到重定向到正确的节点（客户端启动时，加上-c参数）
在服务器端进行分片， Redis采用哈希槽（hash slot）的方式在服务器端进行分片：Redis集群有16384个哈希槽，使用键的CRC16 编码对16384取模来计算一个键所属的哈希槽

分片缺点

不支持涉及多键的操作，如mget，如果所操作的键都在同一个节点，就正常执行，否则会提示错误
分片的粒度是键，因此每个键对应的值不要太大
数据备份会比较麻烦，备份数据时你需要聚合多个实例和主机的持久化文件
扩容的处理比较麻烦
故障恢复的处理会比较麻烦，可能需要重新梳理Master和Slave的关系，并调整每个复制集里面的数据

结论：尽量避免去使用分片概念

集群架构

基本概念

由于数据量过大，单个复制集难以承担，因此需要对多个复制集进行集群，形成水平扩展，每个复制集只负责存储整个数据集的一部分，这就是Redis的集群。

分片可以模拟实现集群效果，但是有非常多的缺点，已经不推荐使用
现在Redis支持集群，在不降低性能的情况下，还提供了网络分区后的可访问性和支持对主数据库故障的恢复。

redis集群支持多个Master，每个Master可以挂载多个Slave，便于支持读写分离
集群Cluster内置了高可用的支持，无需再去使用哨兵的功能
集群中所有节点彼此互相连接，内部使用二进制协议(gossip)来进行优化传输速度和带宽
客户端与任一节点直接连接即可访问集群数据
集群负责把插槽分配到各个物理服务节点，由集群来负责维护节点、插槽、数据之间关系

使用集群后，都只能使用默认的0号数据库

每个Redis集群节点需要两个TCP连接打开，正常的TCP端口用来服务客户端，例如6379，加10000的端口用作数据端口，必须保证防火墙打开这两个端口

Redis集群不保证强一致性，这意味着在特定的条件下，Redis集群可能会丢掉一些被系统收到的写入请求命令。

手工创建集群

集群的最低标准6个redis实例：3个master节点，每个master带一个slave节点
集群创建的步骤大致如下：

1 集群配置：将每个数据库的cluster-enabled配置选项打开，然后再修改如下内容：pidfile、port、logfile、dbfilename、 cluster-config-file
2 启动数据库：分别启动这些Redis数据库，可以用info cluster查看信息
3 连接节点：使用cluster meet，把所有的数据库都放到一个集群中，可以通过cluster info ，或者cluster nodes 查看信息
4 设置slave:：设置部分数据库为slave，使用cluster replicate
5 分配插槽：使用cluster addSlots，这个命令目前只能一个一个加，如果要加区间的话，就得客户端编写代码来循环添加。有个实用的技巧：把所有的Redis停下来，然后直接修改node-xxx.conf 的配置文件，只需要配置master的数据库就可以，然后再重启数据库。分配完记得用使用cluster slots命令检查下

最后，通过cluster info查看集群信息，如果显示ok，那就可以使用了

插槽与预分区

插槽

插槽是Redis对Key进行分片的单元。在Redis的集群实现中，内置了数据自动分片机制，集群内部会将所有的key映射到16384个插槽中，集群中的每个数据库实例负责其中部分的插槽的读写。

键与插槽的关系：Redis会将key的有效部分，使用CRC16算法计算出散列值，然后对16384取余数，从而把key分配到插槽中。

键名的有效部分规则是：如果键名包含{}，那么有效部分就是{}中的值；否则就是取整个键名

可以看成是集群数据的逻辑划分，也是redis内存的逻辑划分

移动已分配的插槽，这个稍微麻烦点，尤其是有了数据过后，假设要迁移123号插槽从A 到B，大致步骤如下：

1：在B上执行cluster setslot 123 importing A
2：在A上执行cluster setslot 123 migrating B
3：在A上执行cluster getkeysinslot 123 要返回的数量
4：对上一步获取的每个键执行migrate命令，将其从A迁移到B
5：在集群中每个服务器上执行cluster setslot 123 node B （集群其实会自动同步，不过有延迟）

避免键的临时丢失：上面迁移方案中的前两步就是用来避免在移动已分配插槽过程中，键的临时丢失问题的，大致思路如下

1 当前两步执行完成后，如果客户端向A请求插槽123中的键时，如果键还未被转移，A将处理请求
2 如果键已经转移，则返回，把新的地址告诉客户端，客户端将发起新的请求以获取数据

当客户端向某个数据库发起请求时，如果键不在这个数据库里面，将会返回一个move重定向的请求，里面包含新的地址，客户端收到这个信息后，需要重新发起请求到新的地址去获取数据。

当然，大部分的Redis客户端都会自动去重定向，也就是这个过程对开发人员是透明的。redis-cli也支持自动重定向，只需要在启动时加入 -c 的参数。

预分区

为了实现在线动态扩容和数据分区，Redis的作者提出了预分区的方案，实际就是在同一台机器上部署多个Redis实例，当容量不够时将多个实例拆分到不同的机器上，这样就达到了扩容的效果。

1：在新机器上启动好对应端口的Redis实例
2：配置新端口为待迁移端口的从库
3：待复制完成，与主库完成同步后，切换所有客户端配置到新的从库的端口
4：配置从库为新的主库
5：移除老的端口实例
6：重复上述过程把要迁移的数据库转移到指定服务器上

以上拆分流程是Redis作者提出的一个平滑迁移的过程，不过该拆分方法还是很依赖Redis本身的复制功能的，如果主库快照数据文件过大，这个复制的过程也会很久，同时会给主库带来压力。

集群故障恢复

故障判定

集群中每个节点都会定期向其他节点发出ping命令，如果没有收到回复，就认为该节点为疑似下线，然后在集群中传播该信息
当集群中的某个节点，收到半数以上认为某节点已下线的信息，就会真的标记该节点为已下线，并在集群中传播该信息
如果已下线的节点是master节点，那就意味着一部分插槽无法写入了
如果集群任意master挂掉，且当前master没有slave，集群进入fail状态
如果集群超过半数以上master挂掉，无论是否有slave，集群进入fail状态
当集群不可用时，所有对集群的操作做都不可用，客户端会收到The cluster is down错误信息

故障恢复

发现某个master下线后，集群会进行故障恢复操作，来将一个slave 变成master，基于Raft算法，大致步骤如下：

1：某个slave向集群中每个节点发送请求，要求选举自己为master
2：如果收到请求的节点没有选举过其他slave，会同意
3：当集群中有超过节点数一半的节点同意该slave的请求，则该Slave选举成功
4：如果有多个slave同时参选，可能会出现没有任何slave当选的情况，将会等待一个随机时间，再次发出选举请求
5：选举成功后，slave会通过 slaveof no one命令把自己变成master

如果故障后还想集群继续工作，可设置cluster-require-full-coverage为 no，默认yes。

另外要弄清楚master挂掉了，重启还可以加入集群，只是变成Slave；但挂掉的slave重启，如果对应的master变化了，是不能加入集群的，除非修改它们的配置文件，将其原master指向新master。

只要主从关系建立，就会触发主和该从采用save方式持久化数据，不论你是否禁止save。

在集群中，如果默认主从关系的主挂了并立即重启，如果主没有做持久化，数据会完全丢失，从而从的数据也被清空。

建议恢复机制交给集群自己去处理，不要使用脚本来控制master的启停，操作不当会导致数据完全丢失

附录一：复制常用配置

关于复制一些基本操作命令：

info replication ：可以查看复制节点的相关信息(info是一个非常强大的命令，可以查看很多信息比如内存、cpu等)
slaveof：可在运行期间修改slave节点的信息，如果该数据库已经是某个主数据库的从数据库，那么会停止和原主数据库的同步关系，转而和新的主数据库同步
slaveof no one：使当前数据库停止与其他数据库的同步，转成主数据库，不影响它的slave节点
replicaof ：指定某一个redis作为另一个redis的从服务器，通过指定IP和端口来设置主redis
masterauth：如果主redis设置了验证密码的话（使用requirepass来设置），则在从redis的配置中要使用masterauth来设置校验密码，否则的话，主redis会拒绝从redis的访问请求
replica-read-only：设置从Redis为只读
repl-ping-replica-period：设置从redis会向主redis发出PING包的周期，默认是10秒
replica-serve-stale-data：设置当从redis失去了与主redis的连接，或者主从同步正在进行中时，redis该如何处理外部发来的访问请求，默认是yes

如果设置为yes（默认），则从redis仍会继续响应客户端的请求。如果设置为no，则从redis会对客户端的请求返回“SYNC with master in progress”，当然也有例外，当客户端发来INFO 请求和SLAVEOF请求，从redis还是会进行处理。

repl-timeout：设置主从同步的超时时间，要确保这个时限比 repl-ping-replica-period的值要大，否则每次主redis都会认为从redis超时
repl-disable-tcp-nodelay：设置在主从同步时是否禁用 TCP_NODELAY，如果开启，那么主redis会使用更少的TCP包和更少的带宽来向从redis传输数据。但是这可能会增加一些同步的延迟，大概会达到40毫秒左右。如果关闭，那么数据同步的延迟时间会降低，但是会消耗更多的带宽
repl-backlog-size：设置同步队列长度。队列长度（backlog)是主redis中的一个缓冲区，在与从redis断开连接期间，主redis会用这个缓冲区来缓存应该发给从redis的数据。这样的话，当从redis重新连接上之后，就不必重新全量同步数据，只需要同步这部分增量数据即可。默认是1M，可根据实际业务情况进行调整。
repl-backlog-ttl：设置主redis要等待的时间长度，如果主redis 等了这么长时间之后，还是无法连接到从redis，那么缓冲队列中的数据将被清理掉。设置为0，则表示永远不清理。默认是1个小时，应该足够了。
replica-priority：设置从redis优先级，在主redis持续工作不正常的情况，优先级高的从redis将会升级为主redis。而编号越小，优先级越高。当优先级被设置为0时，这个从redis将永远也不会被选中。默认的优先级为100。
min-replicas-to-write：设置执行写操作所需的最少从服务器数量，如果至少有这么多个从服务器，并且这些服务器的延迟值都少于 min-replicas-max-lag 秒，那么主服务器就会执行客户端请求的写操作，该配置保证其高可用性，默认是0
min-replicas-max-lag：设置最大连接延迟的时间， min-replicas-to-write和min-replicas-max-lag中有一个被置为0，则这个特性将被关闭。默认min-replicas-max-lag为10
repl-diskless-sync：是否开启无盘复制，通过网络完成复制而不是RDB文件，默认是no
repl-diskless-sync-delay：设置无盘复制延时开始秒数，默认是5秒，意思是当PSYNC触发的时候，master延时多少秒开始向slave传送数据流，以便等待更多的slave连接可以同时传送数据流，因为一旦 PSYNC开始后，如果有新的slave连接master，只能等待下次PSYNC。可以配置为0取消等待，立即开始
repl-diskless-load：是否使用无磁盘加载，这是个实验性的功能，知道下就可以

附录二：哨兵常用配置

bind：服务监听地址，用于客户端连接，默认本机地址
protected-mode：安全保护模式
port：监听的端口号
daemonize：是否以后台daemon方式运行
pidfile：pid文件位置
logfile：log文件位置
dir：工作目录
sentinel monitor ：设置要监控的 master服务器
sentinel auth-pass ：连接master服务的密码
sentinel down-after-milliseconds ：指定多少毫秒之后，主节点没有应答哨兵，此时哨兵主观上认为主节点下线
sentinel parallel-syncs ：表示允许并行同步的 slave个数，当Master挂了后，哨兵会选出新的Master，此时剩余的slave会向新的master发起同步数据
sentinel failover-timeout ：故障转移的超时时间，进行故障转移时，如果超过设置的毫秒，表示故障转移失败
sentinel notification-script ：配置当某一事件发生时所需要执行的脚本
sentinel client-reconfig-script ：客户端重新配置主节点参数脚本

附录三：常见集群操作命令

CLUSTER INFO：获取集群的信息
CLUSTER NODES：获取集群当前已知的所有节点，以及这些节点的相关信息
CLUSTER MEET ：将ip和port所指定的节点添加到集群当中
CLUSTER FORGET ：从集群中移除 node_id 指定的节点
CLUSTER REPLICATE ：将当前节点设置为 node_id 指定的节点的从节点
CLUSTER SAVECONFIG：将节点的配置文件保存到硬盘里面
CLUSTER ADDSLOTS [slot ...]：将一个或多个槽分配给当前节点
CLUSTER DELSLOTS [slot ...]：从当前节点移除一个或多个槽
CLUSTER FLUSHSLOTS：移除分配给当前节点的所有槽
CLUSTER SETSLOT NODE ：将槽分配给 node_id 指定的节点，如果槽已经分配给另一个节点，那么先让另一个节点删除该槽>，然后再进行分配
CLUSTER SETSLOT MIGRATING ：将本节点的槽迁移到指定的节点中
CLUSTER SETSLOT IMPORTING ：从指定节点导入槽到本节点
CLUSTER SETSLOT STABLE ：取消对槽的导入（import）或迁移（migrate）
CLUSTER KEYSLOT ：计算键 key 应该被放置在哪个槽
CLUSTER COUNTKEYSINSLOT ：返回槽目前包含的键值对数量
CLUSTER GETKEYSINSLOT ：返回count个槽中的键
migrate 目的节点ip 目的节点port 键名数据库号码超时时间 [copy] [replace]：迁移某个键值对

附录四：常见集群配置

cluster-enabled ：是否开启集群模式
cluster-config-file：集群配置文件，由Redis集群节点自动维护每次配置的改变
cluster-node-timeout：超时时间，集群节点不可用的最大时间
cluster-replica-validity-factor：集群副本有效因子，如果发生故障的Master数据看起来太旧，则其副本将避免进行故障转移
如果设置为0，则slave将总是尝试故障转移。如果设置为一个正数，那么最大失去连接的时间是node timeout乘以这个factor
cluster-migration-barrier：迁移屏障，一个master最少要有多少个slave的数量，才允许数据迁移
cluster-require-full-coverage：集群需要全覆盖，故障后是否继续运行
cluster-replica-no-failover：集群副本无故障转移，此选项设置为yes时，可防止从设备尝试对其进行故障转移
cluster-allow-reads-when-down：是否允许集群在宕机时读取

附录五：使用命令脚本管理集群

Redis Cluster 在5.0之后取消了ruby脚本 redis-trib.rb 的支持，集成到redis-cli里，直接使用redis-clit的参数-- cluster 来取代
查看命令：redis-cli --cluster help

create：创建集群，如果指定slave数量，集群会根据redis实例自行划分，但是master和slave配对关系是自由组合的；一般不要指定slave数量，采用add-node方式添加节点，手动指定master和salve的对应关系
check：检查集群状态
info：查看集群信息
fix：修复或恢复集群
reshard：重分片，插槽迁移
rebalance：平衡集群节点插槽
add-node：集群中增加节点，可以指定master和slave对应关系，一般用在手动映射master和slave关系场景中
del-node：集群中删除节点
call：执行一些命令
set-timeout：设置超时时间，单位毫秒
import：导入数据到集群里来
backup：备份

1
2
3
4
...
下一页
共 9 页

技术博文

是不是值得做？

三层原始成本评估模型

第一层：单体视角——评估一环成本

第二层：公司视角——评估整体ROI

场景一：小型需求

场景二：大型系统替换

第三层：市场视角——评估规模空间

方法一：基于企业招聘

方法二：基于私域日活

小结：三层评估还原成本本质

03 AI需求挖掘场景就这么拆

MAIR模型回顾

案例解析

结语

开篇引子：不是AI做不到，而是你没想到

AI需求挖掘与传统IT产品差别

MAIR：一套用于AI需求挖掘的思维工具

M 梳理业务流程

A 寻找脑力劳动

I 确定脑力价值

R 寻找替代方案

结语

引子：为什么是现在？

商业八要素的AI升级

AI重塑产品价值的启示

AI新产品系统化设计

结语

Gemini-cli快速使用教程

收费丝滑免费也香

1 准备阶段

2 配置环境

3 设置项目编号

5 启动gemini-cli

遇到错误

自动化脚本

对个人而言AI时代机遇是什么？

是什么构成了AI时代普通人的机遇

生产力大幅度提升

广泛使用场景

参与门槛低

AI时代个人机遇在哪

为什么说AI是第四次工业革命

引言

第一次革命：蒸汽的咆哮

第二次革命：电的光明

第三次革命：信息之潮

第四次革命：AI到来

吾将何在？革命正当时

5 原理篇—问渠哪得清如许

单线程模型

事务

基本特点

基本过程

持久化

RDB

AOF

混合模式

附录1：Redis事务基本命令

4 拓展篇—功夫在诗外

6.0新特性

ACL安全策略

RESP3和客户端缓存

I/O多线程

集群代理

Lua脚本

使用脚本好处

基本数据类型

基础语法

与Redis结合

发布订阅模式

常用优化手段

客户端

Lettuce简介

基本使用

附录1：Lua脚本常用标准库与函数

附录2：ACL规则

启用和禁用用户

允许和禁止调用

允许或禁止访问key