分享 AI、技术、云计算相关内容
小米MIMO大模型Token Plan可0.01元续费1个月
\n \n\n\n\n2026年5月27日小米MIMO大模型官宣永久降价最高降幅98%,并且重置了所有Token Plan用户的额度,不仅采用了新的计价模式,还增加了Token Plan的套餐用量,更具套餐档次不同提升了5-8倍。 \n\n\n\n\n\n\n\n \n\n\n\nMiMo系列模型的主要特点包括: \n\n\n\n \n\n\n\n强大的推理能力:在数学、编程和逻辑推理任务中表现优异 \n\n\n\n开源开放:模型权重已在Hugging Face等平台开源,支持社区二次开发 \n\n\n\n多尺寸适配:提供Lite、Standard、Pro、Max等不同规格版本,满足从个人开发者到企业级的多样化需求 \n\n\n\n中文优化:针对中文语境进行了深度优化,理解与生成能力更加精准 \n\n\n\n \n\n\n\n最重磅的消息是百亿Token计划的用户反应续费当前套餐仅需0.01元,博主已经续费成功,还没到期的用户可以去试试。 \n\n\n\n\n\n\n\n \n\n\n\n这个界面直接跳转对应的支付平台即可无视价格,博主选的支付宝平台,跳转后只需支付0.01元即可续费,续费完如不想续订记得取消自动续费。 \n\n\n\n\n\n\n\n \n\n\n\n支付后回到小米MIMO控制台即可看到续费成功和额度 \n\n\n\n\n\n\n\n \n\n\n\n尚未到期的用户抓紧试试,官方并没有相关的宣传口径,不知道什么时候会失效,以官方的显示为准。 \n
搜索结果标签显示 EU.org 而非网站名称的解决办法
在搜索结果中显示 EU.org: free domain names since 1996 而不是你预期的网站名称,通常是因为 Google 的算法认为该域名的根域名标题比你设置的站点标题更具描述性,或者你的站点 Site Name(网站名称) 结构化数据未被正确识别。 \n\n你可以通过以下几个步骤进行优化和修改: \n\n## 1. 检查并设置首页 Title 标签\n\nGoogle 搜索结果最顶部的文字通常被称为 Site Name。确保你的 WordPress 首页 HTML 中包含正确的 `` 标签。 \n\n\n- 推荐格式: 站点名称 - 描述 或 站点名称 | 官方网站。\n- 如果你使用了 SEO 插件(如 Rank Math 或 Yoast SEO),请检查"标题和元数据"设置中的"首页标题"。\n\n\n## 2. 添加 WebSite 结构化数据(最关键)\n\n这是告诉 Google “我的网站叫什么"的最直接方式。你需要向首页添加一段 JSON-LD 代码。如果你使用 SEO 插件,通常在插件设置里填写 Site Name 即可自动生成;如果没有,可以手动在主题的 header.php 中添加: \n\n``` \n{\n “@context”: “https://schema.org”,\n “@type”: “WebSite”,\n “name”: “定风波 | AI技术博客”,\n “url”: “https://dingfengbo.eu.org/"\n}\n ...
2026 终端 AI 决战:Gemini CLI vs Claude Code vs GitHub Copilot 深度横评
在 2026 年的今天,AI 辅助开发已经从"网页对话框"全面进化到了"终端原生(Terminal Native)"。作为开发者,我们不再满足于简单的代码生成,而是需要一个能读懂整个工程目录、能自主运行测试、甚至能管理服务器的命令行 AI Agent。 \n\n目前市面上呼声最高的三大工具:Google 的 Gemini CLI、Anthropic 的 Claude Code,以及曾经的开创者 OpenAI Codex(现已深度集成入 GitHub Copilot CLI)。 \n\n面对这三大神器,开发者该如何取舍?本文将从核心架构、实战表现及成本三个维度为你拆解。 \n\n## 一、三大选手概览\n\n\n- Gemini CLI(Google):上下文窗口 1M-2M Tokens,核心卖点是逻辑闭环、Plan Mode、超大上下文,原生 Google 搜索支持\n- Claude Code(Anthropic):上下文窗口 200K Tokens,核心卖点是自主性、极高代码质量、多轮重构,需通过 MCP 扩展联网\n- GitHub Copilot CLI(Microsoft/OpenAI):上下文窗口 128K+,核心卖点是生态集成、极致的 IDE 协同,主要是 GitHub 数据搜索\n\n\n## 二、深度对比:谁才是真正的"终端霸主"?\n\n### 1. Gemini CLI:不仅仅是代码,更是"全局调度员"\n\n得益于 Gemini 3 系列模型的超长上下文,Gemini CLI 是处理"巨型工程"的唯一选择。 \n\n\n- 优势:你可以直接把整个 WordPress 博客的所有源码和数月的运行日志一次性塞给它。它的 Plan Mode(方案模式)非常稳健,在执行高危 Shell 命令前,会先列出逻辑步骤,极大降低了误删生产环境文件的风险。\n- 适合场景:全量代码审计、跨文件逻辑重构、时效性信息检索(内置 Google 搜索)。\n\n\n### 2. Claude Code:纯粹的"代码艺术家"\n\n在 2026 年的测评中,Claude 4.6 系列模型在编码逻辑的细腻程度上依然领先。 ...
GPT-image-2 深度评测:OpenAI 最强图像生成模型的实力与代价
GPT-image-2 深度评测:OpenAI 最强图像生成模型的实力与代价 \n2026 年 4 月 21 日,OpenAI 正式发布 GPT-image-2(模型快照:gpt-image-2-2026-04-21),取代了去年的 GPT-image-1.5 成为新的旗舰图像生成模型。这不是一个简单的迭代——它在生成质量、文字渲染、多轮编辑和 API 集成上都做了大幅升级,但价格也同样"旗舰"。 \n \n社区评测结果已经陆续出炉,今天就来拆解这个模型到底强在哪、贵在哪、值不值。 \n \n \n \n## 一、GPT-image-2 是什么 \nGPT-image-2 是 OpenAI 最新的原生多模态图像生成模型,可以通过 Chat Completions API、Responses API、Image API 等多种方式调用。 \n \n \n \n维度 \nGPT-image-2 \nGPT-image-1.5 \nDALL·E 3 \n \n \n \n \n发布日期 \n2026-04-21 \n2025 \n2023 \n \n \n支持输入 \n文本 + 图片 \n文本 + 图片 \n仅文本 \n \n \n支持输出 \n文本 + 图片 \n文本 + 图片 \n仅图片 \n \n \n图片编辑 \n✅ 多轮 \n✅ 单轮 \n❌ \n \n \n流式输出 \n✅ 支持 \n❌ \n❌ \n \n \n透明背景 \n✅ \n❌ \n❌ \n \n \n最大分辨率 \n2048×2048 \n1024×1024 \n1024×1024 \n \n \n \n最关键的变化:GPT-image-2 现在是一个多模态模型,可以同时理解文本和图像,也能同时输出文本和图像。它不再像 DALL·E 系列那样是个"专用的图片生成器",而是一个具备图像生成能力的通用模型。 \n \n \n \n## 二、核心能力 \n### 1. 文字渲染:终于能写字了 \nDALL·E 3 的文字渲染一直是"勉强能看"的水平——偶尔正确,经常乱码。GPT-image-2 在这方面有质的飞跃: \n \n \t- 英文文字渲染准确率大幅提升,大多数情况下可以直接在图中生成可读的文字 \n \t- 支持手写风格、印刷风格、装饰字体等多种文字样式 \n \t- 中文渲染也有进步,但复杂汉字仍有偶尔的错误 \n \n社区评测中,用户让 GPT-image-2 生成带有品牌 Logo、菜单、海报等文字密集的图片,结果比 Midjourney v7 和 Ideogram 3 都要准确。 \n### 2. 多轮编辑:渐进式创作的范式转变 \n通过 Responses API,GPT-image-2 支持多轮对话式图片编辑: \n``` Turn 1: “画一只灰色的虎斑猫抱着一只戴着橙色围巾的水獭” \nTurn 2: “现在让它看起来更写实” \nTurn 3: “把背景换成雪景” \n ...
小米 MiMo-V2.5:309B 参数的性价比之王,以及 Token Plan 的野心
小米 MiMo-V2.5:309B 参数的"性价比之王",以及 Token Plan 的野心\n如果说 2025 年底小米开源 MiMo-V2-Flash 是"试试水",那 2026 年的 MiMo-V2.5 就是正式亮剑了——309B 总参数、15B 激活、1M 上下文窗口、MIT 开源协议,而且 API 价格低到令人怀疑标错了小数点。 \n今天就来拆解这个"手机厂做的最强开源大模型",以及小米背后的 Token Plan 到底在下一盘什么棋。 \n \n## 一、MiMo-V2.5 是什么\nMiMO-V2.5 是小米自研的大语言模型 MiMo 系列的最新版本,基于 MoE(混合专家)架构。 \n\n\n\n维度\nMiMo-V2.5\nMiMo-V2.5-Pro\n\n\n\n\n总参数\n309B\n309B\n\n\n激活参数\n15B\n15B\n\n\n上下文窗口\n1M tokens\n1M tokens\n\n\n架构\nMoE + 混合注意力\nMoE + 混合注意力\n\n\n开源协议\nMIT\nMIT\n\n\nAPI 价格(输入)\n$0.4/M tokens\n$1/M tokens\n\n\nAPI 价格(输出)\n$2/M tokens\n$3/M tokens\n\n\n\n1M 上下文窗口是目前开源模型中最长的之一,比 DeepSeek V3.2 和 Kimi K2 的 256K 长了 4 倍。这意味着你可以把整本小说、整个代码库一次性丢进去。 \n价格对比:同级别的 GPT-5 输入 $2/M、输出 $10/M;Claude Sonnet 4.5 输入 $3/M、输出 $15/M。MiMo-V2.5 的价格只有它们的 1/5 到 1/7。 ...
Kimi K2.6 vs GLM-5.1:国产万亿参数 MoE 双雄对决
Kimi K2.6 vs GLM-5.1:国产万亿参数 MoE 双雄对决\n2026 年的中国 AI 圈,两位"万亿级"选手几乎同时亮剑——月之暗面的 Kimi K2.6 和智谱的 GLM-5.1。两者都是 MoE 架构、都是万亿参数、都主打 Agent 能力,但路线和气质截然不同。今天就来拆解这两个模型,看看各自强在哪、弱在哪、适合什么场景。 \n \n## 一、基本参数对比\n\n\n\n维度\nKimi K2.6\nGLM-5.1\n\n\n\n\n开发方\n月之暗面(Moonshot AI)\n智谱 AI(Z.ai)\n\n\n架构\nMoE(混合专家)\nMoE(混合专家)\n\n\n总参数\n1T\n744B\n\n\n激活参数\n32B\n40B\n\n\n专家数\n384(选 8)\n—\n\n\n上下文长度\n256K\n128K(DSA 稀疏注意力)\n\n\n多模态\n原生多模态(MoonViT 视觉编码器)\n文本为主,GLM-V 系列独立\n\n\n开源协议\n自定义(见 HuggingFace)\nApache 2.0\n\n\n发布时间\n2026 年 4 月\n2026 年 3 月\n\n\n\n关键差异:K2.6 参数更多(1T vs 744B),但激活参数更少(32B vs 40B),意味着推理成本更低;GLM-5.1 虽然总参数少,但激活量大,单步计算更重。K2.6 天然带视觉能力,GLM-5.1 的多模态需要走独立模型(GLM-V 系列)。 \n \n## 二、核心能力对比\n### 🤖 Agent 能力\n这是两者的主战场。 \nKimi K2.6 的杀手锏:Agent Swarm \nK2.6 最大的卖点是可以横向扩展到 300 个子代理、4000 个协调步骤,动态拆解任务到并行的专业化子任务中。在 BrowseComp Agent Swarm 模式下得分 86.3,比不用 Swarm 模式高了 3 个点。简单说:K2.6 是为"一群 AI 协作干大事"设计的。 ...
Agent Skill 完全指南:如何为 AI 助手添加专业技能包
\n## 什么是 Agent Skill?\n\n在 AI 助手领域,Agent Skill(代理技能)是一种模块化、自包含的能力扩展包,类似于编程中的插件或库。它为通用的 AI 模型提供特定领域的知识、工作流程和工具集成,使其能够胜任专业任务。 \n\n打个比方:如果说 AI 模型像是一个聪明但缺乏专业经验的大学毕业生,那么 Agent Skill 就是针对特定岗位的岗前培训手册和工具箱。 \n\n## 为什么需要 Agent Skill?\n\n通用大模型(如 GPT、Claude、Qwen)虽然知识面广,但在以下方面存在局限: \n\n\n- 领域知识不足:不了解公司内部系统、业务逻辑、专业术语\n- 流程不明确:不知道特定任务的标准化操作步骤\n- 工具集成缺失:无法直接调用专业软件或 API\n- 上下文理解有限:难以理解复杂的领域特定格式或约定\n\n\nAgent Skill 通过模块化封装解决这些问题,让 AI 助手可以即插即用地获得专业能力。 \n\n## Agent Skill 的核心组成\n\n一个标准的 Agent Skill 包含以下部分: \n\n### 1. SKILL.md(必需)\n\n这是技能的核心文件,包含: \n\n- YAML 元数据:技能名称、描述、触发条件\n- Markdown 指南:使用说明、工作流程、最佳实践\n\n\n示例结构: \n``` skill-name/\n├── SKILL.md # 核心描述文件\n├── scripts/ # 可执行脚本\n├── references/ # 参考文档\n└── assets/ # 输出资源文件 \n\n**使用场景**: \n\n- 重复执行的自动化任务\n- 需要精确控制的操作(如文件处理)\n- 与外部系统集成的接口\n\n\n### 3. 参考文档目录(references/)\n\n存放按需加载的文档,避免占用过多上下文。 \n\n**典型内容**: \n\n- 数据库模式说明\n- API 规范文档\n- 公司政策与流程指南\n- 专业术语表\n\n\n### 4. 资源文件目录(assets/)\n\n存放用于输出的文件资源,而非输入到上下文的文档。 \n\n**典型内容**: \n\n- 模板文件(PPT、Word、HTML)\n- 品牌资源(Logo、字体、图标)\n- 示例文档\n\n\n## Agent Skill 的工作原理\n\nAgent Skill 的触发机制基于**语义匹配**: \n\n\n- **用户请求**:用户发送消息给 AI 助手\n- **描述匹配**:系统根据用户意图,匹配最相关的 Skill 描述\n- **技能加载**:匹配成功后,加载对应的 SKILL.md 内容\n- **能力执行**:AI 根据加载的技能指南执行任务\n\n\n这种设计确保了**上下文高效利用**——只有在需要时才加载特定技能,避免一次性加载所有知识。 \n\n## 主流 Agent Skill 平台\n\n### ClawHub\n\n**ClawHub** 是 OpenClaw 生态的技能市场,提供版本化的技能注册与分发: \n\n\n- **版本管理**:类似 npm,支持版本回滚\n- **语义搜索**:基于向量检索,精准匹配技能\n- **开放发布**:无门槛,任何人可发布技能\n\n\n安装技能示例: \n``` npx clawhub@latest install sonoscli ```\n\n### OpenClaw 内置技能\n\nOpenClaw 自带丰富的官方技能,包括: \n\n- **skill-creator**:创建、编辑、审核技能\n- **website**:构建快速、可访问、SEO 友好的网站\n- **productivity**:任务管理、时间规划、习惯追踪\n- **weather**:天气查询与预报\n- **tmux**:远程控制 tmux 会话\n\n\n## 如何创建自己的 Agent Skill?\n\n### 步骤一:确定技能定位\n\n回答以下问题: \n\n- 解决什么问题?\n- 目标用户是谁?\n- 需要哪些工具/数据?\n\n\n### 步骤二:编写 SKILL.md\n\n遵循**简洁原则**: \n\n- 只包含模型不知道的知识\n- 用示例代替冗长解释\n- 明确触发条件和适用场景\n\n\n### 步骤三:组织资源文件\n\n按需添加: \n\n- 确定性脚本 → `scripts/`\n- 参考文档 → `references/`\n- 输出模板 → `assets/`\n\n\n### 步骤四:测试与发布\n\n\n- 本地测试技能是否正常触发\n- 验证输出质量和可靠性\n- 发布到 ClawHub 或其他平台\n\n\n## Agent Skill 的设计原则\n\n### 1. 上下文是公共资源\n\n技能共享上下文窗口,与系统提示、对话历史、其他技能竞争空间。因此: \n\n- 默认假设:模型已经足够聪明\n- 只添加模型不知道的信息\n- 每个段落都要证明其存在价值\n\n\n### 2. 匹配自由度与确定性\n\n根据任务特性选择控制级别: \n\n- **高自由度**:文本指令,适合多种方法都有效的场景\n- **中自由度**:伪代码或参数化脚本,有一定变化空间\n- **低自由度**:具体脚本,适合必须精确执行的任务\n\n\n### 3. 避免重复与冗余\n\n信息应该存在于一个地方: \n\n- 核心流程 → SKILL.md\n- 详细文档 → references/\n- 不要在两处重复相同内容\n\n\n## 应用场景示例\n\n### 企业内部助手\n\n创建企业专属技能包,包含: \n\n- 公司政策与流程文档\n- 内部系统 API 规范\n- 数据库模式说明\n- 自动化工作流脚本\n\n\n### 开发者工具链\n\n集成开发环境相关技能: \n\n- 代码风格检查与修复\n- 部署流程自动化\n- API 测试与文档生成\n- 代码审查辅助\n\n\n### 内容创作\n\n为内容创作者定制的技能: \n\n- SEO 内容优化指南\n- 品牌风格手册\n- 多平台发布流程\n- 内容质量检查清单\n\n\n## 总结\n\nAgent Skill 是连接通用 AI 能力与专业需求的桥梁。通过模块化、可版本化、语义驱动的技能包,AI 助手可以获得从企业知识到专业工具的各类能力扩展。 \n\n对于开发者和企业用户而言,掌握 Agent Skill 的设计与创建,是构建高质量 AI 应用的关键一步。 \n\n --- \n\n*本文基于 OpenClaw 官方文档与 ClawHub 平台信息整理。* \n
Qwen3.6-35B-A3B 发布:阿里通义千问最新 MoE 模型,35B 参数仅激活 3B
\n## 前言\n\n2026年4月,阿里通义千问团队发布 Qwen3.6-35B-A3B,这是 Qwen3.6 系列的首个开源权重变体。作为一款 MoE(Mixture-of-Experts)架构模型,它在保持 35B 总参数的同时,每次推理仅激活 3B 参数,实现了性能与效率的完美平衡。 \n\n## 核心亮点\n\n### 1. 高效 MoE 架构\n\nQwen3.6-35B-A3B 采用混合专家架构: \n\n- 总参数:35B\n- 激活参数:仅 3B(每次推理)\n- 专家数量:256 个专家,每次激活 8 个路由专家 + 1 个共享专家\n- 上下文长度:原生支持 262K tokens,可扩展至 100 万 tokens\n\n\n这种设计使得模型在保持强大能力的同时,推理成本大幅降低,非常适合生产环境部署。 \n\n### 2. 强化的 Agentic Coding 能力\n\nQwen3.6 在代码生成方面有显著提升: \n\n- SWE-bench Verified:73.4 分(领先同类模型)\n- Terminal-Bench 2.0:51.5 分\n- SkillsBench Avg5:28.7 分\n\n\n特别值得一提的是,模型支持Thinking Preservation(思考保留),可以保留历史消息的推理上下文,非常适合迭代开发和复杂任务。 \n\n### 3. 多模态能力\n\nQwen3.6-35B-A3B 不仅擅长文本处理,还具备强大的视觉理解能力: \n\n- MMMU-Pro:75.3 分\n- Mathvista:86.4 分\n- RealWorldQA:85.3 分\n\n\n在文档理解、图表分析、视频理解等任务上表现出色,适合构建多模态应用。 \n\n## 技术架构\n\nQwen3.6-35B-A3B 的架构设计颇具特色: \n\n- 隐藏层维度:2048\n- 层数:40 层\n- 隐藏层布局:10 × (3 × (Gated DeltaNet → MoE) → 1 × (Gated Attention → MoE))\n- Gated DeltaNet:32 个 V 注意力头,16 个 QK 注意力头\n- Gated Attention:16 个 Q 注意力头,2 个 KV 注意力头\n\n\n这种创新的架构设计,结合了 DeltaNet 线性注意力和传统注意力机制的优势。 ...
Claude Opus 4.7 发布:Anthropic 最新旗舰模型深度解析
\n## 前言\n\n2026年4月,Anthropic 正式发布 Claude Opus 4.7,这是其最新一代旗舰大模型。作为 AI 领域的重磅更新,Claude Opus 4.7 在推理能力、多模态理解和安全性方面都有显著提升。 \n\n## 核心升级亮点\n\n### 1. 推理能力大幅提升\n\nOpus 4.7 在复杂推理任务上表现出色,特别是在数学、编程和逻辑分析方面。相比上一代,推理准确率提升约 15-20%。 \n\n### 2. 多模态理解更深入\n\n新版本增强了对图像、图表和文档的理解能力,能够更准确地分析复杂视觉内容,支持更长的上下文窗口。 \n\n### 3. 安全性与可控性\n\nAnthropic 延续其对 AI 安全的重视,Opus 4.7 在减少幻觉、拒绝有害请求方面表现更稳健,同时提供了更细粒度的可控性。 \n\n## 技术细节\n\n\n- 参数规模:未公开,预计在 100B+ 级别\n- 上下文窗口:支持 256K token\n- 多模态:文本、图像、文档理解\n- 推理速度:相比 Opus 4 提升约 30%\n\n\n## 行业影响\n\nClaude Opus 4.7 的发布,进一步加剧了大模型领域的竞争。与 GPT-5、Gemini 等模型相比,Claude 在安全性和可控性上的差异化定位更加清晰。 \n\n对于开发者和企业用户来说,Opus 4.7 提供了更多选择,特别是在需要高安全性和复杂推理的场景中。 \n\n## 如何体验\n\n目前 Claude Opus 4.7 已在 Claude.ai 上线,用户可以直接体验。企业用户可通过 API 接入。 \n\n## 总结\n\nClaude Opus 4.7 是 Anthropic 在 2026 年的重要里程碑,展示了其在 AI 安全与能力平衡上的持续探索。对于关注 AI 发展的人来说,这无疑是一个值得关注的更新。 ...
OpenRouter 新模型 Elephant Alpha:100B 参数免费使用,256K 上下文等你体验
一款主打"智能效率"的 100B 参数文本模型,完全免费,支持 256K 上下文和 32K 输出\n\n## 模型概述\n\nOpenRouter 最近上架了一款名为 Elephant Alpha 的新模型。这是一款 100B(千亿)参数的纯文本模型,主打"智能效率"(intelligence efficiency)——即在保持强劲性能的同时,尽量减少不必要的 token 消耗。 \n\n最吸引人的是:完全免费。 \n\n## 核心参数一览\n\n\n参数\n数值\n\n\n模型 ID\nopenrouter/elephant-alpha\n\n\n参数量\n100B\n\n\n上下文长度\n256K tokens\n\n\n最大输出\n32K tokens\n\n\n输入模态\n纯文本\n\n\n输出模态\n纯文本\n\n\n定价\n免费\n\n\n\n## 支持的 API 参数\n\nElephant Alpha 支持以下 OpenRouter 标准参数: \n\n\n- temperature - 控制输出随机性\n- top_p - 核采样参数\n- max_tokens - 最大输出 token 数\n- response_format - 响应格式控制\n- structured_outputs - 结构化输出(JSON 模式)\n- tools / tool_choice - 函数调用支持\n\n\n## 快速上手\n\n### 通过 OpenRouter API 调用\n\ncurl https://openrouter.ai/api/v1/chat/completions \\\n -H "Content-Type: application/json" \\\n -H "Authorization: Bearer $OPENROUTER_API_KEY" \\\n -d '{\n "model": "openrouter/elephant-alpha",\n "messages": [\n {"role": "user", "content": "解释一下什么是智能效率,为什么重要?"}\n ]\n }'\n\n\n### Python 调用示例\n\n``` import openai\n\nclient = openai.OpenAI(\n base_url=“https://openrouter.ai/api/v1",\n api_key=“YOUR_OPENROUTER_API_KEY”\n) ...