👋 欢迎来到我的博客

分享 AI、技术、云计算相关内容

小米MIMO大模型Token Plan可0.01元续费1个月

2026年5月27日小米MIMO大模型官宣永久降价最高降幅98%,并且重置了所有Token Plan用户的额度,不仅采用了新的计价模式,还增加了Token Plan的套餐用量,更具套餐档次不同提升了5-8倍。 MiMo系列模型的主要特点包括: 强大的推理能力:在数学、编程和逻辑推理任务中表现优异 开源开放:模型权重已在Hugging Face等平台开源,支持社区二次开发 多尺寸适配:提供Lite、Standard、Pro、Max等不同规格版本,满足从个人开发者到企业级的多样化需求 中文优化:针对中文语境进行了深度优化,理解与生成能力更加精准 最重磅的消息是百亿Token计划的用户反应续费当前套餐仅需0.01元,博主已经续费成功,还没到期的用户可以去试试。 这个界面直接跳转对应的支付平台即可无视价格,博主选的支付宝平台,跳转后只需支付0.01元即可续费,续费完如不想续订记得取消自动续费。 支付后回到小米MIMO控制台即可看到续费成功和额度 尚未到期的用户抓紧试试,官方并没有相关的宣传口径,不知道什么时候会失效,以官方的显示为准。

May 27, 2026 · 1 min · 13 words · zzh

搜索结果标签显示 EU.org 而非网站名称的解决办法

在搜索结果中显示 EU.org: free domain names since 1996 而不是你预期的网站名称,通常是因为 Google 的算法认为该域名的根域名标题比你设置的站点标题更具描述性,或者你的站点 Site Name(网站名称) 结构化数据未被正确识别。 你可以通过以下几个步骤进行优化和修改: 1. 检查并设置首页 Title 标签 Google 搜索结果最顶部的文字通常被称为 Site Name。确保你的 WordPress 首页 HTML 中包含正确的 <title> 标签。 推荐格式: 站点名称 - 描述 或 站点名称 | 官方网站。 如果你使用了 SEO 插件(如 Rank Math 或 Yoast SEO),请检查"标题和元数据"设置中的"首页标题"。 2. 添加 WebSite 结构化数据(最关键) 这是告诉 Google “我的网站叫什么"的最直接方式。你需要向首页添加一段 JSON-LD 代码。如果你使用 SEO 插件,通常在插件设置里填写 Site Name 即可自动生成;如果没有,可以手动在主题的 header.php 中添加: 1 2{ 3 "@context": "https://schema.org", 4 "@type": "WebSite", 5 "name": "定风波 | AI技术博客", 6 "url": "https://dingfengbo.eu.org/" 7} 3. 修改 WordPress 常规设置 确保 WordPress 后台的 设置 -> 常规 中: ...

May 1, 2026 · 1 min · 140 words · zzh

2026 终端 AI 决战:Gemini CLI vs Claude Code vs GitHub Copilot 深度横评

在 2026 年的今天,AI 辅助开发已经从"网页对话框"全面进化到了"终端原生(Terminal Native)"。作为开发者,我们不再满足于简单的代码生成,而是需要一个能读懂整个工程目录、能自主运行测试、甚至能管理服务器的命令行 AI Agent。 目前市面上呼声最高的三大工具:Google 的 Gemini CLI、Anthropic 的 Claude Code,以及曾经的开创者 OpenAI Codex(现已深度集成入 GitHub Copilot CLI)。 面对这三大神器,开发者该如何取舍?本文将从核心架构、实战表现及成本三个维度为你拆解。 一、三大选手概览 Gemini CLI(Google):上下文窗口 1M-2M Tokens,核心卖点是逻辑闭环、Plan Mode、超大上下文,原生 Google 搜索支持 Claude Code(Anthropic):上下文窗口 200K Tokens,核心卖点是自主性、极高代码质量、多轮重构,需通过 MCP 扩展联网 GitHub Copilot CLI(Microsoft/OpenAI):上下文窗口 128K+,核心卖点是生态集成、极致的 IDE 协同,主要是 GitHub 数据搜索 二、深度对比:谁才是真正的"终端霸主"? 1. Gemini CLI:不仅仅是代码,更是"全局调度员" 得益于 Gemini 3 系列模型的超长上下文,Gemini CLI 是处理"巨型工程"的唯一选择。 优势:你可以直接把整个 WordPress 博客的所有源码和数月的运行日志一次性塞给它。它的 Plan Mode(方案模式)非常稳健,在执行高危 Shell 命令前,会先列出逻辑步骤,极大降低了误删生产环境文件的风险。 适合场景:全量代码审计、跨文件逻辑重构、时效性信息检索(内置 Google 搜索)。 2. Claude Code:纯粹的"代码艺术家" 在 2026 年的测评中,Claude 4.6 系列模型在编码逻辑的细腻程度上依然领先。 ...

May 1, 2026 · 1 min · 162 words · zzh

GPT-image-2 深度评测:OpenAI 最强图像生成模型的实力与代价

GPT-image-2 深度评测:OpenAI 最强图像生成模型的实力与代价 2026 年 4 月 21 日,OpenAI 正式发布 GPT-image-2(模型快照:gpt-image-2-2026-04-21),取代了去年的 GPT-image-1.5 成为新的旗舰图像生成模型。这不是一个简单的迭代——它在生成质量、文字渲染、多轮编辑和 API 集成上都做了大幅升级,但价格也同样"旗舰"。 社区评测结果已经陆续出炉,今天就来拆解这个模型到底强在哪、贵在哪、值不值。 一、GPT-image-2 是什么 GPT-image-2 是 OpenAI 最新的原生多模态图像生成模型,可以通过 Chat Completions API、Responses API、Image API 等多种方式调用。 维度 GPT-image-2 GPT-image-1.5 DALL·E 3 发布日期 2026-04-21 2025 2023 支持输入 文本 + 图片 文本 + 图片 仅文本 支持输出 文本 + 图片 文本 + 图片 仅图片 图片编辑 ✅ 多轮 ✅ 单轮 ❌ 流式输出 ✅ 支持 ❌ ❌ 透明背景 ✅ ❌ ❌ 最大分辨率 2048×2048 1024×1024 1024×1024 最关键的变化:GPT-image-2 现在是一个多模态模型,可以同时理解文本和图像,也能同时输出文本和图像。它不再像 DALL·E 系列那样是个"专用的图片生成器",而是一个具备图像生成能力的通用模型。 ...

April 23, 2026 · 2 min · 410 words · zzh

小米 MiMo-V2.5:309B 参数的性价比之王,以及 Token Plan 的野心

小米 MiMo-V2.5:309B 参数的"性价比之王",以及 Token Plan 的野心 如果说 2025 年底小米开源 MiMo-V2-Flash 是"试试水",那 2026 年的 MiMo-V2.5 就是正式亮剑了——309B 总参数、15B 激活、1M 上下文窗口、MIT 开源协议,而且 API 价格低到令人怀疑标错了小数点。 今天就来拆解这个"手机厂做的最强开源大模型",以及小米背后的 Token Plan 到底在下一盘什么棋。 一、MiMo-V2.5 是什么 MiMO-V2.5 是小米自研的大语言模型 MiMo 系列的最新版本,基于 MoE(混合专家)架构。 维度 MiMo-V2.5 MiMo-V2.5-Pro 总参数 309B 309B 激活参数 15B 15B 上下文窗口 1M tokens 1M tokens 架构 MoE + 混合注意力 MoE + 混合注意力 开源协议 MIT MIT API 价格(输入) $0.4/M tokens $1/M tokens API 价格(输出) $2/M tokens $3/M tokens 1M 上下文窗口是目前开源模型中最长的之一,比 DeepSeek V3.2 和 Kimi K2 的 256K 长了 4 倍。这意味着你可以把整本小说、整个代码库一次性丢进去。 ...

April 23, 2026 · 2 min · 383 words · zzh

Kimi K2.6 vs GLM-5.1:国产万亿参数 MoE 双雄对决

Kimi K2.6 vs GLM-5.1:国产万亿参数 MoE 双雄对决 2026 年的中国 AI 圈,两位"万亿级"选手几乎同时亮剑——月之暗面的 Kimi K2.6 和智谱的 GLM-5.1。两者都是 MoE 架构、都是万亿参数、都主打 Agent 能力,但路线和气质截然不同。今天就来拆解这两个模型,看看各自强在哪、弱在哪、适合什么场景。 一、基本参数对比 维度 Kimi K2.6 GLM-5.1 开发方 月之暗面(Moonshot AI) 智谱 AI(Z.ai) 架构 MoE(混合专家) MoE(混合专家) 总参数 1T 744B 激活参数 32B 40B 专家数 384(选 8) — 上下文长度 256K 128K(DSA 稀疏注意力) 多模态 原生多模态(MoonViT 视觉编码器) 文本为主,GLM-V 系列独立 开源协议 自定义(见 HuggingFace) Apache 2.0 发布时间 2026 年 4 月 2026 年 3 月 关键差异:K2.6 参数更多(1T vs 744B),但激活参数更少(32B vs 40B),意味着推理成本更低;GLM-5.1 虽然总参数少,但激活量大,单步计算更重。K2.6 天然带视觉能力,GLM-5.1 的多模态需要走独立模型(GLM-V 系列)。 ...

April 22, 2026 · 2 min · 261 words · zzh

Agent Skill 完全指南:如何为 AI 助手添加专业技能包

什么是 Agent Skill? 在 AI 助手领域,Agent Skill(代理技能)是一种模块化、自包含的能力扩展包,类似于编程中的插件或库。它为通用的 AI 模型提供特定领域的知识、工作流程和工具集成,使其能够胜任专业任务。 打个比方:如果说 AI 模型像是一个聪明但缺乏专业经验的大学毕业生,那么 Agent Skill 就是针对特定岗位的岗前培训手册和工具箱。 为什么需要 Agent Skill? 通用大模型(如 GPT、Claude、Qwen)虽然知识面广,但在以下方面存在局限: 领域知识不足:不了解公司内部系统、业务逻辑、专业术语 流程不明确:不知道特定任务的标准化操作步骤 工具集成缺失:无法直接调用专业软件或 API 上下文理解有限:难以理解复杂的领域特定格式或约定 Agent Skill 通过模块化封装解决这些问题,让 AI 助手可以即插即用地获得专业能力。 Agent Skill 的核心组成 一个标准的 Agent Skill 包含以下部分: 1. SKILL.md(必需) 这是技能的核心文件,包含: YAML 元数据:技能名称、描述、触发条件 Markdown 指南:使用说明、工作流程、最佳实践 示例结构: 1skill-name/ 2├── SKILL.md # 核心描述文件 3├── scripts/ # 可执行脚本 4├── references/ # 参考文档 5└── assets/ # 输出资源文件 2. 脚本目录(scripts/) 存放可执行代码(Python、Bash 等),用于需要确定性可靠性的任务。 使用场景: 重复执行的自动化任务 需要精确控制的操作(如文件处理) 与外部系统集成的接口 3. 参考文档目录(references/) 存放按需加载的文档,避免占用过多上下文。 ...

April 17, 2026 · 2 min · 231 words · zzh

Qwen3.6-35B-A3B 发布:阿里通义千问最新 MoE 模型,35B 参数仅激活 3B

前言 2026年4月,阿里通义千问团队发布 Qwen3.6-35B-A3B,这是 Qwen3.6 系列的首个开源权重变体。作为一款 MoE(Mixture-of-Experts)架构模型,它在保持 35B 总参数的同时,每次推理仅激活 3B 参数,实现了性能与效率的完美平衡。 核心亮点 1. 高效 MoE 架构 Qwen3.6-35B-A3B 采用混合专家架构: 总参数:35B 激活参数:仅 3B(每次推理) 专家数量:256 个专家,每次激活 8 个路由专家 + 1 个共享专家 上下文长度:原生支持 262K tokens,可扩展至 100 万 tokens 这种设计使得模型在保持强大能力的同时,推理成本大幅降低,非常适合生产环境部署。 2. 强化的 Agentic Coding 能力 Qwen3.6 在代码生成方面有显著提升: SWE-bench Verified:73.4 分(领先同类模型) Terminal-Bench 2.0:51.5 分 SkillsBench Avg5:28.7 分 特别值得一提的是,模型支持Thinking Preservation(思考保留),可以保留历史消息的推理上下文,非常适合迭代开发和复杂任务。 3. 多模态能力 Qwen3.6-35B-A3B 不仅擅长文本处理,还具备强大的视觉理解能力: MMMU-Pro:75.3 分 Mathvista:86.4 分 RealWorldQA:85.3 分 在文档理解、图表分析、视频理解等任务上表现出色,适合构建多模态应用。 技术架构 Qwen3.6-35B-A3B 的架构设计颇具特色: 隐藏层维度:2048 层数:40 层 隐藏层布局:10 × (3 × (Gated DeltaNet → MoE) → 1 × (Gated Attention → MoE)) Gated DeltaNet:32 个 V 注意力头,16 个 QK 注意力头 Gated Attention:16 个 Q 注意力头,2 个 KV 注意力头 这种创新的架构设计,结合了 DeltaNet 线性注意力和传统注意力机制的优势。 ...

April 17, 2026 · 1 min · 162 words · zzh

Claude Opus 4.7 发布:Anthropic 最新旗舰模型深度解析

前言 2026年4月,Anthropic 正式发布 Claude Opus 4.7,这是其最新一代旗舰大模型。作为 AI 领域的重磅更新,Claude Opus 4.7 在推理能力、多模态理解和安全性方面都有显著提升。 核心升级亮点 1. 推理能力大幅提升 Opus 4.7 在复杂推理任务上表现出色,特别是在数学、编程和逻辑分析方面。相比上一代,推理准确率提升约 15-20%。 2. 多模态理解更深入 新版本增强了对图像、图表和文档的理解能力,能够更准确地分析复杂视觉内容,支持更长的上下文窗口。 3. 安全性与可控性 Anthropic 延续其对 AI 安全的重视,Opus 4.7 在减少幻觉、拒绝有害请求方面表现更稳健,同时提供了更细粒度的可控性。 技术细节 参数规模:未公开,预计在 100B+ 级别 上下文窗口:支持 256K token 多模态:文本、图像、文档理解 推理速度:相比 Opus 4 提升约 30% 行业影响 Claude Opus 4.7 的发布,进一步加剧了大模型领域的竞争。与 GPT-5、Gemini 等模型相比,Claude 在安全性和可控性上的差异化定位更加清晰。 对于开发者和企业用户来说,Opus 4.7 提供了更多选择,特别是在需要高安全性和复杂推理的场景中。 如何体验 目前 Claude Opus 4.7 已在 Claude.ai 上线,用户可以直接体验。企业用户可通过 API 接入。 总结 Claude Opus 4.7 是 Anthropic 在 2026 年的重要里程碑,展示了其在 AI 安全与能力平衡上的持续探索。对于关注 AI 发展的人来说,这无疑是一个值得关注的更新。 ...

April 17, 2026 · 1 min · 79 words · zzh

OpenRouter 新模型 Elephant Alpha:100B 参数免费使用,256K 上下文等你体验

一款主打"智能效率"的 100B 参数文本模型,完全免费,支持 256K 上下文和 32K 输出 模型概述 OpenRouter 最近上架了一款名为 Elephant Alpha 的新模型。这是一款 100B(千亿)参数的纯文本模型,主打"智能效率"(intelligence efficiency)——即在保持强劲性能的同时,尽量减少不必要的 token 消耗。 最吸引人的是:完全免费。 核心参数一览 参数 数值 模型 ID openrouter/elephant-alpha 参数量 100B 上下文长度 256K tokens 最大输出 32K tokens 输入模态 纯文本 输出模态 纯文本 定价 免费 支持的 API 参数 Elephant Alpha 支持以下 OpenRouter 标准参数: temperature - 控制输出随机性 top_p - 核采样参数 max_tokens - 最大输出 token 数 response_format - 响应格式控制 structured_outputs - 结构化输出(JSON 模式) tools / tool_choice - 函数调用支持 快速上手 通过 OpenRouter API 调用 1curl https://openrouter.ai/api/v1/chat/completions \\ 2 -H "Content-Type: application/json" \\ 3 -H "Authorization: Bearer $OPENROUTER_API_KEY" \\ 4 -d '{ 5 "model": "openrouter/elephant-alpha", 6 "messages": [ 7 {"role": "user", "content": "解释一下什么是智能效率,为什么重要?"} 8 ] 9 }' Python 调用示例 1import openai 2 3client = openai.OpenAI( 4 base_url="https://openrouter.ai/api/v1", 5 api_key="YOUR_OPENROUTER_API_KEY" 6) 7 8response = client.chat.completions.create( 9 model="openrouter/elephant-alpha", 10 messages=[ 11 {"role": "user", "content": "用简洁的语言总结量子计算的核心原理"} 12 ], 13 max_tokens=2000 14) 15 16print(response.choices[0].message.content) 结构化输出示例(JSON 模式) 1response = client.chat.completions.create( 2 model="openrouter/elephant-alpha", 3 messages=[ 4 {"role": "user", "content": "列出 5 种常见的设计模式,返回 JSON 格式"} 5 ], 6 response_format={"type": "json_object"} 7) 适用场景分析 ✅ 推荐使用场景 长文本处理 256K 的上下文长度,适合处理长文档、书籍、代码库分析 最大 32K 输出,足以生成完整的文章或报告 成本敏感项目 完全免费,适合个人开发者、学生、初创团队 可作为主力模型的免费替代方案 结构化数据提取 支持 JSON 结构化输出,适合信息抽取、数据清洗任务 函数调用能力可用于构建工具链 文本生成与改写 纯文本模型,专注度更高 写作辅助、翻译、摘要生成等 ⚠️ 注意事项 仅支持文本:无法处理图像、音频等多模态输入 预览模型:作为新上架的预览版本,稳定性需要观察 未知训练截止日期:知识库截止时间未公开 与其他免费模型对比 模型 参数量 上下文 输出上限 特点 Elephant Alpha 100B 256K 32K 纯文本,专注效率 Gemma 4 31B (free) 31B 256K 32K 多模态,支持图像/视频 Gemma 4 26B A4B (free) 26B (3.8B激活) 256K 32K MoE 架构,多模态 Nemotron 3 Super (free) 120B (12B激活) 256K 262K MoE,推理能力强 Elephant Alpha 的优势在于 100B 纯文本参数,对于纯文本任务可能有更好的语言理解和生成质量。 ...

April 15, 2026 · 2 min · 290 words · zzh