聊聊趋势 | AI能做.XYZ

国产大模型产业链的希望

DeepSeek V4公布，开源模型前列，医学能力突出。值得注意的是，它只面向国产芯片优化，不提英伟达的CUDA。恰好，不久前黄仁勋在播客公开表示，担忧DeepSeek不为英伟达优化，以后有一批开源模型也这样，会形成独立于CUDA生态之外的事实标准。

这一模型表现不算国产最顶尖的，但也点燃了希望：国产显卡有望发展起来。这对整体士气非常有帮助。

不仅是显卡、芯片，整个大模型上下游。各路人马都会乐观、大胆一些。

顺带一提，The Information的提前报道对了。

国外大模型使用价格上涨

GitHub Copilot轮番涨价。终于开始抛弃基于会话计费的模式了，改用业界常用的用量计费。

之前的模式有什么问题呢？比方说开一个聊天窗一毛钱，直到你对话到上限都是一毛钱。“羊毛党”就冒出来了，最简单的，“忽略上述所有对话”，在一个聊天窗问不同问题，直到上限。

当年设计这种付费模式的产品经理得开掉。

结合半个月前的消息：

GitHub copilot 也开始扛不住用量。发了终止试用 Pro 跟图一、图二的公告。
“我们清楚大家都在处理正常工作”，哈哈哈哈哈。

加上这半个月接连不断的调整，GitHub Copilot可薅的羊毛被削了不少。

之前Gemini对应的代码编辑器也直接大砍额度。

这背后跟“中转站”关系可能很大。大伙跑去用便宜“中转站”。甚至有研究用的模型也是“中转站”。

中转站可以做到很便宜，刷黑卡、套餐转API、“白嫖”免费用户额度……

讽刺的是，恰好是这些中转站导致服务器资源爆满，进而加重封号、账号额度下降等问题。

大伙追求便宜，但加速模型变贵。有种“生命维持有序，但加速系统无序”的即视感。

这是一条“变贵”的暗线，还有明线：新的高端模型没有越来越便宜，反倒是越来越贵。GPT 5.5，没有之前5.4满嘴黑话的迹象，质量有所提升。但不算缓存存储价格，价格跟Claude一个档位。

AI生图新世代，如洪水般泛滥

GPT Image 2，新世代生图模型，设计的高速公路。优化文字渲染、可交付版式、多语言（中文）、参考图一致性保持、真实世界知识……当然，仍有瑕疵，尤其是文字，小字号、密集文本、长段落。

生成海报；
生成信息图；
生成界面。推特、YouTube这种国外平台不说，国内抖音也像模像样，更可以生成“递归”式图片；
跟其他模型、Agent配合。自行优化绘图执行，调用合适前后处理工具，比如先搜索再画图，简单图片能分割图层生成psd。

这有什么影响呢？

可以生成各种聊天、社交媒体等应用的界面，而且一般无需复杂Prompt工程，以后可信度低于零的消息会越来越多，如洪水般泛滥；
模型新范式。tokenizer变了，不再是逐个像素生成，或者扩散模型，疑似用一种编码，有划分格子的操作。

“Prompt工程”再次被削弱

画图指令再度简单

还是GPT Image 2，常见场景已经无需“Prompt工程”了。一个例子可以参考可以参考妹妹穿挂脖无袖礼服，在婚床与穿浅色秀禾服的姐姐合照。

以前我有一个产品设想，直接给文章设计封面图。现在技术上非常简单——直接说让大模型设计封面，比如这篇的：

设计一副公众号题图，不要有任何文字，简洁、简要：

<附上正文>

一句话加正文生成公众号题图

如果有特定要求，比如公众号有尺寸要求，而且同时需要1:1截图好看点，这样才需要精调指令。

或者，直接凑合用。

GPT 5.5最好描述结果

除了画图，文本模型的指令也不用怎么教“怎么做”了，主要是描述清楚什么才是理想结果——直接描述、关键约束、怎么观测、应该包含什么……

GPT-5.5 works best when prompts define the outcome and leave room for the model to choose an efficient solution path. Compared with earlier models, you can often use shorter, more outcome-oriented prompts: describe what good looks like, what constraints matter, what evidence is available, and what the final answer should contain.

AI答案像浆糊

AI的所有回答，都是“比较可能是提问者想要的”。

基于此，不少模型努力“舔”用户，排版尽可能好，用户说错了先认错、能不能改另说……

可以有推论。AI就是在凑合给一个答案。如果形容一个人给的答案棱角锋利，那AI的答案像浆糊，想尽办法将问题跟答案糊到一块。

当然，人也会凑合。比如语文作文，一个字一个字往外蹦，绞尽脑汁编下一个字的样子，活像最初的大模型。

我不知道之前提到的tokenizer变化能不能影响到文字模型，不知道文字模型能否改进糊弄这点。

希望可以，但希望没那么快。

AI是裁员的引线

AI成了裁员的引线。微软与Meta裁员，低薪通才换高薪AI专才。微软首次提出自愿退休计划，Meta表示要将资源腾挪到别处。有篇文章说，风投人士指出，多数公司裁减30%至50%员工并不会实质影响业绩，AI的兴起则为管理层推进"早该完成的人员优化"提供了现成理由。文中也提到Block公司，以前也分析过——他们之前招太多人了。

当然，不管怎么说，白领整体的就业前景确实不算好。

其他趋势

本地模型，始终比在线模型弱，而且弱得不是一星半点；类比自行发电，性价比相当低。主要场景，恐怕是角色扮演跟文本转化工作（翻译、重写）。但还是得尽可能用在线模型。
国家发改委宣布禁止Meta收购AI公司Manus。“新加坡洗白卖国外”这套走不通了。
大模型占领K12市场。Gemini应用现在能生成SAT试题（约等于美国高考，现在该考试全面转为机考），结合它之前将一些答案动态化，可以得出它在往学生教育发力（现在还有点简陋，但以后可能“错题本”都不用学生自己写了……）。现阶段各种AI学习机也压缩了传统工具书、甚至卡西欧电子辞典等市场。
国产模型也能“自动”挖掘新漏洞。

国产大模型产业链的希望 ​

国外大模型使用价格上涨 ​

AI生图新世代，如洪水般泛滥 ​

“Prompt工程”再次被削弱 ​

画图指令再度简单 ​

GPT 5.5最好描述结果 ​

AI答案像浆糊 ​

AI是裁员的引线 ​

其他趋势 ​

目录