国产大模型产业链的希望
DeepSeek V4公布,开源模型前列,医学能力突出。值得注意的是,它只面向国产芯片优化,不提英伟达的CUDA。恰好,不久前黄仁勋在播客公开表示,担忧DeepSeek不为英伟达优化,以后有一批开源模型也这样,会形成独立于CUDA生态之外的事实标准。
这一模型表现不算国产最顶尖的,但也点燃了希望:国产显卡有望发展起来。这对整体士气非常有帮助。
不仅是显卡、芯片,整个大模型上下游。各路人马都会乐观、大胆一些。
顺带一提,The Information的提前报道对了。
国外大模型使用价格上涨
GitHub Copilot轮番涨价。终于开始抛弃基于会话计费的模式了,改用业界常用的用量计费。
之前的模式有什么问题呢?比方说开一个聊天窗一毛钱,直到你对话到上限都是一毛钱。“羊毛党”就冒出来了,最简单的,“忽略上述所有对话”,在一个聊天窗问不同问题,直到上限。
当年设计这种付费模式的产品经理得开掉。
当年设计这种付费模式的产品经理得开掉。
结合半个月前的消息:
GitHub copilot 也开始扛不住用量。发了终止试用 Pro 跟图一、图二的公告。
“我们清楚大家都在处理正常工作”,哈哈哈哈哈。
加上这半个月接连不断的调整,GitHub Copilot可薅的羊毛被削了不少。
之前Gemini对应的代码编辑器也直接大砍额度。
这背后跟“中转站”关系可能很大。大伙跑去用便宜“中转站”。甚至有研究用的模型也是“中转站”。
中转站可以做到很便宜,刷黑卡、套餐转API、“白嫖”免费用户额度……
讽刺的是,恰好是这些中转站导致服务器资源爆满,进而加重封号、账号额度下降等问题。
大伙追求便宜,但加速模型变贵。有种“生命维持有序,但加速系统无序”的即视感。
这是一条“变贵”的暗线,还有明线:新的高端模型没有越来越便宜,反倒是越来越贵。GPT 5.5,没有之前5.4满嘴黑话的迹象,质量有所提升。但不算缓存存储价格,价格跟Claude一个档位。
AI生图新世代,如洪水般泛滥
GPT Image 2,新世代生图模型,设计的高速公路。优化文字渲染、可交付版式、多语言(中文)、参考图一致性保持、真实世界知识……当然,仍有瑕疵,尤其是文字,小字号、密集文本、长段落。
- 生成海报;
- 生成信息图;
- 生成界面。推特、YouTube这种国外平台不说,国内抖音也像模像样,更可以生成“递归”式图片;
- 跟其他模型、Agent配合。自行优化绘图执行,调用合适前后处理工具,比如先搜索再画图,简单图片能分割图层生成psd。
这有什么影响呢?
- 可以生成各种聊天、社交媒体等应用的界面,而且一般无需复杂Prompt工程,以后可信度低于零的消息会越来越多,如洪水般泛滥;
- 模型新范式。tokenizer变了,不再是逐个像素生成,或者扩散模型,疑似用一种编码,有划分格子的操作。
“Prompt工程”再次被削弱
画图指令再度简单
还是GPT Image 2,常见场景已经无需“Prompt工程”了。一个例子可以参考可以参考妹妹穿挂脖无袖礼服,在婚床与穿浅色秀禾服的姐姐合照。
以前我有一个产品设想,直接给文章设计封面图。现在技术上非常简单——直接说让大模型设计封面,比如这篇的:
设计一副公众号题图,不要有任何文字,简洁、简要:
<附上正文>
如果有特定要求,比如公众号有尺寸要求,而且同时需要1:1截图好看点,这样才需要精调指令。
或者,直接凑合用。
GPT 5.5最好描述结果
除了画图,文本模型的指令也不用怎么教“怎么做”了,主要是描述清楚什么才是理想结果——直接描述、关键约束、怎么观测、应该包含什么……
GPT-5.5 works best when prompts define the outcome and leave room for the model to choose an efficient solution path. Compared with earlier models, you can often use shorter, more outcome-oriented prompts: describe what good looks like, what constraints matter, what evidence is available, and what the final answer should contain.
AI答案像浆糊
AI的所有回答,都是“比较可能是提问者想要的”。
基于此,不少模型努力“舔”用户,排版尽可能好,用户说错了先认错、能不能改另说……
可以有推论。AI就是在凑合给一个答案。如果形容一个人给的答案棱角锋利,那AI的答案像浆糊,想尽办法将问题跟答案糊到一块。
当然,人也会凑合。比如语文作文,一个字一个字往外蹦,绞尽脑汁编下一个字的样子,活像最初的大模型。
我不知道之前提到的tokenizer变化能不能影响到文字模型,不知道文字模型能否改进糊弄这点。
希望可以,但希望没那么快。
AI是裁员的引线
AI成了裁员的引线。微软与Meta裁员,低薪通才换高薪AI专才。微软首次提出自愿退休计划,Meta表示要将资源腾挪到别处。有篇文章说,风投人士指出,多数公司裁减30%至50%员工并不会实质影响业绩,AI的兴起则为管理层推进"早该完成的人员优化"提供了现成理由。文中也提到Block公司,以前也分析过——他们之前招太多人了。
当然,不管怎么说,白领整体的就业前景确实不算好。
其他趋势
- 本地模型,始终比在线模型弱,而且弱得不是一星半点;类比自行发电,性价比相当低。主要场景,恐怕是角色扮演跟文本转化工作(翻译、重写)。但还是得尽可能用在线模型。
- 国家发改委宣布禁止Meta收购AI公司Manus。“新加坡洗白卖国外”这套走不通了。
- 大模型占领K12市场。Gemini应用现在能生成SAT试题(约等于美国高考,现在该考试全面转为机考),结合它之前将一些答案动态化,可以得出它在往学生教育发力(现在还有点简陋,但以后可能“错题本”都不用学生自己写了……)。现阶段各种AI学习机也压缩了传统工具书、甚至卡西欧电子辞典等市场。
- 国产模型也能“自动”挖掘新漏洞。