Kimi新模型来袭,发布即可上线!
Kimi新模型来袭,新模型袭发布即可上线!发布
数学模型k0-math刚刚发布几天,上线k1视觉思维模型来了,新模型袭很多思考推理测试都超过了Open AI o1。发布

官方表示,上线基于加强学习,新模型袭k1原生支持端到端图像理解和思维链技术。发布
换句话说,上线K1可以深入图片信息,新模型袭层层推理,发布从而解锁包括几何图形题数学能力更全面。上线

模型思考答案的新模型袭全过程,belike:

而且k1的思维能力不仅局限于数学领域,所谓“学好数学、上线物理、化学,不怕走遍世界”。
官方晒出的数学化学基准测试中,Kimi k1-preview性能超过OpenAI o1、GPT-4o、Claude 3.5 Sonnect。

Kimi新模型的发布还是直接上线可玩的那种,APP或网页版找到“Kimi视觉思维版”就可以上传图片点击使用。

话不多说,这就赶紧来实测一波~
第一波数理化实测
先来一个考研数学真题小试牛刀,这个题目涉及曲面积分、高斯定理等知识点:

GPT-4o之前在量子位测量中被这个问题困住了。
经过一步一步的详细推理,Kimi视觉思维版第一次给出了正确的答案。

它自己也说检查没有错,“对这个答案很有信心”。

再来一个曾经测试过o1的数学概论题。
一个外星人来到地球后,
自我毁灭;分为两个外星人;分为三个外星人;什么都不做。
从那以后,每个外星人每天都会做出一次选择,彼此独立,
Kimi视觉思维版一次就做对了:

看完数学能力,再试试物理题。
以下问题是大学物理中的光学问题:
波长在双缝干涉试验中λ=
成功回答Kimi视觉思维版。
事实上,它很早就给出了正确的答案,但它仍然严格地用不同的方法反复验证和确认。

最后,还有一道“化学题”(doge):
Candy, Happy, Bacon, Scary, Brain, House
Which is the odd one?
Hint: Chemistry
Kimi视觉思维版在推理过程中经历了几次曲折,但最终答案是正确的(happy)。

K1背后的技术大方向除了发布新模型外,还被月之暗面公开。
基于强化学习的新一代推理模式
据报道,K1是他们基于强化学习技术的新一代模型,被称为思考模型,端到端的图像理解和思维能力在真正意义上得到了实现。
从模型训练的角度来看,分为两个阶段:通过预训练获得基础模型,然后在基础模型上加强学习后训练。
最重要的是,k1遵循强化学习Scaling Law,加强学习后的数据质量和训练进一步优化了学习效率。
传统的基于文本的推理模型,或不支持图像信息输入,或需要借助外部OCR/视觉模型进行转换,效果有明显损失。
由于Kimi视觉思维版是原生的端到端视觉推理模型,视觉思维版 可以直接理解图片信息,进行深度推理。
在“噪音”场景,也就是说,在拍摄图片模糊、手写字迹潦草的情况下,性能损失也很小。


既然如此,把思路打开,除了让它做数学和化学推理,也许你还可以拿一堆图片来帮助它推理任何我想知道的东西。
比如把朋友的“歌单”截图发给它,让它给我分析一下这个朋友的MBTI。
不要说K1的推理是合理的。首先了解MBTI是什么,然后仔细分析图片中的曲目,像侦探一样进行分类,然后找出这些歌手和风格之间的相似之处。
它甚至会“平衡矛盾特征”,即使给出猜测,也会加一步“验证”。


最终会给出更合理的猜测。

另一个例子是,你也可以拿出这样一个潦草而模糊的手写手稿,让它帮助我理解是谁写的,笔记在说什么。

思路又被打开了。

最终不得不说,近几天国内外大型模式的新进展真的很多,以前有谷歌,现在有Kimi,OpenAI“圣诞直播12天”可谓是一次又一次的“狙击”。

你觉得Kimi新模型的表现如何?感兴趣的童鞋不妨亲自考试。~
来源:量子位