"Kimi"相关的文章
AI,个人随笔
AI的价值不是聊天,而是能干活

AI的价值不是聊天,而是能干活

我们习惯了问 AI 问题,却很少思考:它是否能真正“干活”?Kimi 的“OK Computer”Agent 模式,正在打破这一认知边界。本文不仅是一场产品体验,更是一份关于 AI 从“聊天”走向“任务完成”的深度观察——当 AI 不再只是信息提供者,而是成为数字员工,我们该如何重新定义人与工具的协作方式?
AI
90%被大模型吃掉,AI Agent的困局

90%被大模型吃掉,AI Agent的困局

当大模型本身越来越像Agent,垂类方案又精准碾压通用产品,曾经风光无限的“万能助手”正迅速失速。本文深度拆解通用Agent陷入的“无场景、高成本、低留存”困局,追问:在模型能力溢出、企业需求升级的双重挤压下,通用Agent还有机会突围吗?
K2发布后,Kimi 研究员集体在X和知乎上搞起了“团建”

K2发布后,Kimi 研究员集体在X和知乎上搞起了“团建”

没有发布会、没有巨额投放,Kimi 选择用一场“研究员团建”把万亿参数 K2 塞进全球开发者视野:知乎长文自曝架构、X 上玩梗自嘲、会议室用摇滚乐队命名……硬核技术细节与极客文化同步出圈,让海外用户第一次反向翻译中文技术帖。开源模型也能自带声量,Kimi 这次把“硬实力就是最好的营销”写成了现场教学。
分析评测
深度研究Kimi K2:模型对比和实测

深度研究Kimi K2:模型对比和实测

最近模型圈大家关注度最高的莫过于Grok4以及Kimi K2,作为一个AI应用开发者,我们一直都时刻关注最新的模型能力表现,因此今天三白花了一天左右的时间先深入研究和实测一下K2的表现,看有没有媒体吹嘘的那么牛。 本篇内容主要从K2的模型亮点、K2与主流模型综合能力对比、K2实际应用效果测试三个角度,探探K2大概是什么水平。
两句话,让Claude Code+Kimi K2 跑了3小时爬完17个竞品网站、做了一份深度市场数据分析报告

两句话,让Claude Code+Kimi K2 跑了3小时爬完17个竞品网站、做了一份深度市场数据分析报告

当「Agent 级」开源大模型遇上「最强 AI 编程助手」,会发生什么?作者只用两句指令,就让 Claude Code + 刚发布的 Kimi K2 通宵跑了 3 小时:自动爬完 17 个独立站、清洗 400+ 条手机配件数据,最终生成一份可直接汇报的交互式市场分析报告。全程无需人工干预,成本仅为传统方案的 1/25。
AI,个人随笔
杨植麟交卷,Kimi 万亿参数K2开源:Agent能力紧逼Anthropic,延展DeepSeek,上手实测如何?

杨植麟交卷,Kimi 万亿参数K2开源:Agent能力紧逼Anthropic,延展DeepSeek,上手实测如何?

11日,月之暗面团队在杨植麟的带领下,悄然开源了万亿参数规模的Kimi K2模型,这一举动无疑在AI界投下了一颗重磅炸弹。Kimi K2不仅在参数规模上达到了惊人的1万亿,更在智能体任务(agentic tasks)上进行了专门优化,其Agent能力紧逼行业领先的Anthropic,甚至在某些基准测试中超越了其他开源模型。本文将深入剖析Kimi K2的核心技术、性能表现以及它在实际应用中的表现,同时探讨这一开源模型对AI行业未来发展的深远影响。
AI
Kimi Researcher团队自述:Agent不是缝合怪,它就是模型

Kimi Researcher团队自述:Agent不是缝合怪,它就是模型

月之暗面团队推出了首个AI Agent——Kimi Researcher,它并非简单的搜索工具,而是一个能生成带引用来源的深度研究报告的智能体。该Agent采用端到端强化学习训练,通过大量自主探索和试错来学习完成任务的策略,而非依赖人类预设的固定流程。在高难度基准测试中,Kimi Researcher取得了优异成绩,展现了强大的研究能力。