个人随笔 Agent开发平台数据运营体系:企业如何衡量大模型投入产出比ROI? 大模型到底为公司带来了多大的好处?为应用大模型,采购了第三方的AgentBuilder平台,或者自研搭建了大模型应用平台,效果咋样?企业内部的员工会用了吗?还是依赖外部... shucay AgentChat GPTLLM
业界动态 世界模型又近了?MIT惊人研究:LLM已模拟现实世界,绝非随机鹦鹉! MIT CSAIL的研究人员发现,LLM的「内心深处」已经发展出了对现实的模拟,模型对语言和世界的理解,绝不仅仅是简单的「鹦鹉学舌」。也就说,在未来,LLM会比今天更深层地理解语言。 新智元 LLM世界模型行业观察
业界动态 Gary Marcus:生成式AI泡沫将退,神经符号AI才是未来 人工智能学者Gary Marcus近日发文称,生成式AI可能因可靠性问题无法解决而在12个月内退去泡沫。他认为,神经符号学方法是超越LLMS局限、迈向自主AI的途径之一,而谷歌的两款系统验证了可行性。 元宇宙日爆 LLM生成式AI行业趋势
业界动态 少即是多!10亿参数「小巨人」击败ChatGPT 只有10亿参数的xLAM-1B在特定任务中击败了LLM霸主:OpenAI的GPT-3.5 Turbo和Anthropic的Claude-3 Haiku。上个月刚发布的苹果智能模型只有30亿参数,就连奥特曼都表示,我们正处于大模型时代的末期。那么,小语言模型(SLM)会是AI的未来吗? 新智元 ChatGPTLLMSLM
个人随笔 LLM最全「怪癖」首曝光!马里兰OpenAI等30+学者祭出75页提示报告 大语言模型提示中,竟有不少「怪癖」:重复某些内容,准确性就大大提高;人名变匿名,准确性就大大下降。最近,马里兰OpenAI等机构的30多位研究者,首次对LLM的提示技术进行了大规模系统研究,并发布75页详尽报告。 新智元 LLM大语言模型案例分析
业界动态 两句话,让LLM逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷 在基准测试上频频屠榜的大模型们,竟然被一道简单的逻辑推理题打得全军覆没?最近,研究机构LAION的几位作者共同发表了一篇文章,以「爱丽丝梦游仙境」为启发涉及了一系列简单的推理问题,揭示了LLM基准测试的盲区。 新智元 ChatGPTLLM大模型
个人随笔 ChatGPT真能记住你的话吗?DeepMind与开源大佬揭示LLM记忆之谜 LLM有记忆能力吗?有,也没有。虽然ChatGPT聊天时好像可以记住你之前说的话,但实际上,模型在推理时记不住任何内容,而且它们在训练时的记忆方式也不像我们想象的那么简单。 新智元 ChatGPTDeepmindLLM
业界动态 万字长文总结提示词技巧!新加坡首届GPT-4提示工程大赛冠军最新分享 提示工程已经成为了热门话题,无论是CO-STAR框架构建提示词,使用分隔符将提示词分段,使用LLM护栏创建系统提示,还是仅使用LLM(无需插件或代码)分析数据集,用户都将拥有全新的使用体验。 新智元 GPT-4LLM提示词
个人随笔 历时400多天,国产大模型全面赶超GPT-4? 赶超GPT-4的阶段性升级,可以看作是国产大模型有序迭代部署、不断拉近差距的标志,切莫像手机跑分那样,在过度营销的作用下,沦为被群嘲的对象。 Alter LLM国产大模型文心一言
个人随笔 当我们在投资 AGI,实际上我们的投资逻辑可能是什么? 本文原始内容编写自 2023 年 6 月,在 2024 年 Sora 诞生之际再翻出来这个结论 refine 发出来。 OneMoreAI AGIAI应用LLM
个人随笔 LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍 LongRoPE方法首次将LLM的窗口扩展到了2048k个token,只是简单微调的情况下,就能实现与短上下文窗口相近的性能! 新智元 LLMToken大模型