第44页 - 科技资讯 - 最新AI与科技前沿动态

AI 大模型核心五：从 Transformer、RAG 到 Agent 架构

一、如果去掉多头只用单头，Transformer 会出现什么问题？一句话概括：这里要注意，单头不是完全不能用，而是会形成明显的信息瓶颈。 1. 多头注意力到底解决什么问题？ Multi-Head

95 1分钟

第9章工具调用循环——Agent的行动闭环引言想象一个厨师的烹饪流程：他查看菜单（用户需求），准备食材（上下文），开始烹饪（调用工具），品尝味道（获取结果），调整调味（继续对话），直到完成菜品。

22 10分钟

一个叫 stop-slop 的“去AI味”项目突然走红，背后不是大家不用 AI 写作了，而是越来越多人受不了那种看着完整、读着发空的模板文。真正值得警惕的，不是 AI 会写，而是内容越来越像标准件。

36 9分钟

大模型入门：从 MHA 到 GQA，一次讲清 KV Cache 为什么能省显存一、推理显存经常卡在 KV Cache 很多人第一次跑本地大模型，会以为显存主要被模型参数吃掉。这当然没错。一个 7B

25 12分钟

1. 前言上篇文章我们实现了一个最小可运行的 AI Agent，但存在一个问题：每次重启后，Agent 就像失忆了一样，不记得你是谁、你的偏好是什么。

40 2分钟

一.Node基础笔记 1.给节点添加retry_policy和cache_policy 二.Edge基础笔记 1.普通边执行结果： 2.条件边执行结果： 3.多个条件边执行结果：

15 6分钟

本文介绍了两种让LLM输出结构化JSON的方案：1）Prompt约束+后处理，兼容性强但需额外容错逻辑；2）使用AI SDK的generateObject函数，结合Zod Schema定义输出格式，自

37 9分钟

本文基于 2026年 LangChain 官方最新稳定版（v1.x）重写，旨在向入门学习者，快速入门LangChain！

57 10分钟

火山引擎ArkClaw迎来重大升级，主打体验与功能优化。新版本重构界面交互，输入框升级为智能创作中枢，导航栏精简入口、支持文件云端流转。同时强化Agent协作能力，新增后台安装、定时任务等功能。

106 6分钟

Apple Silicon 经过多年的架构演进，在本地运行大语言模型的体验已经达到生产环境的标准。随着 2026 年 Ollama 0.19 版本的发布以及底层推理引擎全面切换至 MLX，Mac 设备

131 7分钟

深入拆解 Agentic RAG 与 Pipeline RAG 的本质区别：Agent 如何自主决定是否检索、查哪个知识库、以及检索质量不足时如何自我修正。

106 12分钟

stop-slop 是一个 Claude Code Skill 文件，专门识别并消除 AI 生成文本中的可预测模式——从「清嗓式」开头、二元对立结构、被动语态，到副词滥用和空洞的宏大宣言。

88 9分钟