前端转 AI 应用开发 · 02 | 5 分钟用 Python 调通大模型(async + 阿里云 Coding Plan)
作为一个前端工程师,我一直把 Python 当成转 AI 的一道坎。直到我真正动手——才发现真正要重新适应的不到 20%。 这篇文章记录我用 2 小时做的事:搞懂 Python async 和 JS
聚焦AI人工智能 · 前沿技术动态 · 深度行业解读
作为一个前端工程师,我一直把 Python 当成转 AI 的一道坎。直到我真正动手——才发现真正要重新适应的不到 20%。 这篇文章记录我用 2 小时做的事:搞懂 Python async 和 JS
如何把大模型从“会回答问题”,设计成一个可执行、可扩展、可校验、可观测、可优化的工程系统。 很多概念不能只停留在一句话解释上。比如“RAG 就是检索增强生成”“Function Calling 就是调
工程师视角拆解 LLM 推理性能:prefill/decoding 的真实瓶颈在哪、KV Cache 什么时候是救命稻草什么时候是内存炸弹、为什么 batching 能提吞吐却会拖垮 P99,以及一套可落地的三角优化打法。
Claude Code 实战指南 提示词框架使用说明 本指南中的提示词示例使用了 BROKE、CRISPE、ROBOTIC 等框架,通过实际例子来加深理解。
今年圈子里「龙虾」和「Skill」经常一起出现。龙虾更像一阵话题;Skill 则是装上去、反复能省时间的东西。很多人装完几个插件,问的第一句却是:这玩意儿到底是拿来干活的,还是图个新鲜? 我翻了一圈官
本章我们尝试复现“图像文字元素编辑”功能,代码已经上传到Github。AI 生图配合文字元素编辑,确实能解决很多场景上AI生图无法直接落得的业务问题,感兴趣的朋友可以clone直接使用。
很多技术团队都走过同样的路:先选一个大模型,然后把公司里的文档、手册、报告塞进向量数据库,再搭一个 RAG 问答系统。原型跑起来那天的感觉特别好,问什么答什么,反应快,看起来像模像样。 但系统真正投入
# CloakBrowser 实测:源码级反指纹浏览器到底能过几道关 上周五跑爬虫采集数据,Playwright 脚本在 Cloudflare 面前吃了闭门羹。换了 playwright-steal
前几天学了记忆、推理、协作,但还有一个问题:复杂流程怎么编排? 比如用户说: 这涉及多个步骤,还有条件判断和循环。这就是工作流模式要解决的问题。 一、三种工作流模式 模式 是什么 适用场景 路由模式
最近大模型风口持续火爆,不管是求职、副业、技术深耕,绕不开的第一件事,就是系统搞懂到底什么是大模型。像我刚入门只会跟风听GPT、通义千问、DeepSeek,但对大模型的核心定义、为什么突然爆发、怎么衡
使用过Claude Code的小伙伴应该有所了解,它有个200k的LLM上下文。上下文如果占用过高,会导致AI推理能力变差。今天给大家分享一款工具,能大大降低token的消耗!
5月25日,上海。 IEEE(电气电子工程师学会)国际电路与系统研讨会上,一个中国女人站上了讲台。 她叫何庭波,华为公司董事、半导体业务部总裁,业内人称"芯片女王"。 她代表华为,发布了一个全新的半导