RAG与Agent性能调优50讲- 极客时间课程推荐/优惠

RAG与Agent性能调优50讲--极客时间课程推荐/优惠

全面掌握高性能 RAG 系统构建与优化能力
尹会生大模型领域连续创业者 & 技术战略专家
视频课 | 52讲 | 1425人已学习
优惠价¥98原价:299
官网优惠购买
版权声明

本站非极客时间官网,与官方无任何关系。我们不提供课程下载或详细内容,仅作为课程分享和推荐平台。我们鼓励大家支持正版,尊重创作者的劳动成果,这样不仅能帮助创作者持续产出优质内容,也能让自己获得更好的学习体验。请通过官方渠道购买和学习课程,感谢您的理解与支持。

课程详情

你将获得:

  • 深度覆盖:一站搞定 Python 工程化到 LLM 企业级部署;
  • 广度兼容:数据预处理、RAG 检索优化、评估指标体系等;
  • 前沿融合:引入 Agent-RAG 架构设计与多模态综合处理;
  • 工程闭环:9 大真实行业案例,实战大模型优化与微调进阶。

课程介绍

在大模型应用落地日益深入的今天,RAG(Retrieval-Augmented Generation)技术已成为连接通用语言模型与垂直领域知识的关键桥梁 。它不仅能够显著提升模型在特定任务中的表现,还能有效解决模型幻觉、知识更新滞后、生成内容不准确等问题。

然而,在实际开发中,许多工程师和技术团队却常常陷入以下困境:

  • 文档检索总是遗漏关键信息?
  • 模型生成内容频繁出错,影响业务信任度?
  • 提示词效果不稳定,难以形成标准化流程?
  • 长文本输入导致推理卡顿,性能瓶颈难突破?
  • 系统面对高频请求时响应迟缓,稳定性堪忧?
  • RAG 整体效果如何评估?缺乏科学衡量标准?

这些问题的背后,是 RAG 技术栈中隐藏的工程挑战与性能瓶颈——而这些,正是我们为你打造这门课的核心出发点。

本课程是专为中级开发工程师、初入大模型领域的从业者量身打造的企业级 RAG 实战指南,聚焦于高性能、可落地的 RAG 系统构建与调优能力,帮助你在真实业务场景中实现从“会用”到“精通”的跨越。

课程以 Python 工程化 + LangChain等技术栈应用 + 开源企业级 RAG 平台实践为主线,贯穿数据预处理、模型选型、性能调优、多模态扩展、Agentic 架构设计、监控评估等多个核心环节,覆盖医疗问诊、智能客服、法律检索等典型行业场景。

你将亲手打造的实战项目包括:

  • 高精度垂直领域检索系统
  • 支持多跳推理的法律长文本问答系统
  • 医疗领域的糖尿病问答引擎
  • 可配置的 Agentic RAG 架构
  • 图文混合检索引擎
  • 高并发下的缓存与部署优化方案

通过大量实战案例与代码解析,可以帮助你在复杂场景中建立系统性认知,提升解决实际问题的能力,真正做到“知其然,更知其所以然”。

最终,不再让 RAG 成为“纸上谈兵”,这一次,让你真正拥有“落地能力”。

课程目录(更新中)

开篇介绍

  • 开篇介绍

模块一:基础架构与数据预处理优化

  • 01|如何统一多源文档格式?破解PDF、Word、图片等混杂内容解析难题
  • 02|跨页表格怎么自动对齐合并?实现结构化输出的关键技术实战
  • 03上|领域术语总混淆?构建精准术语词库,提升检索一致性
  • 03下|领域术语总混淆?构建精准术语词库,提升检索一致性
  • 04上|切片语义割裂怎么办?基于滑动窗口+关键词的语义段落识别
  • 04下|切片语义割裂怎么办?基于滑动窗口+关键词的语义段落识别
  • 05|固定切片召回率低?动态重叠切片机制显著提升覆盖率
  • 06|OCR文本错漏频发?结合LLM纠错,让图像文本也能精准使用
  • 07|图像切分不合理?文本图像矫正和版面区域检测保障信息完整且不冗余
  • 08|打造可配置、可扩展的自动化预处理流水线

模块二:检索系统优化与召回增强

  • 09|FAISS、HNSW还是BM25?如何选择最适合业务的向量检索引擎?
  • 10|多阶段召回总不准?设计高效混合检索架构提升覆盖率与精度
  • 11|HNSW参数调优难?掌握SQ8量化压缩技术,实现速度与准确率平衡
  • 12|用户查询太模糊?用查询扩展提升语义匹配能力
  • 13|稀疏查询召回差?HyDE伪文档生成技术解决冷启动问题
  • 14|多路召回融合难?动态阈值机制确保高质量结果优先排序
  • 15|政策文档检索总是漏关键点?构建高精度垂直领域检索系统
  • 16|如何科学调节切片长度与滑动窗口?结合倒排索引与向量索引对比优化

模块三:生成控制与模型微调优化

  • 17|模型忽略关键实体怎么办?注意力权重分配机制引导生成聚焦重点
  • 18|生成内容出错?构建事实验证链+溯源标注方案有效抑制幻觉
  • 19|资源有限还想微调大模型?掌握LoRA参数高效方法适配垂直领域
  • 20|轻量级部署术语准确率低?Adapter网络微调实现低开销优化
  • 21|提示词效果不稳定?上下文融合Prompt工程显著提升生成质量
  • 22|多个模型不知选哪个?设计多模型路由机制智能选择最优生成器

作者介绍

尹会生,生成式 AI 与智能硬件融合创新者,大模型领域连续创业者 & 技术战略专家。 曾服务于金山、新浪等大型企业;研发有「生成式 AI 知识库+智能硬件」融合系统;国内首批大模型工业化应用实践者,创新性将 RAG 技术应用于智能制造领域,实现业务流程智能化升级,平均效能提升 30% 以上;工业自动驾驶系统架构师,基于点云与运动控制技术路径规划算法,获 2 项技术发明专利;当前聚焦打造新一代企业级 AI Agent 平台,通过自主知识产权的 RAG 引擎,助力金融、制造、法律、审计等领域客户实现知识资产智能化转型。 头部科技教育平台专家(极客时间/得到 APP),课程累计学习人数超 22 万人,出品《ACP 大模型认证训练营》《AIGC 应用实战营》《21 天 AIGC 行动营》《AI 数据分析课》《零基础学 Python》《Linux 实战技能 100 讲》《动手学 DeepSeek 22 讲》等多门爆款课程,广受好评;全栈技术实践者,横跨智能硬件研发、工业物联网架构、企业级 SaaS 开发三大领域;大模型应用布道者,年交付 1000+ 高管培训人天,独创的「场景化 Prompt 工程方法论」被多家机构纳入内部标准;企业智能化转型顾问,2023~2024 年为中金所/中国银联/华润集团/VMware/安永等 30+ 世界 500 强企业构建 AI 赋能体系。

推荐

Dubbo源码剖析与实战 - 极客时间课程推荐/分享/优惠/折扣
Dubbo源码剖析与实战
问题+思路+解法+代码=Dubbo最强攻略
何辉平安壹钱包架构师
专栏 | 5596人已学习
优惠价¥59原价:129
极客时间官网优惠购买
分布式技术原理与算法解析 - 极客时间课程推荐/分享/优惠/折扣
分布式技术原理与算法解析
12周精通分布式核心技术
聂鹏程智载云帆CTO,前华为分布式Lab资深技术专家
专栏 | 40702人已学习
优惠价¥59原价:129
极客时间官网优惠购买
LLM自主智能体应用实战课 - 极客时间课程推荐/分享/优惠/折扣
LLM自主智能体应用实战课
多智能体协作,8周打造Autonomous Agent
李锟资深软件架构师,前阿里巴巴高级技术专家
专栏 | 3846人已学习
优惠价¥59原价:99
极客时间官网优惠购买
AI Agent智能体实战课 - 极客时间课程推荐/分享/优惠/折扣
AI Agent智能体实战课
手把手带你搭建属于自己的智能体
周文洋微软最具价值专家(MVP)
视频课 | 7429人已学习
优惠价¥98原价:299
极客时间官网优惠购买
Selenium自动化测试实战 - 极客时间课程推荐/分享/优惠/折扣
Selenium自动化测试实战
项目驱动,深入理解Selenium原理与实战技巧
郭宏志享学志成科技创始人兼CEO
视频课 | 19328人已学习
优惠价¥68原价:199
极客时间官网优惠购买
技术面试官识人手册 - 极客时间课程推荐/分享/优惠/折扣
技术面试官识人手册
辨识精英,打造高效能团队
熊燚(四火)Oracle首席软件工程师
专栏 | 8426人已学习
优惠价¥59原价:99
极客时间官网优惠购买