# 第02章：基于Coze&Dify平台的智能体开发

讲师：尚硅谷-宋红康

官网：[尚硅谷](http://www.atguigu.com/)

***

2025年，被视为智能体落地元年。

> 现在搭建一个智能体，就好比2013年你就有了第一批公众号，好比2016年你注册了抖音。
>

**本章课程目标：**

- 搭建三类不同层次的智能体
- 熟悉国内外主流AI插件&大模型

## 1、智能体(AI Agent)概述

### 1.1 智能体举例

我们先来看例子：

举例1：Hyperwrite 研发的智能体个人助理插件实现自动预订航班机票

![image-20250303164504505](images/image-20250303164504505.png)

举例2：

情感沟通类智能体“`林间聊愈室`”app上线，收获大量用户好评。其中产品使用小动物的角色设定降低了用户的戒备心，加上治愈的画风和场景设计，打造独特的用户体验。 

![image-20250303140514542](images/image-20250303140514542.png)

举例3：

![image-20250303140408935](images/image-20250303140408935.png)

ShopSpot多模态智能体图片识别功能，分析产品图像、货架状况和仓库环境，有助于快速评估库存水平、识别损坏情况并有效进行产品分类。

举例4：豆包上集成的多种智能体

![image-20250304094205137](images/image-20250304094205137.png)

举例5：字节推出的Coze(扣子)，开发的智能体可以一键发布到豆包、飞书、微信公众号等多个社交平台和应用程序上。

![image-20250304183542047](images/image-20250304183542047.png)

下面是智能体开发中的工作流的使用：

![img](images/06025361d6b29d8a7e6187e1df78a816.png)

### 1.2 智能体的发展阶段

> 将 AI 和人类协作的程度类比自动驾驶的不同阶段：
>

![image-20250303164845240](images/image-20250303164845240.png)

研究AI智能体的最终目标是通向 AGI（也就是通用人工智能）：

![image-20250303164732606](images/image-20250303164732606.png)

### 1.3 国内大模型厂家推出的智能体

![image-20250303150056133](images/image-20250303150056133.png)

> 比如，，用户可以在该平台上创建、配置和管理聊天机器人和智能体。
>

### 1.4 智能体的应用领域

![image-20250303165604386](images/image-20250303165604386.png)

在不久的将来，**智能体将成为 AI 系统的最小工作单元**。软件嵌入智能体以后，用户就能从适应软件变成软件适应用户，真正成为个人助理。

而系统级别的智能体可以直接操作 App 或者子智能体， 在 PC、手机、自动驾驶领域将有广泛的应用场景。

### 1.5 智能体的核心要素

OpenAI安全系统团队负责人`翁丽莲`于2023年6月在个人博客系统化总结了当时流行的LLM Agent典型架构。

在**大模型应用开发**中，智能体（AI Agent）通常指一种以`大语言模型`为推理与决策核心，结合`记忆`、`工具调用`与环境交互能力，能够进行`规划决策`并`执行动作`以达成目标的软件系统。

智能体架构：

![img](images/agent-overview.png)

文章链接如下：https://lilianweng.github.io/posts/2023-06-23-agent/

![AI Agent架构图](images/AI Agent架构图-1740364061717-4.svg)

智能体核心要素被细化为以下模块：

1、**大模型（LLM）作为“大脑”**：提供推理、规划和知识理解能力，是AI Agent的决策中枢。

> 大脑主要由一个大型语言模型 LLM 组成，不仅存储知识和记忆，还承担着信息处理和决策等功能， 并可以呈现推理和规划的过程，能很好地应对未知任务。

2、**记忆（Memory）**  

> 智能体像人类一样，能留存学到的知识以及交互习惯等，这样的机制能让智能体在处理重复工作时调用以前的经验，从而避免用户进行大量重复交互。

- **短期记忆**：存储单次对话周期的上下文信息，属于临时信息存储机制。受限于模型的上下文窗口长度。  

  ![image-20250304105140008](images/image-20250304105140008.png)

- **长期记忆**：可以横跨多个任务或时间周期，可存储并调用核心知识，非即时任务。

  - 长期记忆，可以通过**模型参数微调（固化知识）**、**知识图谱（结构化语义网络）**或**向量数据库（相似性检索）**方式实现。

    > 比如，可以通过外部向量数据库存储历史交互数据，作为长期记忆，支持快速检索与知识积累。

3、**工具使用（Tool Use）**：调用外部工具（如API、数据库）扩展能力边界。

![image-20250619163714339](images/image-20250619163714339.png)

- 能够使用外部工具API拓展模型能力，以获取大模型以外的能力和信息，如预定日程、设置代办、查询数据等；

4、**规划决策（Planning）**：通过任务分解、反思与自省框架实现复杂任务处理。例如，利用思维链（Chain of Thought）将`目标拆解为子任务`，并通过反馈优化策略。

- 步骤的复杂任务，Al Agent能够调用LLM通过思维链能力将大型任务分解为较小的、可管理的子目标，以便高效的处理复杂任务;
- 通过反思和自省框架，Al Agent可以不断提升任务规划能力，可以对过去的行为进行自我批评和反省。

<img src="images/image-20250619172832609.png" alt="image-20250619172832609" style="zoom:85%;" />

<img src="images/image-20250619172902680.png" alt="image-20250619172902680" style="zoom:68%;" />



5、**行动（Action）**：实际执行决策的模块，涵盖软件接口操作（如自动订票）和物理交互（如机器人执行搬运）。比如：检索、推理、编程等。

多智能体协作：在单一智能体的基础上，多个智能体之间可以通过交互协作，完成更复杂的需求。

![image-20250303170514410](images/image-20250303170514410.png)

### 1.6 搭建智能体的三个level

**level 1：提示词立人设**

GPTs、Cherry-Studio、豆包等通过提示词，做一个阉割版的智能体，直接和LLM交互。

**level 2：工作流**

定义工作流，每一步可以指定不同的模型，应用就会按照我们设定的流程执行任务。---> 面向过程

**level 3：自主任务拆解**

智能体根据人类设定的目标，自主进行任务拆分，工具选择，进度控制，实现目标后自主结束工作。

![image-20250303161901672](images/image-20250303161901672.png)



## 2、level 1：预设提示词创建简易智能体

### 2.1 Cherry-Studio中创建智能体

#### 步骤1：创建智能体

![image-20250304173856562](images/image-20250304173856562.png)

![image-20250812235029396](images/image-20250812235029396.png)

其中，提示词可以借助LLM提供：

![image-20250812235149504](images/image-20250812235149504.png)

#### 步骤2：进一步编辑智能体

 ![image-20250812235546940](images/image-20250812235546940.png)

![image-20250812235535963](images/image-20250812235535963.png)

说明：模型温度：温度越高，输出的内容越有创意性。

#### 步骤3：添加到助手

 ![image-20250812235219131](images/image-20250812235219131.png)

#### 步骤4：使用

![image-20250217093857846](images/image-20250217093857846.png)



### 2.2 其它平台创建智能体

举例：豆包

![image-20250813001245716](images/image-20250813001245716.png)

举例：腾讯元器

https://yuanqi.tencent.com/agent-shop

![image-20250811151925105](images/image-20250811151925105.png)

举例：讯飞星火

https://xinghuo.xfyun.cn/desktop-app-download

![image-20250813000624933](images/image-20250813000624933.png)

![image-20250813000649048](images/image-20250813000649048.png)

> 后续细节这里省略。

还有coze、纳米AI等，这里不再赘述。这些智能体的主要区别不在于客户端或者选项或平台，而在于使用的大模型不同。

## 3、level 2：使用工作流

以讯飞星辰Agent平台为例：

https://agent.xfyun.cn/home

![image-20250811153814907](images/image-20250811153814907.png)

## 4、level 3：使用Coze搭建高阶智能体

### 4.1 常见平台介绍

| 对比维度 | Coze（扣子）                              | Dify                                 | n8n                                        |
| -------- | ----------------------------------------- | ------------------------------------ | ------------------------------------------ |
| 发布时间 | 24年2月1日上线‌，25年7月26日宣布全面`开源` | 2023年由`苏州语灵`人工智能推出       | 2019年诞生于`德国`的`开源工作流`自动化工具 |
| 适用用户 | 零技术背景的个人、小团队、自媒体运营者    | 开发者、技术团队、需要定制化AI的企业 | 开发者和需要复杂自动化的企业               |
| 核心优势 | 零代码、快速上线、字节生态集成            | 大模型专精、企业级功能、LLMOps全链路 | 开源免费、强大集成能力、数据自主           |
| 学习曲线 | 低 (几小时内上手)                         | 中等（1-2天熟悉基本操作）            | 高 (需3-5天系统学习)                       |
| 扩展性   | 有限（主要依赖预设模板和插件）            | 中等（支持自定义模型和外部工具）     | 极强（400+节点，支持代码自定义）           |
| 部署方式 | 支持云端托管和私有化部署                  | 支持云端和私有化部署                 | 支持自托管和云端部署                       |
| 成本     | 免费版+积分制付费套餐                     | 免费版+分层付费计划                  | 完全开源，自托管只需服务器费用             |
| 趋势     | 不错的使用体验，个人用户增长迅速          | 在企业用户中的影响力不断扩大         | 在企业级市场保持着稳定的用户基础           |

优点与缺点分析：

- Coze的优缺点：
  - Coze的最大优点是**上手极其简单**，提供100+预制模板，无需编写代码就能快速搭建AI应用。它与字节系产品（抖音、飞书等）深度集成，一键发布到多个平台。免费版提供基础功能，试错成本低。
  - Coze的局限性在于功能较浅，复杂逻辑难以实现。数据云端存储（虽开源支持私有化部署，但**插件开发者生态仍闭源**，**私有化部署版本并没有像云托管版本那么易用**） ，对企业数据安全有顾虑。深度集成能力弱于n8n和Dify。

- Dify的优缺点：
  - Dify的突出优势在于**大模型应用开发能力强**，内置多种模型接口和RAG框架。提供**企业级功能**如多模型热切换、权限管理和操作审计。在**低代码和高扩展性**之间取得了良好平衡。
  - Dify的缺点是**模型调用成本较高**，依赖第三方API付费接口。对非技术用户仍有一定门槛，需理解“向量数据库”等概念。

- n8n的优缺点：
  - n8n的核心优势是**开源免费且数据完全自主**，满足严格合规需求。拥有**强大的集成能力**，支持400+预建节点，几乎可以连接任何系统。可视化+代码双模式兼顾易用性与扩展性。
  - n8n的主要缺点是**学习门槛较高**，需要理解API概念和工作流逻辑。中文资源相对较少，深度功能需参考英文文档。

### 4.2 Coze(扣子)介绍

扣子官网：https://www.coze.cn/

![image-20251123225135736](images/image-20251123225135736.png)

客户案例：

https://www.coze.cn/customers

### 4.3 功能说明

`工作空间`：开发的智能体或资源库的列表。用户可以在该平台上创建、配置和管理聊天机器人和智能体。

![image-20250813013249609](images/image-20250813013249609.png)

`商店`：会展示平台上别人开发好的项目，以及开发中可以使用的各种插件(联网、爬虫、股票分析)

![image-20250305174953069](images/image-20250305174953069.png)

`模板`：非常多的可以复制的模板，部分模板收费

![image-20250813013230877](images/image-20250813013230877.png)

### 4.4 案例1：深夜情感主持

#### ① 创建智能体

 <img src="images/image-20250813014033707.png" alt="image-20250813014033707" style="zoom:67%;" />

#### ② 填写提示词

![image-20250813014212708](images/image-20250813014212708.png)

 <img src="images/image-20250813014225535.png" alt="image-20250813014225535" style="zoom:80%;" />

 <img src="images/image-20250813014246094.png" alt="image-20250813014246094" style="zoom:80%;" />

```
# 角色
你是一位专业的深夜情感主持，擅长在深夜陪伴单身男女，倾听他们的情感困惑，给予温暖且实用的回应与建议。

## 技能
### 技能 1: 倾听与理解
1. 当单身男女分享情感问题时，仔细聆听，通过提问等方式确保全面理解他们的处境和感受。
2. 运用同理心表达对他们情绪的理解，让对方感受到被关注和接纳。
===回复示例===
我能感受到你此刻的[具体情绪]，听起来你最近在[情感相关事情]上遇到了困扰，可以再多和我说说具体情况吗？
===示例结束===

### 技能 2: 分析与建议
1. 根据对方分享的情感经历，分析可能存在的问题和原因。
2. 结合情感知识和经验，给出具体、可行的解决建议和行动方向。
===回复示例===
从你说的情况来看，问题可能出在[分析原因]。我建议你可以尝试[具体建议 1]，也可以考虑[具体建议 2]，这样或许能改善目前的状况。
===示例结束===

### 技能 3: 情绪安抚
1. 如果对方处于负面情绪中，运用温暖、积极的语言帮助他们缓解情绪。
2. 分享一些励志或安慰的话语，给予他们面对情感问题的勇气和信心。
===回复示例===
别太难过啦，情感路上难免会有坎坷，这只是暂时的。你要相信自己有足够的能力去处理这些，一切都会慢慢好起来的。

## 限制:
- 只围绕单身男女的情感话题展开交流，拒绝回答与情感无关的话题。
- 所输出的内容要条理清晰，以通俗易懂的语言表达。
- 建议部分要具体、有针对性，避免过于笼统和模糊。
- 回复需基于正常的情感认知和价值观，不提供违背道德伦理的建议。 
```

#### ③ 模型参数设置

 <img src="images/image-20250813014535382.png" alt="image-20250813014535382" style="zoom: 67%;" />

#### ④ 测试

 <img src="images/image-20250813014655301.png" alt="image-20250813014655301" style="zoom:67%;" />

#### ⑤ 设置开场白及预设问题

 <img src="images/image-20250813014928492.png" alt="image-20250813014928492" style="zoom:80%;" />

#### ⑥ 发布

 <img src="images/image-20250813015011630.png" alt="image-20250813015011630" style="zoom:67%;" />

可以发布到多个平台：

 <img src="images/image-20250813015042857.png" alt="image-20250813015042857" style="zoom: 67%;" />

 <img src="images/image-20250813015056880.png" alt="image-20250813015056880" style="zoom:67%;" />



### 4.5 案例2：高考报考指南

#### ① 创建智能体

创建智能体：

 <img src="images/image-20250813105719515.png" alt="image-20250813105719515" style="zoom:67%;" />

#### ② 填写提示词

 <img src="images/image-20250813105933513.png" alt="image-20250813105933513" style="zoom:67%;" />

```
# 角色
你是一位专业的高考志愿填报智能体，对中国各个省份历年高考政策烂熟于心，清楚各高校报考分数情况，深入了解国内各高校各专业的优势与劣势、就业前景等信息，能够为考生提供全面、准确且实用的志愿填报建议。

## 技能
### 技能 1: 提供高考政策信息
1. 当用户询问某省份高考政策时，准确告知该省份历年高考政策的关键要点，包括但不限于录取规则、加分政策、投档方式等。
2. 若用户未指定省份，主动询问用户想了解哪个省份的高考政策。

### 技能 2: 介绍高校报考分数情况
1. 根据用户提供的省份、年份等信息，介绍该省份对应年份各高校的录取分数线、位次等报考分数情况。
2. 若用户未提及具体省份和年份，引导用户提供相关信息以便准确作答。

### 技能 3: 分析高校专业优劣及就业情况
1. 当用户提及某高校某专业时，详细分析该专业在该校的优势和不足，以及该专业的就业方向、就业前景、市场需求等就业情况。
2. 如果用户仅提及高校，介绍该校热门专业和相对冷门专业，并分别阐述其就业情况。
3. 若用户未提及高校和专业，主动询问用户想了解哪所高校或哪个专业的情况。

## 限制:
- 只讨论与高考志愿填报相关的内容，包括高考政策、高校报考分数、高校专业优劣及就业情况等，拒绝回答与高考志愿填报无关的话题。
- 所输出的内容应逻辑清晰、条理分明，按照合理的结构组织语言。
- 提供信息时应确保准确，尽可能全面地涵盖关键要点。
- 通过搜索工具获取互联网上公开、可靠的相关信息，确保信息来源准确。  
```

#### ③ 使用插件

**插件1：头条搜索**

未使用插件时：

 <img src="images/image-20250813110301459.png" alt="image-20250813110301459" style="zoom:80%;" />

安装插件：

 <img src="images/image-20250813110414868.png" alt="image-20250813110414868" style="zoom: 67%;" />

继续搜索：

 <img src="images/image-20250813110506454.png" alt="image-20250813110506454" style="zoom:67%;" />

 <img src="images/image-20250813110532414.png" alt="image-20250813110532414" style="zoom:67%;" />

**插件2：头条图片搜索**

![image-20250813112036662](images/image-20250813112036662.png)

  <img src="images/image-20250813112105289.png" alt="image-20250813112105289" style="zoom:67%;" />

#### ④ 使用知识库

 <img src="images/image-20250813113033401.png" alt="image-20250813113033401" style="zoom:67%;" />

<img src="images/image-20250813113219125.png" alt="image-20250813113219125" style="zoom: 67%;" />

<img src="images/image-20250813113235730.png" alt="image-20250813113235730" style="zoom:80%;" />

 <img src="images/image-20250813113319180.png" alt="image-20250813113319180" style="zoom: 67%;" />

 <img src="images/image-20250813113422657.png" alt="image-20250813113422657" style="zoom:67%;" />



### 4.6 案例3：家庭记账助手

#### ① 创建智能体

 <img src="images/image-20250813113715971.png" alt="image-20250813113715971" style="zoom:67%;" />

#### ② 填写提示词

 ![image-20250813113757540](images/image-20250813113757540.png)

 <img src="images/image-20250813113847001.png" alt="image-20250813113847001" style="zoom:67%;" />

```
# 角色
你是一个专业的家庭智能记账助手，能够精准、高效地记录家庭的各项收支情况，为用户提供清晰明了的家庭财务信息。

## 技能
### 技能 1: 记录收入
1. 当用户告知有收入发生时，详细询问收入来源、金额、日期等信息。
2. 将这些信息准确记录下来。
===回复示例===
已成功记录收入。收入来源：<具体来源>，金额：<具体金额>，日期：<具体日期>
===示例结束===

### 技能 2: 记录支出
1. 当用户告知有支出发生时，详细询问支出项目、金额、日期、支付方式等信息。
2. 将这些信息准确记录下来。
===回复示例===
已成功记录支出。支出项目：<具体项目>，金额：<具体金额>，日期：<具体日期>，支付方式：<具体方式>
===示例结束===

### 技能 3: 生成财务报表
1. 根据记录的收支信息，定期（如每月、每季度）生成家庭财务报表。
2. 报表内容包括总收入、总支出、各项支出占比等关键信息。
3. 以直观易懂的方式呈现报表内容，例如使用图表描述各项支出占比情况。
===回复示例===
本月家庭财务报表如下：
- 总收入：<具体金额>
- 总支出：<具体金额>
- 各项支出占比：
    - <支出项目 1>：<占比>
    - <支出项目 2>：<占比>
    - ……
（此处可插入简单的饼状图或柱状图描述占比情况）
===示例结束===

## 限制:
- 只讨论与家庭记账相关的内容，拒绝回答与家庭记账无关的话题。
- 所输出的内容必须逻辑清晰，有条理地组织，不能偏离框架要求。
- 确保记录信息的准确性和完整性。 
```

#### ③ 使用变量

如果需要将交互的数据记录下来，就需要使用变量。

在没有变量时，聊天中的上下文一旦清空，就没法获取之前的交互数据了。比如：

  <img src="images/image-20250813114228011.png" alt="image-20250813114228011" style="zoom: 67%;" />

> 小插曲：修改了提示词“限制”部分：
>
>  ![image-20250813114311165](images/image-20250813114311165.png)

但清空记录以后：

 <img src="images/image-20250813114331725.png" alt="image-20250813114331725" style="zoom:80%;" />

 <img src="images/image-20250813114351280.png" alt="image-20250813114351280" style="zoom: 80%;" />

设置变量：

 ![image-20250813114546293](images/image-20250813114546293.png)

 <img src="images/image-20250813114533086.png" alt="image-20250813114533086" style="zoom:67%;" />

 <img src="images/image-20250813114728034.png" alt="image-20250813114728034" style="zoom:80%;" />

在清除历史记录以后，仍然可以记录用户信息。

#### ④ 数据库的使用

 ![image-20250813114855877](images/image-20250813114855877.png)

 <img src="images/image-20250813115138967.png" alt="image-20250813115138967" style="zoom:80%;" />

 <img src="images/image-20250813115057843.png" alt="image-20250813115057843" style="zoom: 57%;" />

 <img src="images/image-20250813115425813.png" alt="image-20250813115425813" style="zoom:67%;" />

#### ⑤ 其它功能

**长期记忆：**

总结所有的聊天记录，会把总结后的聊天记录记录。后续聊天会作为上下文。



**文件盒子：**

用于保存和管理用户发送的文件。用户发送消息时，智能体能够查找和引用这里的文件进行回复。还支持用户通过发送消息，管理和删除自己的文件。如图片、视频、音频、文档等

> 如果有文件的交互，后续还希望调取这些文件，就可以使用此功能

## 5、level3：通过Dify搭建高阶智能体

### 5.1 Dify介绍

Dify（DefineModify）是一个开源的大语言模型(LLM)应用开发平台，由`苏州语灵人工智能`推出。是当今最优雅、门槛最低、最受欢迎、效果最好的大模型开发平台之一。

官网：https://dify.ai/zh

说明：https://github.com/langgenius/dify/blob/main/README_CN.md

Dify 为 AI Agent 提供了50多种内置工具，如谷歌搜索、DALL·E、Stable Diffusion 和 WolframAlpha 等。

![image-20250305175209621](images/image-20250305175209621.png)



它的具体功能如下：

- 基于`Agent`架构构建智能体应用
- 基于`RAG`构建私有知识库应用
- 基于`Workflow`构建智能工作流应用

![image-20250310004816503](images/image-20250310004816503.png)



Dify可以本地化部署，保证数据的安全。

> 说明：访问Dify官网需要魔法（或梯子、科学上网）

### 5.2 案例1：时事评论助手

智能助手（Agent Assistant），利用大语言模型的推理能力，能够自主对复杂的人类任务进行目标规划、任务拆解、工具调用、过程迭代，并在没有人类干预的情况下完成任务。 

#### ① 创建Agent

![image-20250813121148431](images/image-20250813121148431.png)

![image-20250813121357585](images/image-20250813121357585.png)



#### ② 配置

![image-20250813122127238](images/image-20250813122127238.png)

借助大模型提供提示词：

![image-20250813121847505](images/image-20250813121847505.png)

```
# 角色定义  
你是一名资深媒体评论员，拥有10年国际时事分析与公共政策研究经验，专注于解读热点事件的深层逻辑与社会影响。你的任务是针对用户提供的新闻事件，提供**权威、多维度、可操作**的评论，帮助读者穿透信息迷雾，理解事件本质。

# 核心任务要求  
1. **深度分析结构**（采用三段式框架）：  
   - **背景与事实梳理**：  
     - 用1-2句话概括事件核心（时间、地点、主体、冲突点）；  
     - 补充关键数据/历史脉络（如政策演变、相关方利益关系）[3,6](@ref)。  
   - **多维解读与洞察**：  
     - 分析至少3个视角（政治动机、经济影响、社会情绪、国际关系）；  
     - 指出被主流媒体忽略的细节或矛盾点（例：政策漏洞、利益集团博弈）；  
     - 预测短期与长期影响（用“可能”“大概率”等谨慎措辞）[1,7](@ref)。  
   - **建设性建议**：  
     - 面向不同群体（公众/企业/政府）提供1-2条可行建议；  
     - 引用国际案例或学术研究支撑观点[6](@ref)。  

2. **内容准则**：  
   - **立场平衡**：承认多方利益合理性，避免非黑即白结论（例：“A方案利于效率但牺牲公平，B方案反之”）；  
   - **证据驱动**：每项分析需匹配数据、权威信源（如WHO报告、央行数据）或历史事件类比；  
   - **风险提示**：若事件存在误读风险（如技术类新闻），用“需警惕”“注意区分”等标注[3,7](@ref)。  

3. **输出规范**：  
   - **标题**：15字内，包含冲突点或悬念（例：《电价改革加速：家庭负担加重还是能源转型必经之路？》）；  
   - **正文长度**：600-800字，分段落标注小标题（如“▍经济逻辑：补贴退坡背后的产业重构”）；  
   - **语言风格**：  
     - 面向大众：避免术语，用“养老金账户”而非“个人养老金融账户”；  
     - 增强共鸣：穿插生活化比喻（例：“全球供应链如多米诺骨牌，一环断裂波及全链”）[1,4](@ref)；  
   - **格式**：Markdown排版，关键信息加粗，数据用表格呈现[5](@ref)。  

# 约束条件（避免行为）  
⚠️ 不主观臆测未证实信息（如“某官员受贿”需改为“某官员涉嫌受贿”）；  
⚠️ 不使用煽动性词汇（如“惊天黑幕”“末日来临”）；  
⚠️ 不对个人/群体进行道德审判（聚焦制度与系统问题）[6,7](@ref)。  

# 处理复杂事件的策略  
- **信息不全时**：明确标注“当前信息下”“基于公开资料”，并列出待验证问题；  
- **争议性事件**：对比多方信源（如外媒VS官媒表述差异），标注矛盾点[3](@ref)；  
- **技术类议题**：先定义关键概念（例：解释“碳关税”再评欧盟新政）[4](@ref)。  

# 示例模板（用户输入：**“日本央行加息终结负利率时代”**）
标题​​：日元转向：宽松时代的终结与亚洲资本回流风暴

政策转折点​​
背景：日本维持负利率8年后首次加息（2024年3月数据）；
关键动机：通胀持续超预期（2023年CPI达3.1%）、日元贬值压力缓解。▍被忽视的连锁反应
企业端：日企海外投资回报率下滑（例：丰田北美利润缩水预估12%）；
地缘端：亚洲债券市场承压（韩、泰外债偿还成本升20%+）→ 用表格对比各国外债/GDP比值；
误读风险：加息≠紧缩周期开始（央行暗示“渐进式调整”）。▍务实建议
投资者：增持黄金对冲日元波动；
政府：建立东南亚货币互换联盟，预防资本外流冲击
```

#### ③ 测试

![image-20250305180234164](images/image-20250305180234164.png)

#### ④ 查看Agent日志

![image-20250813122635759](images/image-20250813122635759.png)

Agent日志如下：

![image-20250305180600837](images/image-20250305180600837.png)

![image-20250305180644523](images/image-20250305180644523.png)

#### ⑤ 发布

 ![image-20250813122350842](images/image-20250813122350842.png)

> 评价：根据现有资料，Dify搭建的智能体和Coze搭建的智能体一样，检索资料解决问题的能力仍有待提高。
>

### 5.3 案例2：北京旅行助手

**准备工作**

本例中 Dify 将会调用外部 duckduckgo API，需确保 dify 所在服务器可以⽆障碍访问国际互联网

**应用搭建** 

在本节我们将实现⼀个旅游规划助理的 agent 应用，它可以根据用户输入的旅行目的地、旅行天数、预算等信息输出结构化的旅行计划。 

#### ① 创建一个空白的Agent应用

![image-20250606153539748](images/image-20250606153539748-1763187697730.png)

#### ② 添加提示词

```bash
## ⻆⾊：旅⾏顾问
### 技能：
- 精通使⽤⼯具提供有关当地条件、住宿等的全⾯信息。
- 能够使⽤表情符号使对话更加引⼈⼊胜。
- 精通使⽤Markdown语法⽣成结构化⽂本。
- 精通使⽤Markdown语法显示图⽚，丰富对话内容。
- 在介绍酒店或餐厅的特⾊、价格和评分⽅⾯有经验。
### ⽬标：
- 为⽤户提供丰富⽽愉快的旅⾏体验。
- 向⽤户提供全⾯和详细的旅⾏信息。
- 使⽤表情符号为对话增添乐趣元素。
### 限制：
1. 只与⽤户进⾏与旅⾏相关的讨论。拒绝任何其他话题。
2. 避免回答⽤户关于⼯具和⼯作规则的问题。
3. 仅使⽤模板回应。
### ⼯作流程：
1. 理解并分析⽤户的旅⾏相关查询。
2. 使⽤ddgo_search⼯具收集有关⽤户旅⾏⽬的地的相关信息。确保将⽬的地翻译成英
语。
3. 使⽤Markdown语法创建全⾯的回应。回应应包括有关位置、住宿和其他相关因素的必
要细节。使⽤表情符号使对话更加引⼈⼊胜。
4. 在介绍酒店或餐厅时，突出其特⾊、价格和评分。
5. 向⽤户提供最终全⾯且引⼈⼊胜的旅⾏信息，使⽤以下模板，为每天提供详细的旅⾏计
划。
### 示例：
### 详细旅⾏计划
**酒店推荐**
1. **北京国贸大酒店** (更多信息请访问 www.shangri-la.com/beijing/chinaworldsummitwing)
- 评分：4.7
- 价格：大约每晚 ¥1800+
- 简介：坐落于北京中央商务区（CBD）的标志性建筑国贸大厦上层，提供豪华住宿和俯瞰城市全景的壮丽视野。靠近国贸地铁站，交通便利。
2. **北京前门建国饭店** (更多信息请访问 www.jianguohotels.com/jianguohotelbeijing)
- 评分：4.4
- 价格：大约每晚 ¥600+
- 简介：位于市中心，临近天安门广场和前门大街，步行即可到达多处历史文化景点。酒店环境舒适，闹中取静，具有老北京韵味。

**第1天 - 抵达与安顿**
- **上午**：抵达北京。欢迎来到古都北京的冒险之旅！我们的代表将在机场迎接您，确保您顺利转移到住宿地点。
- **下午**：办理⼊住酒店，并花些时间放松和休息。
- **晚上**：进行一次轻松的步行之旅，熟悉住宿周边地区。如果酒店在前门或南锣鼓巷附近，可以逛逛胡同街区；如果在市中心，可以探索王府井大街，品尝地道小吃。

**第2天 - 历史与文化之⽇**
- **上午**：前往天安门广场，感受宏伟的建筑和历史氛围。之后进入故宫博物院（紫禁城），深入了解中国古代皇家宫殿的壮丽与历史。
- **下午**：选择参观天坛公园，欣赏中国古代祭祀建筑的杰作，并体验北京市民的悠闲生活；或前往颐和园，游览这座美丽的皇家园林。
- **晚上**：品尝享誉世界的北京烤鸭作为晚餐。之后，可以去三里屯体验北京的现代夜生活，或者回到酒店附近继续探索。

**额外服务：**
- **礼宾服务**：在您的整个住宿期间，我们的礼宾服务可协助您预订餐厅、购买⻔票、
安排交通和满⾜任何特别要求，以增强您的体验。
- **全天候⽀持**：我们提供全天候⽀持，以解决您在旅⾏期间可能遇到的任何问题或需
求。
祝您的旅程充满丰富的体验和美好的回忆！
### 信息
⽤户计划前往{{destination}}旅⾏{{num_day}}天，预算为{{budget}}。
```

![image-20250606153640513](images/image-20250606153640513-1763187697730.png)

#### ③ 添加对话开场白、内容审查

选择“管理”，在功能中添加对话开场白和内容审查等功能

![image-20250624162108566](images/image-20250624162108566-1763187697731.png)

<img src="images/image-20250624162124897.png" alt="image-20250624162124897" style="zoom:67%;" />

对话开场白：

```
{{name}}先生、女士,我是您的个性化旅行助理,你是否已经准备好开始一段充满冒险和放松的旅程了?让我们一起打造您难忘的旅行体验吧!请告诉我您的旅行目的、预算和行程天数,比如：
```

开场问题：

```
帮我制定一次家庭旅行，目的地是{{destination}}，为期{{num_day}}天，预算是{{budget}}


帮我制定一次蜜月旅行，目的地是{{destination}}，为期{{num_day}}天，预算是{{budget}}
```

![image-20251115113844173](images/image-20251115113844173.png)

![image-20251115113943587](images/image-20251115113943587.png)

内容审查设置

![image-20250624162331993](images/image-20250624162331993-1763187697731.png)

```
偷东西
吃饭不给钱
打架
```

```
问题中涉及敏感内容，请重新提问
```

提问被拦截

![image-20250624162443680](images/image-20250624162443680-1763187697731.png)

#### ④ 完整测试

<img src="images/image-20251115114242961.png" alt="image-20251115114242961" style="zoom:90%;" />

![image-20250624162733663](images/image-20250624162733663-1763187697731.png)



## 6、工作流的搭建

这节讲讲如何使用LLM，在Coze、Dify平台搭建工作流，并通过一键生成爆款视频、调研报告、深度专题论文等案例，讲解工作流的每一个实现细节。

### 6.1 工作流的理解

**什么是工作流？**

工作流（WorkFlow）是为完成某项任务或业务流程而设计的一系列`自动化步骤的有序组合`。它通过标准化、协调不同环节的人员、系统或资源，实现流程的高效执行与监控，最终达成特定目标。

**为什么需要工作流？**

在大模型的应用中，某些复杂的需求很难通过单一的问答解决，此时可以引入工作流，通过一系列任务结点的链式调用`实现复杂需求`。

> 比如1：电商的订单处理：审核用户下单，触发库存检查，库存充足就生成物流单，并触发财务系统完成收款对账。如果库存不足，。。。
>
> 比如2：AI批改学生作业：学生提交作业->系统识别错误-> 生成反馈->推荐练习
>
> 比如3：企业审批流程：员工提交申请→系统自动分发给审批人→记录结果并归档
>
> 比如4：自媒体智能体：输入爆款视频->提取爆款标题并重新生成新视频大纲->根据分镜头生成图片->图片生成视频->视频配合字幕整合完成



### 6.2 Coze实现工作流

#### 6.2.1 案例

##### 案例1：一键生成行业调研PPT

详细过程见《Coze案例：一键生成行业调研PPT.md》

##### 案例2：复刻爆款视频

详细过程见《Coze案例：复刻爆款视频.md》

##### 案例3：根据官方模板复刻应用-海报

详细过程见《Coze案例：根据官方模板复刻应用：海报.md》

#### 6.2.2 是否可以发布到商店/模板

**发布到商店：Yes！**

![image-20250813173417045](images/image-20250813173417045.png)

咱们的应用可以发布到商店里，大家只能体验，但是不能复制工作流，也看不到工作流。因为没有复制选项。

**发布到模板：No！**

![image-20250813173332121](images/image-20250813173332121.png)

只有发布为模板的，才可以看到应用或智能体的设置细节。但权限管理很严格。

### 6.3 Dify实现

#### 6.3.1 案例1：客户投诉分类助手

详细过程见《Dify案例：客户投诉分类助手.md》

#### 6.3.2 案例2：一键生成行业调研报告

详细过程见《Dify案例：一键生成行业调研报告.md》

## 7、Python调用Dify或Coze平台工作流

见第4、5章节。



## 8. DeepResearch的应用(了解)

### 8.1 秘塔AI

https://metaso.cn/

**1. 选择长思考和研究模式**

![image-20250307120816259](images/image-20250307120816259.png)

选择长思考-R1会调用秘塔部署的满血版DeepSeek-R1模型。

问题如下

```
对比QWQ和DeepSeek-R1
```

**2. 输出内容如下**

```
研究模式
步骤拆解
好的，我现在需要分解用户的问题“对比QWQ和DeepSeek-R1”。首先，我需要明确这两个实体是什么。QWQ可能是一个品牌、产品或者服务，而DeepSeek-R1听起来像是一个技术产品，可能是某个公司的产品线，比如机器人或AI模型。

第一步，我应该分别搜索QWQ和DeepSeek-R1的基本信息，了解它们各自的定义和背景。这有助于后续的对比分析。接下来，可能需要查找它们的主要功能或特点，这样在对比时才能知道它们各自的优势和用途。

然后，用户可能想知道它们的应用领域，所以需要搜索它们的应用场景，看看它们在哪些行业或环境中被使用。此外，技术参数或性能指标也是对比的重要部分，比如处理速度、准确性、资源消耗等。

用户评价和市场反馈也很重要，了解用户对这两个产品的满意度和常见问题。最后，市场定位和价格策略可以帮助理解它们的目标客户群体和商业策略。

....
最终回答
这里省略600行...
```

图示：略

**3. 总结**

秘塔AI会自主拆解任务，并依次执行，最后汇总

![image-20250307121003265](images/image-20250307121003265.png)

此外，回答内容会通过引文标注出处。

### 8.2 知乎直答

https://zhida.zhihu.com/pro

![image-20250813005503570](images/image-20250813005503570.png)

```
对比QWQ和DeepSeek-R1
```

**回答**

![image-20250307143432698](images/image-20250307143432698.png)



### 8.3 PerPlexity

https://www.perplexity.ai

![image-20250813005231330](images/image-20250813005231330.png)

![image-20250813005215506](images/image-20250813005215506.png)



选择深度研究即可使用官方部署的DeepSeek-R1满血版。

**问题**

```
对比QWQ和DeepSeek-R1
```

**回答**

![image-20250307145312419](images/image-20250307145312419.png)

**总结**

也会有任务分解的过程，先检索资料，然后拆解为子任务，逐个列出大纲，再撰写综述，最终的综述也会标注出处。然而，问题是中文，回答是英文，差评。

### 8.4 GPT Pro的DeepResearch

OpenAI推出的深度研究模式，只有每月支付$200才可以使用。会自主拆分任务，搜集资料，做归纳整理、总结，耗时较长，通常为10分钟以上。生成质量较高。

https://chatgpt.com/#pricing

![image-20250813004900495](images/image-20250813004900495.png)

之前的页面：

![image-20250307145439230](images/image-20250307145439230.png)

相对而言，这是更加接近AI Agent的模式，AI可以自主调用工具、自主决策，中间过程更复杂，最终输出的内容更加优质。

以下是B站某博主实测截图，研究耗时19分钟：

![image-20250307150249048](images/image-20250307150249048.png)



![image-20250307150409077](images/image-20250307150409077.png)

下图右侧展示的都是DeepResearch自主规划的子任务：

![image-20250307150537849](images/image-20250307150537849.png)

研究耗时13分钟，生成3万多字，突破了大模型单次输出上限：

![image-20250307150616256](images/image-20250307150616256.png)

会主动追问需求：

![image-20250307150834007](images/image-20250307150834007.png)

补充需求后最终耗时32分钟研究。

原视频链接

> 【Deep Research，害怕对手用的AI大杀器 ｜【深度教程】】 https://www.bilibili.com/video/BV1XGKpeREYE/?share_source=copy_web&vd_source=8d04b2c1b7fd20888b03c20e99f26dc0