跳转至

1.1 Coze平台介绍

学习目标

  • 了解智能体的基本概念
  • 了解智能体和应用的区别
  • 了解开源版Coze和在线版区别

一、智能体的基本概念

1 智能体和Agent

在以chatgpt的大模型出现以后,模型具备了“思考”能力,能够帮助我们解决一些知识获取和推理等问题。但是因为大模型只能输出内容,能够帮助我们解决的业务问题有限,如果能让大模型具备使用工具的能力,将很大程度上拓宽大模型能力的边界。 于是基于大模型+工具调用这种解决方案,“智能体”和“Agent”这个概念在业界出现并大火。

  • 智能体,又称Agent。是指能够感知环境、分析信息、自主决策并采取行动以实现特定目标的软件实体或系统。它以大模型(如GPT等)为“大脑”,具备理解、规划、决策、记忆和行动的能力。AI Agent = LLM+ 记忆 + 任务规划 + 工具使用

  • 传统的大模型就像一个“百科全书”,知识渊博,有问必答,但它不会主动去“做”什么事。而智能体则像一个“全能助理”,比如你告诉它“我下周三要去杭州出差,帮我安排好行程”,它就能自主完成查询航班、预订酒店、规划市内交通、提醒天气等一系列操作 。它不仅“有脑”(能思考),还“有手有脚”(能调用工具去执行)。

image-20251017155049826

  • Agent的目标和理念:让它成为一个能自主思考、能帮你办事的“智能大脑”或“数字员工”。 现阶段,我们的Agent还处于过渡阶段,一般是以一个“流水线”的方式事先规定好业务流程,通过串联多个大模型负责处理不同的任务,从而解决一个复杂的业务场景。而Agent的终极形态是不需要开发这些流水线,Agent能够完全自主完成我们的各种需求,这依赖于大模型的能力,目前来看还需要一定的时间。

2 智能体开发平台-GPTS

  • 2023年11月,OpenAI 为旗下的 ChatGPT 推出了一项名为“GPTs”的服务,允许用户无需写代码就可以根据特定需求创建“属于自己的 ChatGPT 版本”,也就是基于 ChatGPT 创建一个Agent。

  • GPT Store访问地址:https://chat.openai.com/gpts,注意需要科学上网,以及当前只针对plus用户开通了使用权限。

img

二、Coze平台简介

1 Coze平台介绍

1.1 平台介绍

  • Coze 是由字节跳动推出的一个AI聊天机器人和应用程序编辑开发平台,可以理解为字节跳动版的GPTs.
  • Coze还提供了多种插件、知识、工作流、长期记忆和定时任务等功能,来增强聊天机器人的能力和交互性。而且你可以将搭建的 Bot 发布到各类社交平台和通讯软件上,让更多的用户与你搭建的 Bot 聊天。

Coze平台在线版的主页如下:

image-20251017164510312

1.2 智能体和应用

  • 智能体和应用是Coze平台的Agent的两种不同的形式,都可以使用Coze平台自带的功能进行开发和完成部署。在“作品社区”中,我们可以看到其他用户或者企业上线的的智能体和应用。 区分方式:是否有“应用”图标。 智能体和应用的区别我们稍后再讲。

image-20251017172433860

1.2.1 Coze智能体
  • 智能体是基于对话的 AI 项目,它通过对话方式接收用户的输入,由大模型自动调用插件或工作流等方式执行用户指定的业务流程,并生成最终的回复。智能客服、虚拟伴侣、个人助理、英语外教都是智能体的典型应用场景。

例如,使用华泰股市智能体。通过和它进行对话,实现我们的业务

image-20251017172154887

1.2.2 Coze应用
  • 应用是指利用大模型技术开发的应用程序。扣子中搭建的应用具备完整业务逻辑和可视化用户界面,是一个独立的 AI 项目。通过扣子开发的应用有明确的输入和输出,可以根据既定的业务逻辑和流程完成一系列简单或复杂的任务,例如 AI 搜索、翻译工具、饮食记录等。
  • 智能体和应用并非互斥,它们可以协同工作,形成更强大的解决方案。一个常见的模式是:AI 应用负责收集结构化的用户输入并呈现最终结果,而在处理过程中,可以调用一个或多个智能体来完成特定的分析、推理或创意生成任务

比如,自媒体运营大师V2: image-20251017175851247

1.2.3 智能体和应用的对比
  • 从原理层面上讲,智能体和应用的区别不大,主要在于呈现和交互的方式不同,接下来我们做一个对比:
对比维度 智能体 (Agent) AI 应用 (Application)
核心交互形态 对话驱动,以自然语言多轮对话为主 界面驱动,提供图形化界面(如表单、按钮)进行交互
设计目标与心智 跟我聊”,像一个专家或助手,灵活响应 帮我做”,像一个标准化工具,完成固定流程
功能复杂度 相对轻量,适合单一或特定任务 相对复杂,整合多个智能体、工具和流程,形成完整解决方案
典型发布渠道 对话框、Bot Store、集成到飞书/微信等即时通讯工具 独立的 Web App、H5 页面、小程序,或通过 SDK/API 集成

2 Coze平台在线版

在线版本的Coze(SaaS版,这个概念参考后面拓展内容的介绍), Coze(扣子)分为国内版和国外版:

  • 国内版访问地址:https://www.coze.cn/home,背后大模型应用的是字节自研的豆包大模型、通义千问和kimi大模型

  • 国外版访问地址:https://www.coze.com/home,背后大模型应用的是GPT-4、Gemini等,但是需要一些科学上网的方法。

image-20251017180902912

两个版本的对比:从模型的维度,当前国外版的Coze的确比国内版的要有优势,主要体现在模型上;从生态的维度,国内版本的Coze对接的各类插件都是国内的各类平台的(高德地图、企查查等)的,更符合国内的生态。

接下来的教程就以国内版 Coze 来进行,也可以参考官网文档:https://www.coze.cn/docs/guides/welcome 实现Coze平台的应用。

拓展:什么是SaaS

简单来说,SaaS(Software as a Service,软件即服务)就像软件的“订阅制”。您无需购买软件光盘安装到电脑上,而是通过互联网直接使用软件服务,按需订阅,按使用付费。 简单概括就是“可以在线使用的软件服务”。比如:腾讯文档、金蝶云、腾讯会议、钉钉、法大大等。需要注意的是这里的SaaS指的是商业软件,不包括爱奇艺、QQ会员这类面向用户的软件。

3 Coze平台开源版

在介绍Coze平台之前,先给同学们介绍一下,什么是开源软件

开源软件(Open Source Software)是一种将其源代码向公众开放的软件,允许任何人出于任何目的自由地查看、使用、修改和分发其原始代码。 比如我们使用的Linux操作系统、Mysql数据库、甚至Python语言,都属于开源软件。全球最大的开源社区

github: https://github.com/

仅仅公开源代码并不足以称为“开源”。真正的开源软件通常具备以下几个关键特征

  • 自由再分发:允许自由地销售和分发软件。
  • 允许派生作品:允许在原始软件基础上进行修改和创建新的衍生软件。
  • 不歧视个人或领域:不得限制任何个人、团体或将软件用于特定领域(如商业用途)。

这些规则通过开源许可证这一法律文件来明确和保障,常见的开源许可证包括对使用者要求较为宽松的MIT许可证Apache许可证,以及要求衍生软件也必须以相同开源条款发布的GPL许可证等。常见的开源软件:

  • 编程语言:Python、Java(Open JDK,不是所有的版本都是开源的)
  • 操作系统:Linux
  • 开发工具:Visual Studio Code、 Git
  • 数据库软件:Mysql
  • 人工智能:Tensorflow、Pytorch

3.1 什么是开源版Coze

  • 因某些业务场景的数据安全要求较高,要求模型、数据不能暴露到公网。因此,私有化部署成为了部分业务场景的刚需。

  • Coze针对私有化部署场景进行了开源,github地址:Coze Studio ,在2025年7月26日正式开源,允许免费商用和本地化部署。‌‌

img

Coze的官方介绍:

  • Coze Studio 是一站式 AI Agent 开发工具。提供各类最新大模型和工具、多种开发模式和框架,从开发到部署,为你提供最便捷的 AI Agent 开发环境。
  • 提供 AI Agent 开发所需的全部核心技术:Prompt、RAG、Plugin、Workflow,使得开发者可以聚焦创造 AI 核心价值。
  • 开箱即用,用最低的成本开发最专业的 AI Agent:Coze Studio 为开发者提供了健全的应用模板和编排框架,你可以基于它们快速构建各种 AI Agent ,将创意变为现实。

功能清单:

功能模块 功能点
模型服务 管理模型列表,可接入OpenAI、火山方舟 等在线或离线模型服务
搭建智能体 * 编排、发布、管理智能体 * 支持配置工作流、知识库等资源
搭建应用 * 创建、发布应用 * 通过工作流搭建业务逻辑
搭建工作流 创建、修改、发布、删除工作流
开发资源 支持创建并管理以下资源: * 插件 * 知识库 * 数据库 * 提示词
API 与 SDK * 创建会话、发起对话等 OpenAPI * 通过 Chat SDK 将智能体或应用集成到自己的应用

3.2 开源版Coze和SaaS版的区别

  • 开源版Coze与SaaS版区别如下:
功能模块 SaaS 企业版 / 云端版 开源版 (Coze Studio)
核心协作功能 支持团队空间、多人协作、权限管理、审批流 仅支持个人空间,缺乏原生的团队协作功能
插件与工具 提供丰富的官方和第三方插件市场,支持图像理解、音视频处理等 仅内置约 19 个官方插件,不支持用户插件市场,部分高级节点(如图像理解)被移除
智能体类型 支持对话型智能体应用型智能体(有UI界面) 主要支持对话型智能体,不支持开发应用型智能体
发布与集成 一键发布至飞书、微信公众号、Discord等多种平台 发布渠道有限,主要支持 Web SDK 和 API 集成
多模态与高级功能 支持语音交互、图像生成等多模态能力 缺少官方支持的语音、图像生成等多模态功能
运维与数据分析 提供完善的运营仪表盘,监控Token消耗、用户互动等 需要自行构建运维监控体系,缺乏开箱即用的数据分析面板

私有化部署使用的话,一般使用Dify,原因有以下几点:

  • dify是一个更早开源的平台,与coze功能类似,且社区成熟、功能对比coze更加强大,已经占据了较大的市场
  • coze对比dify的优势在于丰富的插件库、应用型智能体、以及对于多模态的支持,在开源版这些功能被阉割比较
  • coze是golang开发的,语言对比dify相对小众

因coze开源版在企业中使用较少,且安装和使用需要依赖Docker作为前置知识,因此,coze开源版的部署和使用我们将放在Dify的课程中进行。