早在今年三月份,OpenAI 公布了 API 访问之际,我做了一个简单的套壳聊天小助手,距今已有8个月了。
随着国产模型的不断追赶,以及 ChatGPT 在 DevDay 后接二连三发生服务器宕机事件,我决定将聊天小助手的默认引擎迁移至讯飞星火。
寻找国内的平替,挖掘其潜力。
价格对比。
GPT3.5 价格输入输出不等,取平均约为
0.0015$/千token
,换算为 0.01元/千token
,GPT4.0-Turbo则迎来了一波价格下调,输入输出不等,取平均约为 0.02$/千token
,换算为 0.15元/千token
。GPT4.0-Turbo 可以看作是GPT4.0的蒸馏版本,在略微损失能力的情况下,大幅减少了模型的推理成本。原始的 GPT4.0 版本,取平均约为 0.045$/千token
,换算为 0.33元/千token
。而最近发布的讯飞V2.0,V3.0 ,其价格是
0.03元/千token
,相比其早期 V1.5 版本,价格翻了一倍左右。然而,经过一些实际测试,我发现两者 token 的编码方式不同。ChatGPT 系列由于母语是英文,所以一个中文字符通常需要 ~2 个token来编码。而讯飞因为母语是中文,一个中文字符则只需要 ~1 个 token 来编码(甚至可能会小于1,比如“你好”这种词可能只对应一个token)。故在中文场景,可以把讯飞的 API 价格再除以2.
因此,可以认为目前其API价格接近但略高于 GPT3.5 ,同时是 GPT4.0-Turbo 的十分之一。
用户数目
据 OpenAI 公布的数据,其周活跃用户一亿,有200万的开发者,100万的周活用户,高价值的 Plus 用户600万。面向客户方面,财富500强中有92%是OpenAI 的客户。
而根据讯飞在1024开发者节公布的数据,自发布讯飞星火以来,新增开发者数目 143.4万(其中17.8万的大模型开发者)。面向10万+企业提供支持。
服务集成
在生态建设方面,对比 GPTs 和星火助手,两者的功能重叠度比较高。
OpenAI 发布了 GPTs 允许普通用户创建特定用途的子应用,在其官网上是如此介绍的:
- GPTs允许用户创建特定用途的子应用。
- 任何人都可以轻松地构建自己的GPTs,不需要编码。
- 用户可以为特定目的自定义GPTs,许多高级用户维护一个精心制作的提示和指令集列表,手动将其复制到ChatGPT中。现在这过程被简化了。
- 开发人员可以将GPT连接到现实世界,通过定义自定义操作来使一个或多个API可用于GPT。
- 企业客户可以部署仅限内部的GPTs
这个和讯飞提的星火助手差不多,同样是基于零代码创建智能应用的思路。后者公布是共有1.5万助手开发者创建了共计2.9万款助手应用。

主要设定内容包括基本信息、结构化的指令、以及要参考的知识库文档。
两者很大的不同在于 Actions 这一部分,GPTs 允许其执行一个外部的操作,从而访问自定义函数、或者是修改某些内容,而讯飞则没有提供这个功能。这个框架在学术界并不是新的内容,可以看作是 ReAct(Reason + Act)的一种实现,只是这个功能被集成到产品中了。
基本思路
从服务集成的方式,内窥两者策略的不同。
在讯飞星火模型V2.0发布的时候,有一行小字“服务已内嵌联网搜索、日期查询、天气查询、股票查询、诗词查询、字词理解等功能”,这个功能其实用 ReAct 框架即可实现,如果不嵌入在模型里,也可以通过插件实现。
一种通常的做法是先意图识别,然后再根据识别到的意图,拆解到不同的任务上
而OpenAI则搞了一套更为通用的模式,将这种集成以插件形式提供,而插件主要有用户创建。
打个不一定恰当的比喻,前者是PGC的(服务商包干一切),后者是UGC的(发挥用户创造性)。参考自媒体时代的发展,就能知道两种模式没有必然好坏,要看当时所处的环境阶段,和技术发展的成熟度来定。
效果评测
无论外层的封装多么丰富和吸引人,最终能留下用户的,还是每次交互时智能体所表达出来的智能水平。智能水平是基数,决定下限,而自定义用途、知识库、插件这些都是乘子,决定上限。
在“你问我答”的操作界面中,同时接入了这两个模型。并且拿早期写的几个任务prompt做个对比实验,看下其到底效果如何。
将适用于GPT35的任务上,直接迁移到星火V2.0上结果如下:
任务 | 星火V2.0 | gpt-35-turbo-16k |
猫娘角色扮演 | ✅ | ✅ |
抽认卡制作 | ❌ 无法遵循格式 | ✅ |
逐句翻译英文 | ❌ 无法遵循格式 | ✅ |
英语单词组成文章 | ⚠️ 只完成部分任务 | ✅ |
每天学习新单词 | ✅ | ✅ |
苏格拉底提问 | ⚠️ 偶尔人设紊乱 | ✅ |
英文翻译+摘要总结 | ❌ 无法理解任务 | ✅ |
心理健康顾问 | ✅ | ✅ |
代码助手 | ⚠️ 半斤八两 | ✅ |
标题转emoji | ✅ 需修改prompt | ✅ |
给文章打标签 | ⚠️ 任务理解存疑 | ✅ |