潇大

Nov 12, 2023

“你问我答”使用讯飞作为默认引擎

早在今年三月份,OpenAI 公布了 API 访问之际,我做了一个简单的套壳聊天小助手,距今已有8个月了。
随着国产模型的不断追赶,以及 ChatGPT 在 DevDay 后接二连三发生服务器宕机事件,我决定将聊天小助手的默认引擎迁移至讯飞星火。
寻找国内的平替,挖掘其潜力。
 

价格对比。

GPT3.5 价格输入输出不等,取平均约为 0.0015$/千token,换算为 0.01元/千token,GPT4.0-Turbo则迎来了一波价格下调,输入输出不等,取平均约为 0.02$/千token,换算为 0.15元/千token。GPT4.0-Turbo 可以看作是GPT4.0的蒸馏版本,在略微损失能力的情况下,大幅减少了模型的推理成本。原始的 GPT4.0 版本,取平均约为 0.045$/千token,换算为 0.33元/千token
 
而最近发布的讯飞V2.0,V3.0 ,其价格是 0.03元/千token,相比其早期 V1.5 版本,价格翻了一倍左右。
 
然而,经过一些实际测试,我发现两者 token 的编码方式不同。ChatGPT 系列由于母语是英文,所以一个中文字符通常需要 ~2 个token来编码。而讯飞因为母语是中文,一个中文字符则只需要 ~1 个 token 来编码(甚至可能会小于1,比如“你好”这种词可能只对应一个token)。故在中文场景,可以把讯飞的 API 价格再除以2.
 
因此,可以认为目前其API价格接近但略高于 GPT3.5 ,同时是 GPT4.0-Turbo 的十分之一。
 

用户数目

据 OpenAI 公布的数据,其周活跃用户一亿,有200万的开发者,100万的周活用户,高价值的 Plus 用户600万。面向客户方面,财富500强中有92%是OpenAI 的客户。
而根据讯飞在1024开发者节公布的数据,自发布讯飞星火以来,新增开发者数目 143.4万(其中17.8万的大模型开发者)。面向10万+企业提供支持。
 

服务集成

在生态建设方面,对比 GPTs 和星火助手,两者的功能重叠度比较高。
OpenAI 发布了 GPTs 允许普通用户创建特定用途的子应用,在其官网上是如此介绍的:
  1. GPTs允许用户创建特定用途的子应用。
  1. 任何人都可以轻松地构建自己的GPTs,不需要编码。
  1. 用户可以为特定目的自定义GPTs,许多高级用户维护一个精心制作的提示和指令集列表,手动将其复制到ChatGPT中。现在这过程被简化了。
  1. 开发人员可以将GPT连接到现实世界,通过定义自定义操作来使一个或多个API可用于GPT。
  1. 企业客户可以部署仅限内部的GPTs
 
这个和讯飞提的星火助手差不多,同样是基于零代码创建智能应用的思路。后者公布是共有1.5万助手开发者创建了共计2.9万款助手应用。
 
notion image
主要设定内容包括基本信息、结构化的指令、以及要参考的知识库文档。
两者很大的不同在于 Actions 这一部分,GPTs 允许其执行一个外部的操作,从而访问自定义函数、或者是修改某些内容,而讯飞则没有提供这个功能。这个框架在学术界并不是新的内容,可以看作是 ReAct(Reason + Act)的一种实现,只是这个功能被集成到产品中了。
 

基本思路

从服务集成的方式,内窥两者策略的不同。
在讯飞星火模型V2.0发布的时候,有一行小字“服务已内嵌联网搜索、日期查询、天气查询、股票查询、诗词查询、字词理解等功能”,这个功能其实用 ReAct 框架即可实现,如果不嵌入在模型里,也可以通过插件实现。
一种通常的做法是先意图识别,然后再根据识别到的意图,拆解到不同的任务上
而OpenAI则搞了一套更为通用的模式,将这种集成以插件形式提供,而插件主要有用户创建。
打个不一定恰当的比喻,前者是PGC的(服务商包干一切),后者是UGC的(发挥用户创造性)。参考自媒体时代的发展,就能知道两种模式没有必然好坏,要看当时所处的环境阶段,和技术发展的成熟度来定。
 

效果评测

无论外层的封装多么丰富和吸引人,最终能留下用户的,还是每次交互时智能体所表达出来的智能水平。智能水平是基数,决定下限,而自定义用途、知识库、插件这些都是乘子,决定上限。
 
在“你问我答”的操作界面中,同时接入了这两个模型。并且拿早期写的几个任务prompt做个对比实验,看下其到底效果如何。
 
将适用于GPT35的任务上,直接迁移到星火V2.0上结果如下:
任务
星火V2.0
gpt-35-turbo-16k
猫娘角色扮演
抽认卡制作
❌ 无法遵循格式
逐句翻译英文
❌ 无法遵循格式
英语单词组成文章
⚠️ 只完成部分任务
每天学习新单词
苏格拉底提问
⚠️ 偶尔人设紊乱
英文翻译+摘要总结
❌ 无法理解任务
心理健康顾问
代码助手
⚠️ 半斤八两
标题转emoji
✅ 需修改prompt
给文章打标签
⚠️ 任务理解存疑
 
 
 
 
 
 
 
 
 
 

Copyright © 2025 潇大

logo