好久没有想过能和国外模型零延迟实时语音通话了 哈基米的这个Real time模型用来做语音识别模型的效果如何呢?

是的,如标题所说,我只在乎这一个事… 能做到零延迟回复的模型能力应该不咋样 不太抱希望,日常还是老老实实,多文件用豆包,单文件用千问 事实上,从上面的思维结果以及回答结果中可以看到两个问题 识别就不太行,他把漏掉了前几个字这句话割裂了 怀疑根本没参考上下文 他的回答也像是知道,又像是不知道所说的前几...
好久没有想过能和国外模型零延迟实时语音通话了 哈基米的这个Real time模型用来做语音识别模型的效果如何呢?
好久没有想过能和国外模型零延迟实时语音通话了 哈基米的这个Real time模型用来做语音识别模型的效果如何呢?

Screenshot20260531141918

是的,如标题所说,我只在乎这一个事…
能做到零延迟回复的模型能力应该不咋样 :melting_face:
不太抱希望,日常还是老老实实,多文件用豆包,单文件用千问
事实上,从上面的思维结果以及回答结果中可以看到两个问题

  • 识别就不太行,他把漏掉了前几个字这句话割裂了 怀疑根本没参考上下文
  • 他的回答也像是知道,又像是不知道所说的前几个字究竟是什么,明明他的回答可以看出来他是有相关知识的

小提示,在gas中的实时对话不会被保存

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文