AI技术FAQ

语音识别用的是OpenAI吗?用的是whisper API吗?

我们使用的是自研的ASR(Automated Speech Recognition),如果您做过对比,准确率是要高于Whisper的。

问答用的是GPT吗?是基于ChatGPT吗?GPT3.5还是GPT4?问答用的模型是自研的吗?

机器人的问答部分目前大多数基于OpenAI的GPT-3.5(ChatGPT),我们有计划在部分高级功能中接入GPT-4。同时,我们自研的LLM(大语言模型)已经处于实验阶段,会在不久的将来推出。

TTS用的是什么模型?MyShell 的 TTS有什么特色?

我们使用的是自研的TTS模型(text-to-speech),目前英文的TTS已经支持快速的声音克隆,仅需1-5分钟的语音样本即可克隆任何人的声音。

MyShell的TTS拥有比市面上其它的产品更接近真人发音的特点,同时有更快的响应速度和更低的计算成本。目前不同情绪的语音技术已经处于实验阶段,会在不久的将来推出。

最后更新于