AI技术FAQ
语音识别用的是OpenAI吗?用的是whisper API吗?
我们使用的是自研的ASR(Automated Speech Recognition),如果您做过对比,准确率是要高于Whisper的。
问答用的是GPT吗?是基于ChatGPT吗?GPT3.5还是GPT4?问答用的模型是自研的吗?
机器人的问答部分目前大多数基于OpenAI的GPT-3.5(ChatGPT),我们有计划在部分高级功能中接入GPT-4。同时,我们自研的LLM(大语言模型)已经处于实验阶段,会在不久的将来推出。
TTS用的是什么模型?MyShell 的 TTS有什么特色?
我们使用的是自研的TTS模型(text-to-speech),目前英文的TTS已经支持快速的声音克隆,仅需1-5分钟的语音样本即可克隆任何人的声音。
MyShell的TTS拥有比市面上其它的产品更接近真人发音的特点,同时有更快的响应速度和更低的计算成本。目前不同情绪的语音技术已经处于实验阶段,会在不久的将来推出。
最后更新于