我们使用的是自研的ASR(Automated Speech Recognition),如果您做过对比,准确率是要高于Whisper的。
机器人的问答部分目前大多数基于OpenAI的GPT-3.5(ChatGPT),我们有计划在部分高级功能中接入GPT-4。同时,我们自研的LLM(大语言模型)已经处于实验阶段,会在不久的将来推出。
我们使用的是自研的TTS模型(text-to-speech),目前英文的TTS已经支持快速的声音克隆,仅需1-5分钟的语音样本即可克隆任何人的声音。
MyShell的TTS拥有比市面上其它的产品更接近真人发音的特点,同时有更快的响应速度和更低的计算成本。目前不同情绪的语音技术已经处于实验阶段,会在不久的将来推出。
最后更新于2年前