Mozilla的“通用语音”-众包数据库,可改善语音识别


我对苏格兰人的口音深表赞赏,但谈到Siri和Alexa等语音应用程序时,我的声音是一种责任,而不是一种资产。当苹果和亚马逊成为语音助手时,他们似乎没有苏格兰口音顾问在快速拨号上。

如果语音识别应该成为未来的方式–据说那是我们注定要去的地方–然后搜索引擎和语音助手需要开始更好地理解困难的口音。

<图class =“ lazy aligncenter”>

Mozilla(Firefox浏览器的制造商)正在尝试通过要求人们自愿将声音发送到名为“ 共同的声音 ”的数据库来尝试解决该问题。通过匹配语音以设置短语,Mozilla希望它们的数据库最终将成为将来取决于语音识别的任何应用程序的宝贵工具。

注册“通用语音”

在我们进一步研究之前,让我们先解决隐私问题,因为我已经听到它们的到来。

虽然可以使用Firefox帐户,Github帐户或Google帐户进行注册,但可以通过电子邮件进行注册。只需打开一个匿名的一次性电子邮件帐户,您的发言便再无人问津。

建立帐户并登录后,您将查看您的仪表板

<图class =“ lazy aligncenter”>

有两个部分– 部分是要求您发表自己的声音的地方。 收听是您聆听其他人的声音并将其与他们必须说的短语进行比较的地方。然后,您会指出它是否正确。

讲话

要参加“讲话”部分,您将需要一个功能正常的麦克风,以清晰地拾取您的声音。您还需要授予Mozilla网站对该麦克风的访问权限。

当您点击说出话部分时,系统会为您提供五个随机词组的集合。这些说明在屏幕上非常清晰并且易于遵循。

<图class =“ lazy aligncenter”>

您只需单击下面的麦克风图标,然后以正常的语气阅读句子。不要摆出不自然的口音或说得慢一点。

整个练习的重点是数据库学会了理解人们通常说的口音。用另一种方式说话只会使整个事情变得毫无意义。

完成第一个短语后,您将在右上角看到用于播放剪辑并重新录制剪辑的选项,如果你对此不满意。

<图class =“ lazy aligncenter”>

如果您对此感到满意,它就会移动到下一个,并继续到完成所有五个短语为止。然后单击蓝色的Submit按钮,将您的剪辑发送到Mozilla以进行检查。

如果您现在返回到您的仪表板 ,您会发现您已将这些短语归功于您。

然后是简单的冲洗和重复操作。 Mozilla在数据库中获得的贡献越多,口音越不同,该项目就会越成功。

收听

一旦人们向Mozilla提交了短语,就需要检查他们确保语音剪辑与短语匹配。

返回在仪表板上 ,您将在右侧看到部分。您可以从杰出贡献者部分看到一些重要的统计数据。

要开始验证语音短语,请转到  部分 ,您将得到一个短语和一个播放按钮。

单击“播放”按钮(确保扬声器已打开!),您将听到录制的声音。如果您认为该词组的发音正确,请点击。如果出现发音错误,其他提示或其他错误,请单击

结论

这只是Mozilla目前正在进行的众多项目之一(转到Mozilla主要网站 ,然后单击顶部的项目-它一直在变化)。众包是进行有价值的项目的好方法,总是值得您花时间来帮助构建对将来有用的东西。

相关文章:


5.08.2019