人工智能培训获得报酬?有一种新的加密货币

decrypt.co 2023-09-29 21:45:19

通过将Web3和人工智能相结合,Vivoka正在引入一种新的收集数据的方式来训练我们的机器人霸主。

在William Simonin和Vivoka的语音识别敏锐性的领导下,该公司刚刚推出了其新项目“Ta Da”的私人测试版,这是一个关于单词数据的游戏。

预计下个季度将进行公测。

Simonin告诉_Decrypt_:“通过‘Ta da’,我们设想了一个平台,在这个平台上,不同的人工智能公司可以超越语音识别,征用数据,在不影响质量的情况下确保可负担性。”。

Ta Da利用区块链技术,旨在鼓励世界各地的用户通过完成各种任务来共享他们将创建的数据,如读句子、写文本或识别对象。

“就像我们在面对面交谈”:扎克伯格的元宇宙正在复活

收集到的数据,包括录音、图像、视频和文本,将可供企业访问,用于人工智能模型培训。

然后,用户将因其贡献而获得TADA代币奖励。

该平台在MultiversX区块链上开发,旨在解决使用数据训练人工智能模型的公司面临的关键挑战,特别是高成本和数据质量不一致的挑战。

“我们认为区块链提供商是关键的技术盟友,”Simonin告诉_Decrypt_。“与MultiversX的合作感觉比作为替代平台上无数项目中的一个更亲密、更优先。”

Ta Da的模式还通过仅依赖志愿者生成的数据来优先考虑用户隐私,这与Meta和亚马逊等公司的做法形成了鲜明对比。

Meta Platforms利用Facebook和Instagram的公开帖子来培训其Meta AI虚拟助理,而亚马逊则利用实际用户对话来完善Alexa的AI模型。

TA-DA-AI瞄准多样化的音频数据

鉴于对语音识别的关注,达的主要目的之一是收集各种语言的语音记录,所有这些都是为了微调人工智能语音识别系统。

在Vivoka,William Simonin花了数年时间打造了一个支持42种语言的技术解决方案,并为语音开发套件量身定制,使机器人和物流等不同行业的企业能够将其嵌入任何语音接口中。

该公司目前与大约100家全球客户合作,其技术已嵌入全球100000多台设备中。

正是通过这项广泛的工作,他发现了新生的语音数据收集行业面临的挑战。

精细化所需的巨大数据量可能非常昂贵。1000小时音频的价格标签可能高达10万美元。专注于人工智能的公司每年仅为这类数据分配10万至100万美元的预算是很常见的。

超越ChatGPT:NExT GPT是一个开源模型,可以让你掌握音频、视频和文本的人工智能

此外,人们经常对数据的真实性和质量表示担忧。Simonin指出:“只有大约5-10%的数据集经过严格的检查。”他提请人们注意数据质量较差和对真正贡献者的补偿不足等挑战。

确保多样化和扩展的音频数据集仍然是一个挑战,尤其是在寻求理解复杂语言时。Simonin解释道:“仅根据男性声音训练的人工智能在特定输入下可能会表现异常。然而,当女性与之互动时,其准确性可能会下降。”。

因此,Ta Da将为稀有声音提供更高的奖励。

Simonin告诉_Decrypt_:“你可以完成各种任务,每项任务都提供不同的报酬。例如,如果你说一种带有特定口音的特定语言,Ta Da可能会为独特的要求支付更多的费用,比如会说带有英语口音的科西嘉语的人。”

本文来源于 decrypt.co

免责声明:
1. 本文版权归属原作所有,仅代表作者本人观点,不代表币推儿的观点或立场。
2. 如发现文章、图片等侵权行为,侵权责任将由作者本人承担。