Yupp 定位为 AI 模型探索和评估平台,允许用户免费体验和比较各种 AI 模型,其核心理念是通过众包的方式进行模型评估:用户提交提示词,对比不同 AI 模型生成的回复,并给出较优答案和给出评定反馈,同时得到可兑现的积分激励。这些选择和反馈会被记录下来,形成用于 AI 模型后期训练和评估的数据。
Yupp 还将利用区块链等开放访问和无需许可的技术、零知识证明和挑战 / 响应机制等密码学原语和协议,以及机密计算等隐私保护技术,构建具有可证明的可信中立性、公平性和稳健性的系统。
Yupp 的运作机制可以概括为以下几点:
1、模型探索和对比:Yupp 汇集了超 500 个 AI 模型,包括 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama 等。用户可以在平台聊天页面找到各种 AI 模型,并进行 Prompt 测试,直观并排比较它们的优劣。
Yupp 当前有聊天页面和排行榜两个页面,其中,聊天页面设计较为简单,有消息框、文件上传功能、模型选择功能(可选)、图片上传功能、聊天私密和公开模式切换(默认私密)。

如下图所示,提问过后,Yupp 会给出两个 AI 的回答版本,然后用户选出较优版本。

值得一提的是,提问时模型默认自动选择,有时还会隐藏掉模型名称以收集更客观的反馈,当然,用户也可以随机提问。此外,Yupp 的 QuickTake AI 功能还可以提供简短总结回复。
2、用户反馈:用户在选出较优答案后,可以进一步通过点击标签反馈答案的优劣偏好,也可以用文字自由阐述。这些反馈将帮助用户定制未来在 Yupp 上的 AI 答案,也让 Yupp 能够免费提供模型。
3、反馈奖励:给出反馈后,用户会得到一个积分刮刮卡。积分可用于提问或兑现。

4、评估:用户通过选择的最佳回复和提供的反馈,参与到模型的评估过程中。Yupp 旨在建立一个公开透明的评估体系,让 AI 开发者可以获取有价值的训练数据,用户可以获得奖励,共同推动 AI 技术的发展。Yupp 平台具有一个名为「Yupp VIBE Score」(VIBE,Vibe Intelligence BEnchmark)的公开排行榜,旨在利用用户反馈来改进模型性能,同时保证用户 Prompt 的私密性,除非用户选择共享。
Yupp 会根据用户反馈以及响应速度等因素制定一个排行榜。排行榜中,可以按过滤器对平台上集成的 AI 模型进行排序,维度包括 VIBE 评分、概率样本的置信区间、投票情况、速度、延迟、输入 / 输出成本。
