Yupp 种子轮揽 3300 万美元，推特前技术骨干重构 AI 模型评估体系(2) / BTC123

Yupp 是什么？如何运作？

Yupp 定位为 AI 模型探索和评估平台，允许用户免费体验和比较各种 AI 模型，其核心理念是通过众包的方式进行模型评估：用户提交提示词，对比不同 AI 模型生成的回复，并给出较优答案和给出评定反馈，同时得到可兑现的积分激励。这些选择和反馈会被记录下来，形成用于 AI 模型后期训练和评估的数据。

Yupp 还将利用区块链等开放访问和无需许可的技术、零知识证明和挑战 / 响应机制等密码学原语和协议，以及机密计算等隐私保护技术，构建具有可证明的可信中立性、公平性和稳健性的系统。

Yupp 的运作机制可以概括为以下几点：

1、模型探索和对比：Yupp 汇集了超 500 个 AI 模型，包括 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama 等。用户可以在平台聊天页面找到各种 AI 模型，并进行 Prompt 测试，直观并排比较它们的优劣。

Yupp 当前有聊天页面和排行榜两个页面，其中，聊天页面设计较为简单，有消息框、文件上传功能、模型选择功能（可选）、图片上传功能、聊天私密和公开模式切换（默认私密）。

如下图所示，提问过后，Yupp 会给出两个 AI 的回答版本，然后用户选出较优版本。

值得一提的是，提问时模型默认自动选择，有时还会隐藏掉模型名称以收集更客观的反馈，当然，用户也可以随机提问。此外，Yupp 的 QuickTake AI 功能还可以提供简短总结回复。

2、用户反馈：用户在选出较优答案后，可以进一步通过点击标签反馈答案的优劣偏好，也可以用文字自由阐述。这些反馈将帮助用户定制未来在 Yupp 上的 AI 答案，也让 Yupp 能够免费提供模型。

3、反馈奖励：给出反馈后，用户会得到一个积分刮刮卡。积分可用于提问或兑现。

4、评估：用户通过选择的最佳回复和提供的反馈，参与到模型的评估过程中。Yupp 旨在建立一个公开透明的评估体系，让 AI 开发者可以获取有价值的训练数据，用户可以获得奖励，共同推动 AI 技术的发展。Yupp 平台具有一个名为「Yupp VIBE Score」（VIBE，Vibe Intelligence BEnchmark）的公开排行榜，旨在利用用户反馈来改进模型性能，同时保证用户 Prompt 的私密性，除非用户选择共享。

Yupp 会根据用户反馈以及响应速度等因素制定一个排行榜。排行榜中，可以按过滤器对平台上集成的 AI 模型进行排序，维度包括 VIBE 评分、概率样本的置信区间、投票情况、速度、延迟、输入 / 输出成本。