Erik Torenberg: 这很有趣。Ben Thompson大约十年前写过一篇题为《Snapchat的姜饼屋战略》的博文,核心观点是"Snap能做的任何功能,Facebook都能做得更好,但Snap会持续推出新创意。如果保持这种创新速度,或许能成为其护城河。"他称之为姜饼屋战略。
Bryan Kim: 我认为最终起作用的还是用户触达和网络效应。Snap在这方面也有优势——它占据了Z世代和年轻用户的核心通讯平台地位。
Erik Torenberg: 如何看待新产品网络效应的构建?
Bryan Kim: 目前多数产品仍处于创作工具阶段,尚未形成"创作-消费-网络效应"的闭环。虽然真正的网络效应尚未显现,但我们看到11 Labs这类新型护城河:凭借极快的迭代速度、卓越产品力切入企业市场,深度嵌入工作流程。这种模式正在成型,而传统意义上的网络效应仍有待观察。
Olivia Moore: 11 Labs是个典型案例。前几天我需要为AI生成视频配音,由于他们先发优势明显、模型最优,用户基数大带来数据飞轮,现在已建立声音库——用户上传了大量自定义声线和角色。当我对比多家语音供应商时,若需要特定类型,如老巫师嗓音,11 Labs能提供25种选择,而其他平台可能只有2-3种。 虽然尚处早期,但这种模式类似传统平台网络效应,而非全新形态。
语音AI:企业级AI语音需求爆发Erik Torenberg: 我们很早就关注语音交互,最初构想的哪些部分已实现?未来趋势如何?Anish,你当初为何如此看好语音交互?
Anish Acharya: 最初启发我们的是:语音作为基础媒介贯穿人类互动史,却从未成为技术应用的核心载体。过去技术始终不成熟——从Voice XML到语音应用,再到90年代的Dragon NaturallySpeaking等产品,虽有趣但无法形成技术基座。生成式模型的出现使语音成为原生技术元素,这个关键生活领域仍有巨大探索空间,必将催生大量AI原生应用。
Olivia Moore: 我认为我们最初对语音的兴奋点更多来自消费端视角——比如设想一个全天候在线的口袋教练/心理治疗师/伴侣。这类构想已开始落地,目前已有不少产品实现相关功能。但令我惊讶的是,随着模型进步,企业级应用发展更快:金融机构等高度关键的领域迅速采用语音技术替代或增强人工客服,此前这些企业存在某些合规问题、客户年流失率高达300%且离岸呼叫中心管理十分困难。
真正的突破性消费级语音体验仍在酝酿中。这里已有早期案例,比如用户将ChatGPT高级语音模式拓展到新奇应用方向,或granola这类通过全天候语音数据创造价值的产品。消费市场魅力在于不可预测性——最佳产品往往横空出世,否则早就被开发出来了。未来一年语音消费领域的创新值得期待。
