声明:本文来自于微信公众号 白鲸出海,作者:张凯然,授权Soraor转载发布。
对话嘉宾:Hika AI 核心创始人浪仔,豁如
对话背景:AI 搜索赛道中,Perplexity.ai11月的网站访问量短暂超过了1亿,目前仍有9000万+,Google、微软等传统搜索引擎巨头也开始在自己的产品中融入 AI 功能。而除此之外,很多中小开发者都面向垂类场景,或者基于差异化来开发搜索引擎。本次与 AI 搜索引擎 Hika AI 的开发者进行交流,我们希望探究中小开发者开发搜索引擎的动机、对用户需求的观察与差异化的理解,以及对成本和商业化的思考。
2023年,浪仔在一个创业者知识分享群里认识了豁如,拥有相似教育背景和大厂工作经历的两人,顺理成章地成了朋友,作为两个 AI 产品的发烧友,又在做事方法和认知上有些共识,两人决定在AI赛道开始创业。
2024年初,豁如又拉来其他志同道合的朋友,组成了一个5人小团队,浪仔来负责产品设计,豁如及其他成员主攻技术,ALL IN AI 创业。11月下旬,经过接近一年的开发与产品打磨,他们的AI搜索产品 Hika 开始测试,12月底正式公开上线。(网址:hika.fyi)
赛道很单一,AI 搜索产品
都是“换壳版 Perplexity”
白鲸出海:两位创始人都是 AI 产品的深度用户,也深度使用了多款产品,决定创业时,团队为什么会将主攻方向确定为 AI 搜索引擎呢?
浪仔:首先 AI 搜索的讨论度在行业内一直很高,是一条很热门的赛道,而且 AI 搜索也是我最常用的 AI 产品,我对这个产品类型的理解也更为深刻。与传统搜索相比,AI 搜索能给用户带来更大的体验差异,或者说升级。
但是,我认为目前市面上的 AI 搜索产品的形式都比较单一,整体来讲,所有 AI 搜索产品都是“换壳版 Perplexity”,我觉得我们能做出不一样的东西,所以就选了 AI 搜索这个方向。
白鲸出海:作为 AI 搜索领域的“龙头”,Perplexity 单月访问量已经上亿,今年内就融资4轮,估值已经超过了90亿美元,它算是定义了 AI 搜索的产品形态。那么,您认为目前 AI 搜索的产品,还能再去改进或者说差异化的是哪里?
浪仔:就我的理解,问题有三个,大模型没那么聪明、搜索图片体验不好、用户对感兴趣的内容无法深入。
大模型的不聪明体现在两点,一是目前AI搜索的准确率不是那么高,出现幻觉问题的频次依然较高,大模型对正确信息的筛选能力还有待升级。二是大模型无法给出符合用户需求的个性化答案,就拿旅游举例,同样都是搜索美食,有人喜欢重口味一些,有人喜欢清淡一些,但 AI 搜索给出的推荐却一个样。
图片与链接方面,这是很多 AI 搜索都会有的模块。传统引擎对图片模态有着较强的数据和技术积淀,我在 Google 搜索,它能给到我成百上千的图片供我选择。但在 AI 搜索引擎中,虽然大模型可以通过理解问题去配图,但是呈现的图片数量不仅少,大多数情况下也与回答文不对题,失去辅助理解的意义。
第三是用户对感兴趣的部分无法深入。这个问题我是基于自身的体验发现的,在搜索时,我除了想得到单个问题的答案,我还希望了解事情的其他方面,以求更全面的了解。但是 Perplexity 等产品,只会给我一个相对简洁的“答案”,我很难去围绕这个主题去了解与之相关的更多信息,我们称之为“问题域”。虽然 Perplexity 在产品设计上也加入了“延伸问题”的功能,但在我看来仍然是不够的。
Perplexity 给出的内容是
相对简洁的|图片来源:Perplexity
人们在面对一个新事物时,都是从不同方面去了解事物,然后再组合成对事物的全面认知,而 Perplexity 却只给一个答案,缺乏引导用户思考的过程。
豁如:我补充一下,一是 AI 搜索产品只能给出比较常规的答案,并没有很强的独特性,给出的图片也基本上是搜什么内容就配什么图片,比如搜苹果手机,就给一张苹果手机的图片,并不能帮助用户理解。另外,所有 AI 搜索产品界面都很繁复,页面上堆满了文字、引用链接、图片、追问问题等等,看到这样的界面,我的使用意愿也大大降低了。
AI 搜索不是搜索?
白鲸出海:基于您之前说到的,Perplexity 在准确率、独特性、个性化等等问题,Hika 怎么去优化的?Hika 与 Perplexity 的核心差异点在哪里呢?
浪仔:如果说 Perplexity 给出的是定制化的套餐,那么 Hika 给出的内容就是自助餐。对于我们来说,模型层面的优化我们做不了,也不是我们所擅长的东西,取而代之,我们在产品设计上下了不少功夫。
用户可以通过“再多讲讲”和“再多问问”
让 AI 自行补充内容或进行追问
Hika 首先会针对这个问题的几个方面,给出一些相对简洁的答案,供用户“速览”,帮用户找到“关键词”。然后,用户在找到自己感兴趣的关键词后,再点击“深入这段”,让 AI 自行扩展信息,或由用户主导进行追问。进一步交互的同时,用户也把自己的意图反馈给了 Hika,用户也进一步接近了真相。
再辅以我们给到的逻辑图和表格,用户还可以捕捉到各个概念间的关系,基于此用户可以继续和 Hika 交互,“无限接近”答案。
Hika 所谓的准确,不是绝对意义的准确,而是提供用户需要的答案,我们不只是一个搜索产品,更是一个帮助用户思考的“思维产品”。
白鲸出海:这么听下来,Hika 主要的差异就在于通过点选交互和多轮追问,来帮助用户用户获得所需要的答案。从我们的观察来看,大多数一般用户进行搜索的目的,只是单纯地想要一个简洁的答案。那么 Hika 定位的人群会比其他的 AI 搜索产品小一些吗?
浪仔:首先,无论是过去还是现在,人们对知识/信息的渴求从来没有变过,我觉得这种需求像吃饭睡觉一样自然。虽然大多数用户一般情况下都只需要一个简单答案,但是,每个用户在学习和工作中,总会面对相对复杂的问题,会有需要了解多元信息的情况。虽然目前,Hika 的产品形态可能指向的方向相对小众,但我不觉得我们做的是一件小众的事情。
另一个方面来说,其实现在AI 搜索并不是真的在搜索,更像是在问答。如果说仅是搜索行为的话,谷歌这样的传统搜索引擎已经可以满足需求了,但是目前的 AI 搜索产品,在搜索信息之外又延伸了总结、追问等等环节,AI 搜索只是将之前产品做不到的事情做到了,并以搜索的形式进行了呈现。如果从这个层面上说,Hika 谈不上“小众”。
白鲸出海:对于很多 AI 搜索产品来说,准确率都是一个很大的问题,而且 Hik a的定位可能还比其他 AI 搜索产品更深度一些。那么“大模型+公开信息”的组合能否满足需求?在准确性方面,Hika 做了哪些技术层面的优化呢?
浪仔:Hika 的设计思路是找到一个适合 AI 改造同时又兼具普适性的问题场景,这类问题不是一句话就可以解决的简单问题,也不是需要引用大量专业论文的深度难题,而是介于两者之间,相对复杂、又比较高频(工作,学习,爱好等等)的问题,这类问题靠公开信息是可以解答的。而大模型主要负责呈现有逻辑的答案,但是如何给大模型更多的角度,让它的答案更符合用户需求,这其实又回到了上面说的产品设计层面。
豁如:大模型的幻觉是目前做 AI 搜索必然会遇到的问题,所以我们只能尽量规避这个问题。总的思路是,尽量给 AI 提供高质量的信息源。目前,我们会给不同的信源(网站)进行可信度的评分,减少可信度低的网站的搜索权重。
此外,Hika 内部也讨论过很多方案,比如针对每个答案块加入一个“反思”过程,Hika 会再调用一次 AI 搜索,来验证之前呈现的答案,然后将验证的结果以“置信度”的形式呈现在旁边,告诉用户这段内容在多大程度上是可信的。但是这个功能目前只是设想,还在讨论当中。
白鲸出海:我们感觉,目前愿意使用 Hika 都是好奇心比较强,对信息准确度要求比较高的用户,Hika 的用户对错误信息是不是比一般用户更难接受一些?引入核查机制会不会付出很高的人力成本?
豁如:目前来看的话,比较准确的信源基本都能靠人力列举出来,比如维基百科、主流新闻网站等等,再加上有大模型的帮助,我们是可以比较高效地去标注信源的,不会消耗很多时间。
浪仔:无论哪类用户,只要感知到了错误的出现,都会有不好的体验。传统搜索引擎其实不存在这个问题,因为它只管提供信息,用户承担辨析信息的任务。但 AI 搜索做了总结和分析这一步,就需要对信息准确度负责,这是 AI 搜索行业共通的问题。
要彻底解决准确度问题,要等到大模型技术的进一步发展,但就现实而言,我觉得可以让用户也参与进来,比如加入一些给输出内容打分的功能和上面提到的“置信度”功能,可以更好地帮助用户使用 AI 搜索。
白鲸出海:这样理解下来,我们通过交互去部分解决准确的问题,以及帮助用户更深入去理解一个事物,之前提到的图片搜索和个性化内容,我们有什么解决方案吗?
浪仔:图片是信息的一种形式,我们可能会考虑将其作为输入模态来加入 Hika 中,用户可以通过上传图片来与 Hika 互动;而个性化内容的基础,则是对用户的行为进行更深度地洞察与分析,这一部分,Hika 团队仍在还在学习当中。
白鲸出海:目前 Hika 已经开放测试了,几个内测群也都爆满,目前的用户反馈如何?未来有什么产品迭代的计划或者方向?
浪仔:大家对于 Hika 的接受程度其实超过我们的预期,有的用户认为能够通过Hika看到一个答案或者一个问题的整体脉络,而且能够获得一些启发和灵感。我们未来会增强 Hika 的信息丰富度和层次性,让用户在 Hika 中获得更多信息,并让 AI 能够更智能地给出符合用户需求的内容。
中小开发者能不能“碰瓷”AI 搜索引擎?
白鲸出海:搜索引擎本身是 “大流量且头部效应明显”的赛道,在海外,Google 占了90% 以上的市场份额,在国内,百度也有70%+的市场份额,对于中小开发者来说,你们希望在这条赛道上找到哪些机会?
浪仔:我认为 AI 时代才刚刚开始,模型能力也没到很完善的地步,目前尚未出现一个已经获胜的 Killer App,一切都还存在变数,这是行业发展层面的机会。
而在产品层面,AI 搜索产品目前还是一个相对新鲜的赛道,目前的产品设计也相对单一,但是单一并不代表着它的产品设计就是正确的。对于 Hika 而言,我认为与用户交互是 Hika 的一个特色,而伴随后续模型能力的提升,这种交互方式也会发生变化,很有可能大大提升用户体验,并短时间内快速扩大用户规模。
但另一方面,要在 AI 搜索赛道站稳脚跟,难度确实也相当大。因为所有的产品基本都使用的是相同的底层大模型,不同产品的差异点就体现在前端的呈现,但产品设计是没有正确答案的,谁也不知道哪种设计是最符合用户需求的。这对我们是挑战,但也是机遇。
白鲸出海:目前 Hika 的成本情况如何?未来有什么商业化计划吗?
豁如:成本方面的话,基本上是可控的。最主要成本的就是调用模型和搜索引擎的API的费用,我们目前申请了微软的创业者计划,可以为我们负担一部分成本,而未来我们会积极地寻找一些大模型厂商进行合作,尽量让成本处于可控的状态。
浪仔:商业化路径的话,我的设想基本上是两个方向。一是搜索引擎的传统商业化模式——广告变现,但相比传统广告纯粹宣发的作用,我们可以通过设计一些推荐机制,为用户提供更有价值的信息,也帮广告主更精准地触达合适的用户。未来流量起来之后,这是一个可行的方案。
另一个方向其实就是在流量起来之后,用户本身也会出现分层的情况,对于不同的用户,我们可以提供不同的功能,来进行变现。比如有用户用 Hika 来做深度研究或者写论文,我们就可以给这个用户配最好的模型,提供更高质量的信息,并向用户收费。
但我们的产品仍处于早期阶段,这些商业化路径还处于构想的阶段。
写在最后
目前的 AI 搜索引擎市场,我们曾经在《半年融资12.8亿美金,以为没什么机会的赛道,疯狂融资》选题中进行过观察,2024年上半年,全球各大搜索引擎总共融资12.8亿美金,但面向大众的通用搜索引擎的融资还不到1亿美金(算上 Perplexity),搜索引擎的机会主要在垂类场景和 ToB,而下半年搜索引擎赛道的融资新闻中,通用搜索引擎的占比依然不那么高。
就通用搜索引擎赛道看,“玩家”大概有几类,一是 Google、微软等传统搜引擎玩家,二是像国内的秘塔,国外的 Perplexity 这样的少数明星创企,而中小开发者做通用搜索引擎,看似是最没有机会的一种组合。
但是从浪仔和豁如两位创始人的讲述来看,目前 Perplexity 仍存在不少问题,产品模式也并没有定型,这个不确定性就是包括中小开发者在内,所有“玩家们”的机会,但怎么切入、又怎么将搜索引擎做成一个大众产品,依然充满挑战。
欢迎更多的创业者与我们分享你的创业故事。