作者丨朱家峻
编辑 | 陈彩娴
近日,一款名为 Miraa 的外语学习软件在 App Store 教育类应用排行榜上表现出色。这款由周楷雯(Kevin)创立的应用利用 AI 技术,为用户提供了全新的语言学习体验。
周楷雯目前是一名往返于日本和青岛两地工作的独立开发者,致力于探索语言学习产品的边界。
早在 2018 年,他就开发了第一款日语学习产品"50音起源"。2020 年,他又发布了基于机器学习的日语语法分析应用"捧读"。今年 3月,周楷雯推出了 Miraa这款 AI 双语语言学习产品,Kevin始终致力于将先进的AI技术融入到语言学习的各个环节中。
这款结合了先进AI技术的外语学习软件,运用了“回声学习”理论,让用户在观看影视作品时能够模仿和练习对话,有效提升口语和听力理解能力。
软件的核心功能包括:AI实时翻译媒体字幕,无缝切换回声学习模式和内置的AI智能解析助手,后者提供单词解释、语法解析和知识要点,并支持与AI进行互动对话,以解答学习中的疑惑。这些功能的整合不仅让外语学习更加高效,也使学习过程变得更加有趣,远离了传统学习方法的枯燥。
暂时无法在飞书文档外展示此内容
Kevin 的职业生涯始于传统软件开发,但随着 AI 技术的快速发展,他逐渐意识到 AI Native 开发的巨大潜力。通过将AI技术融入产品设计和开发的底层架构,可以极大提升产品的智能性和个性化服务能力。这一认识推动 Kevin 开始探索AI Native 概念,开发出能够深度利用AI能力、更好地服务用户需求的创新产品。
这种思考的转变,使得他从一个传统开发者成长为一个前沿的 AI Native 开发者,致力于开发能够深度利用 AI 能力,更好地服务用户需求的创新产品。
以 AI 为内核驱动
AI 科技评论:请分享一下你的创业经历。
Kevin :我的创业之路始于2013年,当时我还是一名大学二年级的学生。那段时间,我主要从事社交产品的开发,2015年,我卖掉了我的公司,结束了那段创业生涯,开始作为独立开发者工作。
在成为独立开发者后,我搬到了青岛,逐渐将我的关注点转向了AI技术和语言学习产品的开发。这一转变部分是因为我经常去日本旅游,我发现自己深深被那里丰富的文化和语言所吸引。但市面上的日语学习工具大多不适合像我这样的初学者。这些工具往往假设用户已经有一定的日语基础,这对真正的初学者来说是一个很大的挑战 。
因此,我决定开发一款名为“五十音起源”的产品,专门为日语初学者设计。这款产品的目标是帮助用户从最基本的日语发音和书写开始学习,确保他们不会因为初期的困难而放弃。令人欣喜的是,产品推出的第一天就吸引了超过3000名用户的购买,这让我意识到这个领域确实有很大的潜力。
随后,我开发了第二款产品“捧读”,这是一款更高级的日语学习工具,使用 NLP 和机器学习技术来帮助用户分析和理解日语句子。这款产品旨在帮助用户深入理解日语语法和句结构,从而更有效地提高他们的语言能力。
2023 年初,我有机会去日本工作,并开始与日本人直接交流。这段经历让我意识到,与当地人的直接交流是学习语言中最关键的部分。
所以我决定开发一款能够锻炼听说能力的产品。最初的想法是把会议的内容录下来,然后反复听。为了实现这一点,首先需要有字幕,其次需要有一个类似影子跟读的方法,让用户能够反复练习里面的句子,从而熟悉开会时的发音和内容。
于是,Miraa这款产品就诞生了。不仅要做听力和跟读功能,还要处理不懂的句子。
之后,我们开始把大模型 AI 技术引入产品中。这也是我们逐渐转向 AI 产品的起点,开始思考所谓的 AI native 产品应该是怎样的,以及如何与传统产品区分开来。Miraa 这款产品正是沿着这条路线开发的。
AI 科技评论:你怎么理解AI Navtive?
Kevin :从我的认知角度来看,AI Native有以下几个关键特点:
首先,传统产品需要针对不同领域专门准备数据和算法,横向扩展非常缓慢。而 AI Native 产品利用AI模型即时生成内容,具备极强的扩展能力,可以快速适应各种场景。
其次,AI Native 产品可以根据用户的特点提供个性化服务。比如一款词典应用,它可以给英语学习者和程序员完全不同的解释和例句,做到真正的千人千面,这是传统产品难以企及的。
另外,AI Native 并不是简单地给产品加入 AI 元素,而是从底层架构开始,以 AI 能力为核心重新设计。这是一种革命性的思路,能够突破语言和场景的局限,带来全新的用户体验。
可以说,AI Native 就是以 AI 为内核来驱动整个产品,代表了技术应用的一种创新性演进。就像过去我们围绕计算机硬件来开发产品,现在则是一切围绕AI展开。
但 AI Native 的理念下,对用户也要重新定义。适应了过去产品的"老用户"习惯了原有的交互方式,可能不太接受 AI 的不完美。如果想照顾他们,又想用AI,就容易搞一些四不像的东西。
所以我觉得,AI Native 产品应该果断抛弃旧的交互体验,专注为能接受AI 的"新用户"设计产品形态,去开拓增量市场。随着 AI 模型的不断进化,产品体验会持续变好,即使开发者什么都不做,用户也能享受到红利。
总之,AI Native 是一种全新的开发理念,需要开发者彻底转变思路,发挥 AI 的最大潜力,去设计面向未来的产品。
AI 科技评论:你是如何把这种技术融入到产品开发过程中呢?
Kevin :我在 Miraa 中实现了 AI 实时字幕功能,这一功能使用了语音识别技术,能够即时将视频内容转换为文字,并提供准确的字幕。这对于语言学习者来说极为重要,因为它大大降低了学习的障碍,使用户能够更容易地跟随和理解外语内容。
Miraa 的回声学习模式是基于 AI 的语音分析技术,能够分析用户的发音并给出即时反馈。这种交互式的学习模式不仅增加了学习的趣味性,还通过精确的发音校正帮助用户更有效地掌握语言技能。
它还利用 AI 进行个性化学习路径的设计。通过分析用户的学习进度、偏好和挑战,AI 系统能够定制个性化的学习计划,推荐适合的学习材料和练习,从而使每个用户都能以最适合自己的方式进行学习。
这种深度融合 AI 的策略,使Miraa不仅仅是一个语言学习工具,更是一个智能的学习伙伴。在市场上,这种高度个性化和智能化的学习体验让 Miraa 显著区别于其他传统的语言学习产品,赢得了用户的广泛好评和市场的快速增长。
用户体验是直接标准
AI 科技评论:选择开发语言学习工具的动机是什么?
Kevin :我决定开发语言学习工具的主要动机有两个:个人兴趣和市场需求。
首先,我个人对语言学习有着浓厚的兴趣。我经常去日本,对日本的文化和语言深感兴趣。每次旅行我都试图学习一些基本的日语,这让我意识到学习一门新语言能够极大地丰富个人的世界观和文化理解。
然而,我在尝试学习日语的过程中遇到了不少困难。市面上的大多数语言学习工具都假设用户已经具备一定的语言基础,这对真正的初学者并不友好。这种体验让我意识到,现有的语言学习工具无法满足所有学习者的需求,特别是像我这样的初学者。
市场需求也是我选择开发语言学习工具的一个重要因素。随着全球化的加速,越来越多的人需要学习第二语言来应对工作和生活中的跨文化交流。尽管市场上已有许多语言学习产品,但很多产品依然没有解决用户在实际语言应用中遇到的具体问题,如发音和听力理解等。这些问题的存在表明市场上仍有较大的改进空间和需求。
AI 科技评论:在这当中你是如何验证市场需求的?
Kevin :我采用了一种迭代的方法来分析和验证产品与市场的契合度。这一过程涉及到密集的用户反馈收集和基于反馈的产品调整。首先推出一个基本功能,然后根据用户的实际使用反馈来进行优化和调整。这种方法确保了能够灵活应对市场需求的变化,并持续改进产品。
例如,推出的影子跟读功能,最初是基于内部测试和初步市场研究的反馈。我认为这个功能对于语言学习者来说是有价值的,因此我们决定将其作为一个试验性功能推向市场。一旦功能上线,我们就开始收集用户如何使用这一功能的反馈,包括它在实际学习中的效果和用户的满意度。
在 Miraa 的开发过程中,我们有自己的用户群,也收到很多反馈。这些用户包括国内学生、留学生等。国内学生可能用 Miraa 看动漫生肉,而留学生则用它学习多种语言。
Miraa 支持多种语言,包括英语、德语、意大利语、法语、俄语、中文、日语和韩语。虽然针对性调优主要是英语和日语,但德语和法语等也有不错的效果。
数据显示,英语、日语和德语的用户较多。
AI 科技评论:如何利用用户反馈来调整产品的?
Kevin :我始终认为,真正的用户体验是评估产品性能的最直接标准。
首先,收集用户反馈的渠道非常多样。包括直接的用户访谈、在线反馈表单、社交媒体互动以及通过内测群收集的数据。这些渠道提供了丰富的用户使用场景,帮助我们了解产品在实际使用中的表现和用户的真实需求.
例如,用户在使用 Miraa 进行 K 歌时遇到字幕断句问题,这是我们之前没有预料到的使用场景。用户反馈表明,断句的字幕严重影响了他们的使用体验。基于这种反馈,我们认识到需要改进我的 AI 模型,以确保字幕的连贯性和完整性。
为了解决这个问题,我开发了一个新的大模型,专门针对输出完整字幕进行优化。这个模型通过更精确地处理语言的断句和上下文关系,显著提高了字幕的质量。此外,我还增加了对歌曲字幕的特别优化,确保在播放歌曲时字幕能够完整显示。
此外,我也注意到,尽管我们的主要语言测试是中文、英语和日语,但通过用户反馈,我们发现德语和法语用户群体也表现出了对 Miraa 的高度兴趣。因此,我们加强了对这些语言的支持,优化了相应的语言模型,以满足更广泛用户的需求。
更轻、更专注、更简单
AI 科技评论:面对激烈的市场竞争,你的用户增长的策略是什么?
Kevin :我是将 Miraa 定位为不仅仅是一个语言学习工具,而是一个综合性的内容消费平台。
语言学习工具到底是在做什么?我后面的计划是将它往能真正解决用户如何消费内容的方向发展,而且显得更纯粹。如果只是消费内容,现有的抖音、YouTube 已经可以解决很多,包括很多字幕组的存在。
但如果能把好的内容和语言学习有机结合起来,就会更好玩。大家觉得单纯刷短视频浪费时间,但如果能把用户喜爱的事情转化为学习的动力和素材,那将是一个很好的开始。
后面其实 Miraa 准备有一些比较大的改版,可能会对整个交互做一些设计。最开始的时候并没有把它当成一个 AI native 的产品去思考,一开始更多的是满足我个人的一个需求。现在的话顺着 AI native 的想法,把它完全重塑成一个以 AI 能力为底座的产品,再去做一个新的演进。
AI 科技评论:你是如何评估 PMF?
Kevin :要说契合度的话,现在 Miraa 这款产品其实是远超我前面两款产品的。至少,相较于之前的两款产品,进步更多了。
最主要的原因是因为现在这款产品不局限于日语。我觉得日语还是相对较小的一个市场。Miraa 从日语扩展到了其他一些语种。
另外,Miraa 这款产品完全没有在国内上线,整个宣发都是走的海外,包括所有的服务器和其他资源都在海外。这和我以往的产品有很大的不同。过去的产品 90% 的收入都是由国内市场贡献。而现在的收入已经超过之前,而且全部来自海外。
这给了我一些启发。更轻、更专注、更简单的产品在海外还是挺走得通的。如果要看PMF(产品市场匹配度),我并没有什么很好的数字方法论。我做产品一直以来是兴趣驱动,更多是看我自己觉得好不好,可能这种方式比较偏纯产品的视角。
如果要说某一个指标是我真的用来看的话,通常会看用户的转化率。我的产品下载和付费的转化率通常是超过 10% 的。如果下载量有 10% 的用户能够转化成付费用户,那我觉得其实就是 OK 的。
AI 科技评论:未来 Miraa 的主要发展方向是什么?
Kevin :未来 Miraa 会继续在 AI native 这个方向上深耕。首先是会进一步优化现有的 AI 功能,让它们更加智能和贴近用户需求。其次是用户互动和社区功能的扩展。AI 不仅能帮助用户学习和工作,还可以促进用户之间的交流与合作。
另外,我们还会考虑更多的跨平台支持,不仅限于移动端,还会扩展到桌面和 Web 端,确保用户可以在任何设备上无缝使用Miraa。总的来说,我们希望将 Miraa 打造成一个全方位、多语言、多功能的智能助手,真正帮助用户提高效率和体验。
后面其实 Miraa 准备有一些比较大的改版,可能会对整个交互做一些设计。最开始的时候并没有把它当成一个 AI native 的产品去思考,一开始更多的是满足我个人的一个需求。现在的话顺着 AI native 的想法,把它完全重塑成一个以 AI 能力为底座的产品,再去做一个新的演进。
成为一名独立开发者
AI 科技评论:你对AI 领域独立开发者有什么建议?
Kevin :我觉得,你想要做独立开发者也好,或者说你自己做产品也好,最重要的一点是认知差异。大家之所以有高低之分,通常是因为对所做事情的理解不同。因此,我建议不要去做那些离自己太远的事情,而是围绕自己的需求,或者说你身边的人的需求。
甚至是你老婆、你女朋友的需求去做你的第一款产品。因为在这个过程中,你可能会逐渐体会到为何认知是产品成功的关键。你需要深挖问题的本质,比如你女朋友爱读书,然后你要做一个书摘的产品,那你可能要进一步探究她为什么要摘抄这句话,她到底要做什么,甚至你可能要再挖一层,为什么她要读书。这些思考会对你做产品有很大帮助。所以,不断提升自己对所做事情的认知是关键。
我现在开发的 Miraa,其实对我来说更多是一个探索自己怎么做产品的体验。我更注重认知和思考,与我以前的产品有很大不同。以前的产品如“五十音起源”,是抓住了市场未解决的痛点,而“捧读”则是结合新技术优化某一品类的产品。Miraa 则更注重终局思维,考虑未来产品的形态和长期生存之道。现在我不再急于求成,更关注每一步的基础性工作。
以前创业时,我经历了融资、组建团队、开公司等快速扩张的阶段,但现在我更倾向于确保产品的自我造血能力,验证其价值后再考虑扩展。这样可以更长期地发展,也更轻松。
还有一点就是多和朋友聊天。我有一个例子可以形容这件事,和费曼有些关系。费曼有一个关于火焰产生的演讲视频,讲解了火焰是如何从最小的两个氧原子和一个碳原子的振动开始扩散的。他的原理类似于人的大脑和大模型,如果没有输入,就没有输出。所以当我觉得自己没有想法时,我会通过阅读有趣的书籍来激发灵感。一句话可能会带来很大启发,促使你产生新的想法和变化。
AI 科技评论:如果向我们读者推荐三本书籍的话,会推荐哪些书?
Kevin :我看看我最近在读的几本书,我觉得不错的:
第一个是《费曼经典》。这本书让我学到了如何做实地调查。现代人为了效率习惯直接获取别人给的答案,或者汇总几个答案后形成自己的结论,但真正亲身经历和感受到的东西与他人给的信息可能有巨大的差距。比如我在日本住了一年,和没去过日本的人相比,我对日本的理解是完全不同的。实地调查的重要性在于信息的密度和深度,这种密度很难通过言语传达,因为转述往往会压缩并省略无数细节。
第二本是《这就是ChatGPT》。这本书非常适合当前大模型的趋势,能够很好地帮助大家理解大模型的一些底层逻辑。
第三本是《别想那只大象》。这本书讲的是语言背后的隐喻以及语言对思维框架的影响。比如使用某些词语时,无论你认同与否,这些词语所代表的隐喻已经框定了你所能表达的范围。尤其是一些从国外翻译过来的词,使用的汉字可能让你联想到的东西与其本身代表的意义有很大差距。这种现象其实是一种不易察觉的思想操控。
就这三本吧。
本文作者 zhumaterialism 深耕于AIGC知识领域的应用研究,期待与同行及感兴趣的读者交流思想、分享见解。欢迎添加以便深入探讨,共同推动行业进步。欢迎开发者主动联系提交产品,一起探索AI在各领域的创新应用,携手前行。
雷峰网
雷峰网(公众号:雷峰网)