教育创公司 | 覆盖近万所学校,中文分级阅读平台「考拉阅读」看好的不只是语文赛道

“阅读是人类获取知识的核心技能,考拉阅读希望做的是通过中文分级阅读机制提高学生知识交付的效率,现阶段我们专注的是语文市场,但未来这个赛道可以想象的空间也绝不会是这单一学科这样简单。”

作者 | 邵毛毛

这是「新商业情报NBT」报道的第426家创业公司

“其实整个教育行业最难解决的是师资问题。”考拉阅读创始人&CEO赵梓淳说。

在他看来,一代教育科技产品的重点是采用线上方式、打破地域局限,让学生可以接触到优质师资。二代教育科技的重点则是在此基础上采用‘AI+教育’等方式,成为教师教学的辅助工具、提高学生的知识交付效率,分级阅读平台“考拉阅读”被他归入了后者。

成立于2016年,考拉阅读通过自研发ER Framework中文分级阅读系统,试图量化中文文本阅读难度和学生的阅读能力、使两者进行高效匹配,以提供个性化阅读和学习解决方案。

这套分级阅读系统的落地应用产品为考拉阅读App,分为学生端、教师端、家长端和管理端。赵梓淳透露,从今年年初正式推广产品至今,已进入近万所学校,全矩阵产品用户总量达300万,日活用户近百万,日留存和月留存超过70%。

“阅读是人类获取知识的核心技能,考拉阅读希望做的是通过中文分级阅读机制提高学生知识交付的效率,现阶段我们专注的是语文市场,但未来这个赛道可以想象的空间也绝不会是这单一学科这样简单。”赵梓淳告诉《新商业情报NBT》(微信公众号ID:newbusinesstrend)。

技术和数据驱动

赵梓淳坚信技术和数据是驱动教育变革的力量。“当基础教育逐渐普及,下一阶段要实现的个性化教育就是建立在大量数据收集和信息化的基础上。”

这种坚持或许与赵梓淳的背景有关,他曾就读于美国芝加哥大学金融数学专业和哥伦比亚大学运筹学专业,“都是和数据、信息量化有关的专业。”在他看来,对于教育而言,分级阅读制度无疑提供了一套落实“因材施教”的量化工具和技术优化的方向。

欧美市场验证了分级阅读制度的意义和价值。公开数据显示,蓝思分级、GE分级等英文阅读分级标准已被推行40余年,并进入了学校等主流教育场景,大量提供有关英文分级阅读技术、内容等服务的公司也在快速崛起。

在国内,新东方、好未来等公司也已引入英语分级阅读系统,进行教学辅助,另有创业公司正在挖掘英语分级阅读市场。而在这已然厮杀惨烈的英语赛道之外,因高考政策调整而备受关注的大语文教育正显示出巨大的市场空间。

赵梓淳意识到,建立中文分级阅读机制,以提供中文基础认知服务切入语文赛道是个可行的方向,“国内也没有人做这个事情”。正因为如此,无中文同类参照物的他面临一个问题——中文和英文在基础单元、分词、句式结构等方面巨大的差异,英文分级阅读体系直接适用于中文语言环境必将“水土不服”。

以语言的基础单元层面为例,赵梓淳告诉《新商业情报NBT》(微信公众号ID:newbusinesstrend),英文由26个字母组成,中文的常用汉字则为3500个,这决定了中文分级阅读系统需要更加庞大的分析语料库。

这样的差异要求中文分级阅读制度必须建立在适应中文语言的底层技术之上,因此,在2016年成立考拉阅读之后,赵梓淳快速搭建了由北京大学数据挖掘方向博士、北大应用语言学博士以及深度学习方向研究者组建的研发团队。

文本和阅读能力的匹配

赵梓淳和团队将考拉阅读自研发的中文分级阅读系统称为ER Framework,整套算法需要评估两个维度的内容。

一方面是中文文本的难度等级分析。不同于英文分级阅读主要通过语义(如单词出现的频率)和句法(如句子长短)分析文本难易程度,语法松散且更具复杂性的中文需要引入维度更多元、颗粒度更细的判断标准。

考拉阅读从字、词、句、段、篇5个层面对中文进行拆解分析,例如在段的层面包括分析句间关系、指代信息、结构逻辑等。为保证足够体量的样本训练算法模型,团队处理了1300万字的非平衡语料库和2亿字的平衡语料库。

赵梓淳解释道,前者意指比较垂直某一品类的文本;后者则是学生日常生活中真实能接触到的文本,内容按照一定的比例进行搭配。

另一方面是学生阅读能力的判定。分级阅读的主体是学生,内容需要根据当前水平的高低匹配给个体,因此,考拉阅读需要从整体感知、获取信息、形成解释、做出评价、实际应用5个方面对学生的阅读能力做出评价。

为获取真实的样本数据,考拉阅读开始在全国一线至四线城市采集K12阶段学生阅读数据。赵梓淳说,“我们是真的进入到了学校里,随机抽样选择学校,测试时会有团队的心理测量学专员在现场监督孩子答题,因为存在有些孩子答题不认真的情况,需要及时纠正然后排除无效数据。”

这些学校大部分是小学。在赵梓淳看来,分级阅读测试的是纯粹的文本难度,所解决的问题更适用于小学和学龄前阶段,“一旦进入高中时期,学生读不懂一段文字,很多时候不是因为看不懂文字,而是不理解文字深层次含义,比如例如鲁迅文章《秋夜》中的‘在我的后园,可以看见墙外有两株树,一株是枣树,还有一株也是枣树’,像这样涉及知识结构性的问题,并不在分级阅读文本难度的测试范围。”

因此,考拉阅读将用户年龄层的扩充方向暂时设置为“高中阶段以前”。现阶段主要目标群人定为小学1~6年级学生,“之后会推进学龄前和初中阶段”,通过在全国范围开展学生阅读能力评估,现阶段考拉阅读已积累70万样本数据。

借鉴英文分级阅读中的蓝思分级标准,考虑阅读的ER Framework中文分级阅读系统采用ER值衡量文本难度和阅读能力,从200ER至1300ER,数值越高便代表阅读能力越强以及文本难度越高,例如小学一年级课本大概在300~400ER,日常新闻文本为600~900ER,《道德经》则逼近1200ER.

文本难度端和阅读能力端的数据并不需要严格对应,“600ER的阅读能力不一定就要匹配600ER难度的文本。”通过大量测试后,团队发现当学生的阅读能力是600ER时,考拉需要匹配的文本难度是550~700ER。

“这样一来,我们给到的文本难度能够保证孩子的理解程度在60%~90%之间,不会因为太难而读不懂,也不会因为太简单而学不到新东西。”赵梓淳说。

提高知识效率

赵梓淳强调道,考拉阅读研发ER Framework中文分级阅读系统更大的意义在于寻找到应用场景、将技术转化为产品落地。去年年底,当经过大规模数据训练的模型算法准确率接近93%后,考拉团队决定实现系统落地、推出具体产品进入市场。

“提高知识交付效率”成为了团队产品设计的核心思路,而这也是赵梓淳所坚持的考拉阅读主要优势所在。“技术、用户量都不是我们的壁垒所在,因为这些很容易在资源的投入下实现,真正有价值的是我们对教育以及国内教学生态的认知。”

这一观点体现在了日后产品具体形态设计和26次迭代中。例如,考拉阅读App被设计为学生端、教师端、家长端和管理端,学生完成能力测试后,阅读平台匹配的个性化内容,教师使用平台发布阅读作业、追踪阅读进度,家长端和管理端同时跟进,打通教育在学生、家长、教师、学校四个维度的闭环。

具体到学生端产品的使用层面,赵梓淳坦言,最初参考国外同类产品模式,考拉阅读App的形态较为严肃,“缺少动画和游戏部分”,但在实际推广中,团队发现国内的学生确实比较容易接受游戏化的内容。

赵梓淳也并不排斥在教育产品中引入游戏机制,他认为,如果能通过游戏机制的激励,实现学生在阅读能力和知识交付效率上的提升,这种机制便可以被接受。“只要这个游戏是产品真正需要的、能够传导教育价值,就没有问题。”于是,为逐步实现学生使用体验的优化。团队不仅改进了整体UI设计,还加入了闯关、PK等环节。

现阶段考拉阅读App包括“短文星球”小游戏、组词闯关游戏,以及“探索世界”、童话岛、每日晨读、书籍海洋等板块。在当前推荐的阅读内容上,大部分为聚合类书籍,例如新课标书目、京东和当当畅销书等。

这些书目在引进后,将经过考拉阅读近20人的内容团队审核或再编辑。同时,内容团队还将自产出内容,目前可实现每日生产3万字文本。

相比于整体内容量,考拉阅读的自生产内容占比较低,但在赵梓淳看来,除了补充文本矩阵,拥有内容生产能力更大的意义在于,可以尝试设计新型文本形式,实现更优质的阅读体验。

“过去,现在阅读的书籍更多是纸质书时代的产品,但它是否适应移动阅读时代,这个还是个问号,现在我们想在文字内容上进行尝试,比如进行更多的交互设计等。”

此外,团队还在不久前与上线了“听书”板块。“这也是一个尝试,目前该板块的价值是让学生碎片化时间利用起来,还是为了提高知识交付效率。”赵梓淳说。

在他看来,产品上的这些迭代优化的结果可以体现在用户数据上。从今年年初开始正式推广,此前进行阅读评估测试时与学校建立的关系成为了进一步合作的铺垫准备,考拉阅读最早的学校客户也来源与此。

在此基础上,为保证规模化进入校园,考拉阅读与各级教育机构达成合作,例如与吉林省、甘肃省教育厅直接合作,在全省进行推广。目前,考虑阅读已覆盖28个省市的近万所学校,日活用户在半年时间里接近百万。

此前,成立两年时间的考拉阅读已完成3轮融资。今年8月,考拉阅读宣布完成2000万美元B轮融资,由GGV纪源资本和XVC共同领投,CMC华人文化产业基金、启明创投跟投。赵梓淳表示,接下来考拉阅读还将进一步扩大用户规模,并继续升级系统、优化产品。

“我们并不着急变现,如果团队能够让考拉阅读的这套中文分级阅读机制、成为国内教育的基础设施类产品,以此掌握话语权后,未来的标准制定、内容分发、知识教育服务等层面都有可以想象的空间。”他对《新商业情报NBT》(微信公众号ID:newbusinesstrend)说,“可能日活达到500万~1000万时会是一个比较适合开启商业化的阶段,今年和明年我们的目标是实现200万日活。”

©新商业情报NBT原创内容 转载请联系授权

【爆料或寻求报道】加微信号:Hoffman3056

【商务合作】加微信号:sansheng_kefu

(0)

相关推荐