李可佳 | 大数据将如何颠覆当代教育模式?

李可佳 | 大数据将如何颠覆当代教育模式?

【高小山说】

————————

涉身教育行业的人,常常都抱着一定的情怀或梦想。因为教育这件事,往往需要长时间的播种、浇灌和守候,有生之年都不一定能见着它开花结果,甚至还常常中途夭折。


但总有那么一批人,他们不顾艰难困苦从四面八方涌来,为教育事业奉献自己的光和热。


高山书院2020年内蒙站课程期间,同学们聚在一起聊到了教育的话题。在这次谈话中,高小山记录了2017级萧泓同学(萧泓|与游戏结合,可能会是教育新出路)和2020级李可佳同学的分享,他们是教育工作从事者,也是新型教育的创新者和实践者。


如果你有更多关于教育的理念分享,欢迎在文末留言或给高山书院投稿~

李可佳 | 大数据将如何颠覆当代教育模式?

我最初之所以接触教育,是带着一点情怀。因为家里除了我和父亲是工程师,其他人全是老师,从幼教到教授,没有第三种职业。

不过说实话,做了5年教育,我感觉自己最多只是把教育里的其中一门小生意或是产品给搞清楚了;对初高中教育或者是教育本身,我完全不敢说我想明白了。而现在我的孩子才8个月大,我对教育的想法还不能在他身上实践。

不过就此刻而言,我的价值观是越来越偏向放养。尤其前段时间,我接触了清华大学做积极心理学研究的彭凯平教授团队,了解到学习动机本身对学习效果至关重要——所以我现在的主思路是:怎么去挖掘孩子的学习动机?

但这问题至今我还没想明白——这里顺便分享一个关于我母亲的小故事。

她是一个平凡的幼儿园老师,过去做了20多年的院长,所以镇上大家都认识她。2018年,几家民办学校想请她上课,但她拒绝了。当时,她想到我可能生孩子,想把时间留出来给我。

但其中一个老板居然直接挂了我母亲的头像和名字招生,而且反响很好,来了600多个学生。

我知道以后特别生气。站在儿子或商人的角度,我甚至想到了去告他们,因为这仅违法,还侵害了母亲的声誉。但我母亲的反应给了我一个震撼教育。

她平静地决定了去上课。

当时我特别想不通:为什么这样的老板她还去上课?她回答我的那句话,我至今都记得。

“如果我不去,孩子们怎么办?”

后来,她就真的去了,去保障这些孩子把书读好。那边的待遇,实际上比原来私立学校都要低得多,但她没有半点在意的样子。

所以,现在我是没有答案——作为一个教育从业者,我和一个真正意义的教育工作者还有很大的距离,关注点是两回事。

但我可以确定的是,极课大数据虽然只作为一个教学工具,但对国家有很大的作用——沿海地区先行的一批学校,每天都在产生大量优质的数据资源如果能训练好这个系统,也就能将好内容进一步沉淀,最后送到更多需要它的地区去



当教育遇上数据


教育领域其中一种分法,是Pre-K、K12及成人。萧泓师兄他们没做的K12,正好是极课专注的波段——我们常戏称:水深火热的K12,因为大环境的竞争无可避免,也无从改变。

在K12教育里,我没有追求特别美好的产品,或是多么顶尖的技术,只是在现有的技术下进行重新组装,通过提高老师学生之间教与学的效率,让这个过程不至于那么痛苦。

欢乐的游戏模式在K12阶段没那么受用。其中一种说法是,孩子到了9岁就能分辨出游戏与学习,所以往后再用游戏作为正反馈去刺激学习,效果已经递减,而难度增大。Pre-K的游戏化产品主要都面向2-8岁的孩子,而K12至今都缺乏类似爆品的现象,我们似乎也从侧面验证了这一点。

最初踏入K12,是因为无锡的母校找上我。

过去,我的母校在无锡一直是最好的学校,但在划区以后,由于招生生源受到剧烈影响,排名瞬间滑落到第五。其实名校的本质,固然有先进理念、优秀师资的成分,但最主要的还是在于顶尖生源。

在那之前,学校单凭顶尖生源的效应,就能维持着高绩效的表现,无需过多创新。但既然平衡态已经打破,学校也开始主动采取各种创新手段,试图提高教学的效果和效率。

其中,它实行了一套模式——在每次作业及考试以后,对每一道的题分进行统计,然后在这基础上再深度分析及规划,比如根据学生强弱项的分布、知识点之间的比对等结论进行教学调整。但当时这一系列的过程全靠手动,对老师的时间和精力是很大的负担。

于是,他们托付我开发软件去辅助这个过程——对此,我心里其实也是非常认同,因为我隐约可以感觉到这样的数据,如果能沉淀出来,可以带动教育往因材施教的方向走。

最初,我想到高拍仪,一种C形的实物展台,摄像头由上往下拍;我们将批好的卷子放上去,用图像识别技术采集,再交由计算机统计题分。而名字的识别上,我们给所有学生设置了二维码身份标签,贴到作业和试卷上。

后来,考虑到效率,又改成高速阅卷仪;每分钟能拍好50张以上的卷子,对班级的场景正好。本来阅卷仪主要只用在银行,一年出货数百台,开发了新应用以后,中国一年就出货上万台,日本的很多仪器公司老板特意来拜访学习。

但一直到实测,我才发现事情远比我想象的要复杂,尤其是准确率。实验室或工程师角度的简单场景设置,在现实中遇到了大量的边界问题,比如批改印迹不够明显,试卷的批改方式、光线环境、纸张颜色存在巨大差异等等。

花了200万美元及大量人力,研发始终无法投入实际应用。后来我咬紧牙关,为它成立了极课大数据,学习融资,而我运气很好,每次快到弹尽粮绝之时,总能转危为安。最惨的一次车卖了,房也抵押了,核心团队陪着我熬了6个月的潦倒寒冬,一直到去年被字节并购。

极课就像一个黑洞,没什么广告投入,资金都烧在了研发和人员支出上,至今也仍在持续投入。砸了这么多钱,也总算带来了一些成果。

■ 采集&统计

现阶段,我们开发了多种采集方式,覆盖了从作业到考试的各种场景。

除了最早一代的采集模型,内部研发已经到了第三代:老师只要架起手机、打开软件,就能通过影像把界面上的数据采集完整,相当于过去1万多元的昂贵高速阅卷仪,变成了老师们人人拥有而且随身携带的设备,效率也优化到了很高水平。

■ 批改&打分

除了采集和统计,我们也可以做到自动化批改。客观题型上能和标准答案进行比对;主观题型上也在逐步拓展我们的覆盖面。

比如对作文进行批改及打分。

一篇高考作文的分数,实际上是按照“表达顺畅性”、“内容独到性”等标准分解,各占X分。而在这些标准之下,具体打分是依靠底层的NLP(自然语言处理)技术——在深度强化学习下,系统经过大数据训练,好和坏一定程度上还是能分辨出来的。(了解更多NLP技术,详见《在这件事上,强大的AI还不如5岁小童?浅谈瓶颈和出路》)

相对于中文,英文简单一些。因为英文的表达看上去随意,但实际上存在更明朗的主谓宾结构和语言逻辑;尤其是英语作为第二语言,批改更工程化。所以,其实英文批改系统早两年就有了,现在也已经运用到了正式的考试里。

当然,我们也有纠错机制,主要是采用两个系统做双评比对,如果评分结果有出入,就会有老师亲自介入。这样一来,替老师省时,也能保持高准确度。

同时,根据利害性,场景有不同的技术方案作为应对,比如从作业到考试,就是从低利害到高利害。越高利害的场景,人工智能成分越少。最高利害的场景,计算机只完成整个图像的切块和分发,判卷仅由老师手动负责。

另外,初中的代数几何,在实验环境里也做到了非纯粹匹配的智能化批改,而且准确率相当高。

至于高中的立体几何,就和中文一样,计算机还需要时间处理。每个领域之间差异巨大,我们基本都是分科逐个突破,实际上这也是这行业最烧钱的地方。

逻辑和理论上,随着数据和计算量提升,智能批改可以无限逼近人工;但资源和成本上,海量的数据训练可能比人工老师昂贵得多,不见得实用。

■ 分析&应用

每天从学校流进来的大量学科类数据,有很大的用处。

比如靠小题分把课程的知识图谱和画像呈现出来,我们再准备高质量的题库,根据图谱、画像精准找到需要它的用户。这么一来,作业量减少了,教学也更能对症下药。

而教学效率的提升,无形中为教育释放了很大的发挥空间。凭借这个,我的母校前几年已经重返了第二名,而且和其他学校相比,课程少了一半,自习、体育课等素质类的课,即便到了高考前都保留着。

除了学科类数据,我们还可以采集一些与行为、互动相关的数据。

比如在校园安装传感设备,留意学生在非课程时间段的出没情况,甚至步态类型;或是通过课堂使用的平板,看看学生在个别题目上停留的时长状况。测试中,我们发现这些数据可以挖掘出很多意想不到的细节和用途,比如学生抄袭作业,往往是前期纹风不动,后期却疯狂猛写。

未来我们会采集更多维度的数据,并引入新的研究模型,不单是辅助课堂教学,也支援校园治理。

虽然处在教育领域,但极课大数据本质上是一家产业互联网公司,主要是把互联网技术应用到教育,扮演一个大数据精准教学平台的角色。

像萧泓师兄所说,这个行业很传统——但也因为传统,所以创新更有了机会


整理丨邱施运

编辑丨朱珍

李可佳 | 大数据将如何颠覆当代教育模式?

热爱科学的人都在这里

展开阅读全文

页面更新:2024-04-17

标签:数据   作业   英文   生源   利害   母校   场景   当代   效率   很大   母亲   模式   老师   孩子   学校   学生   技术   李可

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top