“先说说你对在线教育模式对传统基础教育的影响吧。或者说,你觉得你现在在视频网站上推广的这种模式,还有什么可以继续改进、与互联网新技术结合的地方。我不要看四平八稳的材料,只想听最切中时弊的问题。”
顾莫杰随便扫了几眼萨尔曼可汗的企划书,然后把那薄薄的几页纸丢在茶几上,敲着指头询问。
他需要确认可汗有干货,值得他每年投资几百万去做这个事情。
可汗也不拿捏,直接就说了:
“我觉得吧,视频授课,我算不上首创——我给我表妹用视频教中学数学的时候,麻省理工本身就有在线的免费视频数学课。但是结果事实证明麻省理工的课不如我的播放量占优,这说明他们的课程模式设置有问题。
我不是搞教育专业出身的,知道自己的实力。如果单论教学能力,我肯定不如麻省理工那些教授。在面对面的互动授课情况下,他们的教学质量当然会超过我。而现在在视频课领域被我反超了,那只能说明他们对视频技术的应用上,没有扬长避短。”
顾莫杰给了一个鼓励的眼神:“继续说下去。”
可汗喝了口樱桃汁,继续说:“首先,传统视频授课的最大缺陷,就是完全侧重于‘教’,而非侧重于‘学’——那东西是站在授课教师的角度上安排的,不是站在学生的角度上安排的。老师说了,就天然觉得学生懂了,哪怕实际上学生没懂,面对一个录好的视频也没法发问、提出质疑、提出讨论,只能照搬接受。
当然,视频教学也有比普通教学节省成本的地方。除了可以让一个老师的教学成果被无数倍地复制、让更多学生听到之外,它还可以确保重复听、选择性听。走神了、或者一次没听懂的内容,学生可以把进度条往回拉,重复多听几遍,多少也能加深一些印象,有助于掌握。
我摸索的这套视频课程技术,已经不同于YOUTUBE上曾经的简单播放了,而是充分结合了您和杰夫辛顿教授联合发掘的‘深度学习算法’——我的视频内容推送是带有一定的智能性与学习性的,设置了相对复杂的多个视频树状与网状交叉推送结构。
打个比方,一个知识点,如果学生没学懂,在做视频最后留的习题时答错了,那么我会让学生点选其错误的症状——比如正确答案是A,而他选择了B,那么我就会跳转到一段‘B为什么是错的、你之所以会选这个错误选项,是因为哪一个知识点掌握得不扎实’的小视频上。同理如果他错选的是C,那么也会另外跳到一段解说视频上。
为了实现这些目的,我的公开课视频都比较短小。我不会和麻省理工或者哈佛商学院的课那样,非要设置成一个视频长达45分钟甚至1小时,作为一堂课。我的一堂课也许只有15分钟到20分钟,但是足够把两三个小知识点讲透彻,最后留习题,全部做对了就没必要再听。做错了那就选择性跳转到你之所以错的那部分。
我认为这才是真正的因材施教,让学生把时间和精力都花在他们还不懂的东西上面。而不是无论他掌握到了何种程度,都得浪费时间把45分钟一堂的课从第一分钟听到最后一分钟——那是在浪费学生的生命。”
从平铺直叙的流水账式视频,变成根据知识点的掌握情况,具体问题具体分析地推送,这里面的智能上升程度,可不是外行人所看到的那一星半点。
对于可汗的推演,顾莫杰立刻感受到了这个技术设想背后的巨大前景。
或许后世的网友,对于大数据和云计算应用泛滥时代的“猜你喜欢”、“同好作品推送”之类的功能见得太多了,觉得这些都没什么难的。连某点中文网都会推个同好小说,连那些专做盗-版的浏览器都会打出“给的再多、不如懂我”的口号。
加之这些打着同好智能推送口号的推广,实际上往往被竞价排名给污染了,做成了半吊子的注水猪肉,所以国内的网民就更不觉得这些推送算法有什么牛逼之处了。
但是事实上,如果可以不被塞钱加塞进来的那些垃圾信息污染,一个成熟的内容筛选推送算法,对于一个内容提供方网站来说,是一种极大的提升用户黏性助力。
比如,如果一个小说网站的“基于深度算法的大数据推送”实打实做好,书友是不该喊“怎么又书荒了”,哪怕再小众的需求,至少也应该被系统自动筛选出可以看的、喜欢看的作品。而不是直接按照分类和标签粗暴筛选,结果弄到一堆臭不可闻的标题党。
如果一个音乐或者视频网站在这方面做得好,理论上可以提供更契合用户口味的书单、云音乐歌单、视频推送列表……
数据爆炸的时代,“得到知识”这个需求已经不再有稀缺性,但是“不受知识垃圾干扰、直击主题地找到你真心要的数据与服务”,开始变得奢侈起来。
有效率的检索,比囤积固态知识重要得多。只有死记硬背的旧时代行将被淘汰者,才会以后一种形态做人。
想明白了这一切,加上自己本身重生时带来的那强烈的核心价值观,顾莫杰感觉到一阵兽血沸腾。
可汗这个项目,赞助得值。
顾莫杰目光何等敏锐,欣喜之余,直切时弊地追问:“可是,你说的这些,靠目前视频网站的技术应该还没法完美实现吧,很多设置都需要手动完成。很多推送之间的内部逻辑关系,都是人工设定的,并不是基于深度算法和大数据自动统计、自动归纳的。”
可汗微微有些不好意思:“这当然还是有问题的,目前每个教学视频最后留的习题,如果被学生做错了,具体跳转到哪一段后续解说视频,是我手动设置的关联。一方面,我对深度算法肯定不够了解,没法基于这个应用调整出一套行之有效的算法。
另一方面,毕竟目前为止看我的视频上课的学生最多也就十万人级别,这个样本容量还不够大,真上了基于深度算法的架构,或许也会因为‘可供深度学习的素材不够多’,而导致其推送效果不如目前的人工设置关联。”
对于这个说法,顾莫杰也深以为然。
鉴别一个基于云端网络的人工智能是否强大,算法固然很重要,但是最重要的还是用户量和用户使用频次。
如果没有几百万的围棋棋手的棋局作为样本容量供阿尔法狗学习,阿尔法狗是打不赢李世石的。
这也是为什么后世谷歌成长为庞然巨头之后,世上再也没有哪家公司能在人工智能的野蛮生长上比过谷歌了——就算你投入钱再多,科研上再不择手段,充其量给你弄出一个数据修正效率比谷歌算法强两三倍的算法。
那又如何?谷歌的用户人数和频次乘积是你的五倍十倍,你空有三倍效率的算法,照样被越甩越远。何况在没有代差技术的情况下,也不可能有三倍效率的算法。
顾莫杰想了想,问了可汗一个周边的问题:“你原来做视频公开课,有接受过别的慈善捐资过么?”
可汗想了想说:“有,原来我也做了一年半多,去年拿到的捐资是20多万美元,我主要花在了程序方面,因为我一个人搞不定视频的全部推送架构。”
顾莫杰心里有底了。
“那还怕什么,你只靠二十几万美元一年的投入,加上你个人的无偿劳动,就做出了现有的底子。今年开始你可以得到五百万美元一年,什么事儿办不成。
算法工程师不够的,我从初音集团给你调就是了。严磊博士你认识吧?那是当初跟着杰夫辛顿教授带出来的第一批深度学习算法博士,此前地球上都没这个专业呢。他就是一直跟着我在初音干,眼下还有十几个杰夫辛顿和班吉尔教授的弟子,在我那里,都做得很好。
用户样本数据不够的,可以投钱打公益广告推广,让这些课程得到更多的引流渠道入口,一年上百万美元的广告费下去,我估计把这个业务的用户规模扩大几十倍都很轻松。
而且我估计这些事情都做完的话,也就花掉三百来万美元一年的经费。剩下将近两百万,我还指望你做更多的事情——花在课程翻译和海外推广方面,我希望看到可汗学院的课程不只有英语版的,还要有中法德俄日意西葡诸国语言版本。这个不急,可以每年增加三五种语言翻译,花上几年时间彻底弄扎实。跑得太快的话,估计那些用西班牙语、葡萄牙语和汉语的落后地区,宽带网络都还没普及呢。”
可汗听了倍受鼓舞,但是依然有一丝疑虑,不吐不快地说了出来:
“顾先生,非常感谢您的慷慨。可是,我不得不提醒您一个问题——把课程翻译成多国语言的话,这个资金不知道还能不能走联邦政府许可的公益性事业慈善经费呢?联邦法律可是规定了,凡是享受减免抵税的慈善捐资,不仅要将机构设置在美国境内、全部雇佣美籍公民、还得确保‘所有用户都是用在美国境内’的。
如果是对海外受益的项目,就不能享受这部分经费的抵税优惠了。我不是学法律的,这些事儿本来不懂,但是去年我就想过翻译课程的问题,但是碰到了这个钉子,所以印象特别深刻。”
顾莫杰思忖着说:“还有这事儿?法律的事情你不用管,到时候我找别人咨询一下,想办法搞定。翻译的事情你该做就去做,我说不定也会给你一些降低成本的办法,实在钱不够的,我从公司里直接拿钱给你,也不图抵税了。”(未完待续。)