对话AI教育从业者们:AI如何解决因材施教的难题?

AI+教育能有多少种想象?
随着AI的融入,传统的教学方法和学习方式正在被重新定义,从智能学习助手到互动式答疑系统,再到个性化学习方案的AI驱动平台,这些前沿技术正以多样化的形式渗透到教育的各个环节,显著提升了学生的学习体验。
本期,我们邀请到了格灵深瞳体育业务线产品负责人夏鹏飞先生,精准学合伙人张宁先生,以及AskSia联合创始人Bella Ren女士,和硅星人AI分析师黄小艺一起聊聊AI技术如何在从传统课堂到在线学习平台,从基础教育到高等教育的各个层面促进学术界与产业界的紧密合作,以及AI在解决数据共享和信息时效性问题上的独到见解和创新应用。
以下为对话实录:
1
目前AI在实现一对一个性化指导方面处在什么阶段?面临的主要挑战和困难是怎样的呢?
张宁: 从技术难点的角度出发,我们将解题能力纳入个性化辅学的范畴,但并非唯一关键因素。优秀的老师之所以能让孩子的学习效果更好,不仅在于解题能力,更在于他们的教学调度能力和诊断学生误解的能力。
首先在解题能力上,目前,AI除了在做一些脑筋急转弯类的题目时效果一般,其他内容基本没问题,而且在实际的一对一辅导场景中,教师与学生的互动通常是围绕已知题目展开讨论,整个K12涉及的知识内容是非常有限的,不是去解决知识点复杂的未知问题。
其次在讲题这个环节上,我们更侧重于模仿线下一对一教学中教师的能力结构,并将其转化为AI模型的具体行为。
现有的AI技术已经能够实现教师的常规教学环节了,如开场白、询问作业情况、根据学生学习情况提问、讲解知识点、临时出题、判断学生知识点理解偏差等,在45分钟的一对一学习过程中,构建一个虚拟教师是完全可行的。如果赋予这个虚拟教师个性化的声音、交互能力和视觉能力,它几乎可以模拟真实教师在固定场景下的所有能力。
基于这些判断和技术可行性的验证,我们计划在今年推出相应的产品,将这种个性化辅学的AI模型实现并推向市场。
黄小艺: 您刚才提到几个关键点,为了让AI完成个性化指导,首先让AI自己知道如何解答题目;其次,AI需要能够教会学生。这里其实存在一些挑战,比如与学生的互动过程中,AI需要理解学生究竟在哪个环节遇到了困难,这是怎么做到的呢?
张宁:对,我们的题库是千万级的,这些题目是训练AI与学生进行有效对话交流的关键资源。为了实现这一目标,我们对每道题目进行了详细的标注,包括涉及的定理和解题步骤。
例如,我们会标注某个定理在解题过程中的具体应用,或者是一道题的多种解法,理想情况下,我们还会标注出常见的解题误区,通过这些详细的标注,为语言模型提供了重要的前置信息,使得AI能够更有针对性地帮助学生识别和纠正错误。
在这个过程中,AI还要更深层次地模拟教师的角色,这种模拟涵盖了20多种个性化教学风格。例如,有的老师可能会让学生复述题目已知条件,以此来判断学生在理解题目时的具体难点。如果学生无法正确复述题目条件,说明他们在理解上存在问题,老师需要进一步探究问题的具体原因。
这些教学策略和逻辑需要融入到AI模型中,以实现更自然和有效的教学交互。此外,教学过程中的语言风格、幽默感等元素也是提升学生体验的重要因素。虽然这些属于表面化的设计,但它们能够使教学过程更加生动和吸引人,从而提高学生的学习兴趣和参与度。
黄小艺:这一点很有趣。在AI出现之前,AI教育尝试通过构建知识图谱来实现精准教学,重点关注的是知识点之间的联系。然而,真正关键的其实是理解学生如何学习这些知识点,以及他们在学习过程中遇到的具体困难。
Bella Ren:详细解释这一点,我发现也是我们产品的一大卖点,之前我们与用户交流时发现,他们喜欢我们产品的一个关键原因就是因为我们提供了非常详细的解释。
有些产品可能只会给出答案,但不会告诉你如何解题,而且即使是大型语言模型,也可能在准确性上存在问题——给出的答案可能不正确,以及解题步骤是乱答得。所以我们致力于打破传统大语言模型的边界,用以GPT4等大语言模型为基础并做出架构的优化,以提高解题的准确度和提供更详细的解题步骤。
黄小艺: 从技术上是怎么做到的呢?
Bella Ren:从技术层面来讲,我们使用了在chain of thought (cot)架构基础的agent技术以提高模型的准确度和精准度,我们利用了这套技术架构在我们8.15号上线的superAskSia功能上,我们测试了一套较为困难包括涉及推理的数学题,在这款即将要上线的功能上,我们的准确度相比与GPT4o高出大约30%以上。
夏鹏飞: 我们和大家不太一样,体育学科的特点在于即时反馈,一方面学生完成动作后能立即获得反馈,才能更好地理解和改进技巧,另一方面,体育动作难留痕,AI必须能够进行实时分析和反馈,而不是事后回溯,这是和其它学科的差异。
所以我们的AI在做的就是,当学生完成动作的同时,实时告知他们哪里需要改正。此外,我们的AI不仅服务于教育领域,还服务于其他业务场景,这些场景通常有一套标准的训练大纲和考核标准。
在实现个性化教学方面,我们将教学大纲和考核标准中希望学生掌握的运动能力抽象出来,精准定义每一个动作并关联到特定的运动素质或能力,就可以实现了。例如,如果学生在引体向上和仰卧起坐方面表现不佳,我们可以推断出他们的核心力量不足,并推荐相应的提升核心力量的运动方式。
我们的AI模型还会结合不同学科类型,考虑到体育老师的专业背景不同,他们对于提升特定能力有不同的看法和方法,提供一系列提升能力和手段的建议,这个过程是先通过收敛分析确定问题所在,然后发散建议提供解决方案。
1
目前生成式AI技术水平对于大家想要实现的场景是否足够?如果不足够,具体是哪些方面还存在不足?
张宁:AI文本生成技术已很成熟,尤其借助自监督学习模型能处理大量文本数据,只要数据足够充足。比如说大语言模型在法律和医疗等特定领域的表现就是足够的,主要是数据获取和实际部署的工程问题限制了模型表现。
但是在视觉AI领域,尽管图像识别技术进步显著,但AI理解复杂图像和预测未来事件的能力仍有待提升。李飞飞教授的空间智能技术研究正致力于改善这一状况,虽具体实现时间未定,但这代表了AI发展的前景方向。
夏鹏飞:我们前段时间刚和北京大学教师的交流如何提高算法在非标准化动作识别中的准确性,尤其是在体育教学应用的开发上。主要难题在于,尽管定义了标准和常见错误动作,但个体执行错误动作的差异性使得标准化测试变得复杂。
例如,即便是模仿同一错误握笔姿势,每个人的细节也不尽相同,或者说同一个人执行多次同样错误动作都会存在差异,这对算法提出了更高的识别要求。为解决这一问题,我们计划增强算法的泛化性,以适应各种非标准化动作。我们的目标是开发Text-to-Motion技术,根据错误程度生成标准动作视频,优化算法训练和测试。
之前,我们依赖的是历史数据的积累进行训练数据的应用,这种方法效率低下且覆盖面有限。我们提出通过算法生成具有特定错误程度的标准动作视频,模拟飞机设计中的风洞实验,以生成标准化错误动作视频,更精确地评估和改进算法。此外,我们也正探索使用大模型来提升小模型的泛化能力,这对于算法适应多样化和非标准化场景的发展至关重要。
Bella Ren: 今年2月,我在测试GPT时发现它在解决数学问题上表现不足。但自那以后,GPT经过了十几轮迭代,显著进步,如Sal Khan在OpenAI发布会上展示的解答勾股定理的能力。作为面向消费者的人工智能应用开发者,我们应密切关注大型语言模型的能力,并据此设计产品功能。
产品设计时,需要深入了解用户习惯和期望的交互方式,尤其是技术不太熟悉的学生群体。我发现一些学生已能熟练使用GPT进行学习,但大多数学生对GPT的功能并不了解。因此,在开发相关产品时,我们应基于大型语言模型,研究并设计适合目标用户的交互方式,进而开发出符合需求的功能。
1
AI来了,为什么教育是率先去落地的场景?
张宁:中国教育领域人工智能技术的快速落地,主要得益于成本优势。中美两国中,所有年经常性收入超1000万美元的AI创业项目都显示出成本效益,且必须在AI技术能力范围内实现。
例如,中国的AI客服市场发展较慢,部分因为客服成本较低;而在美国,人工客服成本高,使得AI客服产品如牙医诊所服务能迅速盈利。教育领域也呈现出类似情况,我们正在开发能进行45分钟辅学的虚拟教师,作为学校学习的有益补充这为AI教育产品提供了价值空间,促使教育机构愿意投资优化。
AI技术转化为特定领域产品需要大量资金,但教育领域的高价值应用激发了投资意愿。中国市场的独特性为AI技术的应用提供了肥沃土壤,不同行业在全球范围内的发展并不一致,中国市场在这方面展现出其优势。
Bella Ren: 我也有类似的看法。从成本角度来看,现在很多学生遇到学科问题时,可能会求助于助教(TA),但在假期或阅读周等非上课时间,他们可能无法找到助教。此外,参加课外辅导班虽然是一种解决方案,但成本较高。相比之下,我们的产品定价仅为每月10美元,能够帮助学生解决各种作业问题。
从产品数据来看,在阅读周等需求较大的时期,购买付费率明显提高。这是因为学生的需求量大,同时他们也需要与助教或家教进行沟通。传统的辅导方式成本较高,而我们的产品以10美元的价格提供服务,因此会有更多学生愿意购买。
黄小艺:听起来是现在的AI技术对教育场景不仅足够成熟,而且教育市场需求也非常旺盛,这两者共同推动了AI技术与教育的紧密结合。格灵深瞳怎么看这个问题?
夏鹏飞: 我一直在做教育行业,从教育信息化企业到AI公司,我坚信AIGC在教育领域的首批应用必须满足三个方面的正确性,即政策、原理和应用场景的正确性。政策正确性是首要考量,近几年在教育部引导下,AI技术在教育领域的应用已成为趋势,市场蓬勃发展,旨在提升教师专业能力,提升学生的学习效率与积极性,与全球技术发展同步。且民众对教育的满意度提升的核心是保证教育的公平性、高效性和科学性,AI在提升教育公平性方面具有很大的潜力。
原理正确性也至关重要,教育领域一直在寻求技术支持以推动信息化,而AIGC相关技术的成熟使得在特定场景中能够产生实质性的价值,得到良好应用和发展。而应用正确性指的是技术要与场景深度融合,教育信息化已进入3.0阶段,要求技术深入教学核心环节,AI技术的成熟度和政策资金支持使其在教育行业的应用变得既合理又必要。
AIGC虽非教育领域的首个新技术,但每次技术革新都为教育带来创新机遇。在确保正确性的前提下,AIGC的应用将对教育行业产生积极影响。
1
什么样的学习机可以被称为AI原生的,以及为什么这类学习机会对学生的学习效果有显著提升吗?
张宁:原生在于我们的产品是由AI提供全程引导、帮助学生完成学期知识点学习和习题解答的,这与传统被动自学模式有显著区别。
当然,教育产品应避免绝对正确性和排他性,没有一种教学方法能取代所有其他方法。但市场上需要我们这种形态的产品,既能提供服务,也是对现有教育场景的有益补充。
即使有了我们的主动辅学的学习机,自学场景依然重要。有些学生可以依靠自学解决问题,而另一些可能需要更多指导和帮助。市场上已有自学型产品,如资源类平台、科大讯飞学习机、错题本APP等,它们引入AI后能提供搜索、讲解和启发式引导等功能。
而我们利用生成式AI技术填补市场空白,提供一种科技型教育产品,无需全天候雇佣真人教师。我们的目标是结合学生个体差异和不同学习场景,提供既能满足自学需求,又能在必要时提供个性化辅学的教育产品。有个笑话叫做“初一那年,我上课低头捡了一支笔,从此以后再也没听懂过。
对于可能错过关键概念的学生,我们的产品可以提供全局指导,帮助他们建立基本学科理解,具备提问和自学能力。这样的产品既能适应不同学习需求,也能为教育行业带来创新和价值。
黄小艺: 所以关键在于它在于能够明确指出学生不懂的地方,而不会的学生往往不清楚自己的具体问题所在。他们需要一种交互式的沟通方式来确定具体的问题所在,而这正是AI能够做到而学生自己难以做到的,这个需求洞察很细致。
不过,传统学习机的市场已经相当成熟,包括销售渠道都已经形成了一套成熟的体系。在精准学习产品进入这一市场时,会面临哪些困难和挑战?AI是否是突破性的手段?
张宁:产品差异化是市场营销的核心。如果新产品只是营销口号上的更新,而没有本质区别,营销成本会很高。我们认为新产品是对市场的有益补充,因为它填补了关键的学习场景空白。
除此之外,AIGC技术也降低了短视频投放成本,显著降低了制作成本,包括营销素材、课件视频和脚本。这是我们与以往相比的主要差异。当前营销策略还包括”口碑营销”,即在小红书等平台上通过视频和图片做种草。
1
许多小型应用涌现,AskSia是如何想到要切入AI+教育这个领域的?以及在国外教育市场的情况?
Bella Ren:教育公平是我们致力追求的。AI技术,尤其是自然语言处理和机器学习,可以给学生提供个性化学习路径和智能辅导,帮助实现个人成长。我们从去年7月以来,致力于为全球高中生以及大学生打造Personal AI Tutor,个性化的AI助教,让优质教育资源可以普及到更多国家以及用户手中。
尽管许多小型应用涌现,AskSia 聚焦于高中以及大学生的学业难度以及提升需求,通过行业领先的准确度以及教学本领优化,为学生提供量身定制的学习建议和反馈,从而显著提升学习效果。
传统教育中,存在的个性化不足的问题。对标互联网浪潮下的全球主流教育科技产品,我们通过打造个性化AI导师,目标实现换道超车,达到上亿美金ARR体量,引领教育行业的创新和变革。
黄小艺:您提到未来一定是AI化,那肯定与现在的AI化有所不同,有没有对未来更远场景的一些判断或设想?
Bella Ren: 就目前的市场形态来说,大部分做AI教育的产品基本上会围绕ai做题展开,这种是学后场景,但是ai化的场景一定是多面的,比方说围绕上课这个场景也可以做到AI化。比方说过往的教学上课场景,学生如果在课堂上遇到问题通常境况下要不课堂举手问老师要不记下问题课后再问。
但这里就有实时性的问题在里面,而AI可以打破这个边界,我们目前在开发一个专门针对上课场景设计的功能叫做A+ SIA,它可以将每一门课都可以生成一个互动式画布,专门用来录音课堂内容,做课堂内容的总结、索引还有延伸(例如参考例题、拓展阅读)能够更实时地帮助学生理解课堂内容并帮助他复习准备考试。
黄小艺:国内的教育AI和国外的教育AI之间有什么区别吗?区别点主要在哪里?
Bella Ren: AskSia从launch的一开始就是瞄准的全球市场,我们从去年截止到现在做了30多所国家,全球用户大约在51w 人左右。那为什么瞄准国际市场是因为我们认为国内外教育AI之间的区别并不大,因为在教育这一领域,存在着很多共性。当然,不同地区可能会有不同的侧重点。
比如,在美国,针对理科的学习场景,大学生可能更关注微积分等课程,因此他们在微积分方面的要求会更高。我们之前专注于北美市场时,就在微积分这个领域做了大量的工作。
而在其他地区,比如日本,教育的重点可能会有所不同,侧重点在于不同的知识点。我认为共性是相同的,因为无论在哪国,学生都需要学习理科和文科等基本课程。这些共性意味着教育AI的核心功能和目标在全球范围内都是相通的。
1
格灵深瞳起步得很早,可以说是一个从AI1.0时代跨越到AI2.0时代的公司,在AI1.0时代,可能大部分技术公司都不赚钱,现在有什么变化吗?
夏鹏飞:关于AI盈利,需要从多角度辩证看待。AI技术不断进步并与业务场景融合,但成熟和应用需要时间。作为AI公司,我们追求创造商业、社会和技术价值。商业价值上,盈利是目标,但我们也投资创新业务,包括短期内可能不盈利的技术探索,以维持技术领先。以格灵深瞳为例,公司有盈利的业务,也有短期内还需要更多投入的业务,我们相信这些投资将带来未来更大的商业回报。
另外,在社会价值方面,我们也一直在积极践行。例如,过去一年里,我们利用跨年龄同亲缘比对算法帮助找到数十个被拐多年的孩子,这是社会价值的直接体现。AI的未来充满想象,新技术不断突破。我们应保持积极且稳健的态度,通过提供优质产品和服务,用实际案例证明AI价值,这是我们应追求的道路。
黄小艺:正值奥运期间,格灵深瞳在校园体育场景和竞技体育场景中的应用有何不同?这些场景的具体痛点是什么?格灵深瞳又是如何解决这些问题的?
夏鹏飞:在教育领域应用AI具有更广泛的应用场景与落地性。格灵深瞳的体育业务是从体育高校和国家队服务起步,现在又回到了教育行业。AI面临的一个核心挑战是数据,竞技体育领域的数据有限,对模型的泛化和产品化要求高,是面向少数人的“个性化”服务,而教育场景强调普适性,是面向一群学生的“个性化”,与单个运动员不同。
从市场规模等商业化角度出发,我们倾向于选择市场广阔、易于落地的校园体育场景。这并非否定竞技体育的价值,在我们服务竞技运动队一年半的时间,团队对于运动的认知提升是非常大的,同时也基于优质的专业运动数据训练了我们引以为傲的体育领域的AI模型。
为了AI的落地、发展以及实现社会和商业价值,我们做出了战略上的权衡,选择了教育领域,相信它提供了一个广阔的平台,既能实现技术的广泛应用,又能带来积极的社会影响,并具备较大的商业价值。

来源:硅星人Pro

滚动至顶部