作业帮宋旸北师大分享:统计学与AI双驱动 让数据在每个细节发挥重大作用
近年来,大数据、5G、AI技术应用快速发展,助力我国教育信息化水平不断提升,并催生大量在线教育新场景、新模式、新业态,有效满足人们多样化学习需求。
5月13日,在北京师范大学珠海校区,作业帮首席算法专家宋旸受邀和该校统计学院应用统计专业硕士生进行了分享。宋旸就统计学在具体场景下的实践、泛AI技术在产品业务中发挥的作用等方面进行了讲解。
宋旸同时受聘为北京师范大学统计学院应用统计专业硕士兼职导师。
分享现场
数据思维贯穿研发迭代全过程
据了解,作业帮旗下产品日活超5000万,月活突破1.7亿,拥有3亿的大数据题库,每天都在源源不断地产生海量数据。如何把数据转化成工作中的生产力,变成企业的竞争力,是日常研发与产品迭代中都面临的课题。
宋旸介绍,将数据思维贯穿在作业帮产品实验、分析、优化过程,有助于作业帮完善产品功能。例如,作业帮的海量知识点重要性均是根据学生搜题频次等多项数据而定。
此外,作业帮对于数据细节处理十分重视,宋旸认为不同的理解和认知,不同的处理经验和技巧,都会对最终结果产生重要影响。以拍照搜题为例,为了更好地对拍照搜题每天产生的过亿张图片进行随机抽取处理,作业帮对多种算法进行深入比较,全面分析利弊,最终找出全新算法策略。宋旸表示,“在统计算法加持下,任何小问题都会变得优雅且高效。”
数据分析带来精准洞察泛AI技术激发产品潜力
数据分析为作业帮具体业务带来了精准洞察。为了让用户拥有更好地体验,作业帮会基于数据的分析进行改进。
统计学也为产品带来了算法利益,泛AI技术的应用则进一步激发了作业帮产品的潜力。据了解,目前,图像、计算推理、检索及NLP、语音、基础数据挖掘等基础技术,已成熟应用在口算批改、拍照搜题、智能客服等多项产品中。
以拍照搜题为例,在日常应用中存在光照不均、异常模糊、倾斜扭曲等难点,作业帮利用图像与OCR技术完整识别流水线,包含超过30种神经网络,针对上述难点专项解决。文字的一次识别需要260次以上神经网络预测,平均耗时仅需200ms,每分钟响应高达100万次搜题请求。
与此同时,语音技术、自然语言处理技术、机器学习技术等AI技术也广泛应用在作业帮的教学实践中。在课堂语音弹幕应用中,语音技术能够成功识别老师的语音,并据此匹配特殊颜色等互动内容,有效吸引学生注意力,调动课堂互动积极性。
宋旸表示,从数据分析到数据洞察,作业帮让数据在每一个细节上发挥重大作用,并指导产品的最终决策。在统计学与AI技术应用的双驱动下,作业帮产品不断趋于完善,持续刷新用户使用体验。