12月8日-12月11日,IEEE国际大数据会议(IEEE International Conference on Big Data, IEEE BigData 2025)(http://bigdataieee.org/BigData2025/)在中国澳门特别行政区举行。训练中心“大数据与机器智能”(以下简称BDMI)课程团队论文被IEEE国际大数据会议(IEEE BigData 2025)收录并作口头报告。

训练中心BDMI课程团队完成的《Edge-Optimized Voice Control with 0.26M Parameters: Distilling 86M Adaptive Window Audio Transformer for Real-World Variable-Length Inputs》一文该会议录取为主会全文(Main conference full paper)发表。BDMI课程团队负责人陈震高级工程师、课程助教任品泽同学代表团队参加会议,并在会议上作口头报告。
BDMI课程团队成员由来自清华大学训练中心、信息国研中心以及北京大学计算机学院的教师组成。本项工作是由课程团队共同合作完成。
该项工作在边缘计算语音控制领域中,针对现有音频时频谱Transformer模型(Audio Spectrogram Transformer, AST)在资源受限设备上存在的固定长度限制与高计算成本问题,提出了分两个阶段的知识蒸馏自适应窗口音频Transformer(KD-AWAT),实验证明该模型在处理可变长度语音命令的任务上,实现了330倍的参数削减,并在准确率上全面超越了AST、ResNet、VGG等一系列传统模型和方法。


自2016年设立课程以来,BDMI课程教学团队注重人工智能业界前沿实践,不断优化课程内容,带领学生探究人工智能领域前沿的问题。自2024年以来,《大数据与机器智能》课程成为清华大学通识选修课,也是人工智能赋能教学试点建设课程。BDMI教学团队遵照学校通识课“无学科门槛,有学理深度”要求,不断重构课程教学内容。该课程同时也是教务处国际融合式课程,实现中英文双语授课,为来自校内不同院系的本科学生,以及来自不同国家的国际融合式课程的本科学生同时授课。
IEEE国际大数据会议IEEE BigData是大数据领域的重要会议,在国际大数据研究中占有重要的影响力和作用,也是中国计算机学会(CCF)推荐的新型交叉类C类国际会议,其中主会全文录稿率仅为18.8%。
本项工作得到了清华大学教务处本科教学改革项目、清华大学实验创新基金项目和中心iTeach双创项目等的大力支持。国家发改委双创示范基地建设项目的中心工业云提供了相关的模型算力支持,训练中心人工智能实验室为算力平台运行提供了相关支持。