日前,在加拿大的温哥华举办了国际机器学习大会 (International Conference of Machine Learning, ICML) 。训练中心《大数据与机器智能》课程团队的研究项目成果(Performance-Oriented Query Decomposer, POQD)论文被国际机器学习大会会议(International Conference on Machine Learning, ICML)(https://icml.cc/)录用为海报论文发表Poster。
《大数据与机器智能》课程团队由来自是清华大学基础工业训练中心,清华大学信息国研中心以及北京大学计算机学院的教师组成。本项工作是由课程团队负责人陈震高级工程师与北京大学计算机学院合作完成。
该项工作在目前大语言模型LLM的领域知识增强的索增强生成(Retrieval-Augmented Generation,RAG)上,提出了面向多向量检索查询框架(Multi-Vector Retrieval, MVR)的性能优化的查询分解器POQD,实验证明POQD在基于RAG的问答系统任务上超过了现有的其它查询检索策略。

基于LLM的子查询的生成流程(由两个 LLM 组成,其中之一为提示优化器,另一个是查询分解器)

ICML会议现场海报展示
自2016年设立课程以来,课程教学团队注重人工智能业界前沿实践,不断优化课程内容,带领学生探究人工智能领域前沿的问题。自2024年以来,《大数据与机器智能》课程成为清华大学通识选修课,也是人工智能赋能教学试点建设课程。教学团队遵照学校通识课“无学科门槛,有学理深度”要求,不断重构课程教学内容。该课程同时也是教务处国际融合式课程(Global Hybrid Course),实现中英文双语授课,为来自校内不同院系的本科学生,以及来自不同国家的国际融合式课程的本科学生同时授课。
国际机器学习会议ICML是世界人工智能机器学习领域的顶级会议,在国际人工智能和机器学习中占有重要的影响力和作用,也是中国计算机学会CCF与清华大学推荐的最高类A类国际会议。该会议于2025年7月13日-7月19日在加拿大温哥华举行。
本项工作得到了清华大学教务处本科教学改革项目、清华大学实验创新基金项目和中心iTeach等双创项目的大力支持。由国家发改委双创示范基地建设项目的中心工业云提供了相关的模型算力支持。人工智能实验室为算力平台运行提供了相关支持。
论文链接:
https://icml.cc/virtual/2025/poster/44047
https://arxiv.org/abs/2505.19189
https://pku-sds-lab.github.io/POQD/