东北大学信息检索实验室

Jekyll2026-02-06T10:47:42+00:00https://neuir.github.io/feed.xml东北大学信息检索实验室东北大学信息检索实验室隶属东北大学计算机科学与工程学院计算机科学系，由刘正皓副教授、于戈教授和谷峪教授共同指导，致力于信息检索与大语言模型相关研究，承担多项国家级、省部级项目，在 NeurIPS、ICLR、ACL、EMNLP、NAACL、SIGIR、KDD、WebConf、ICASSP 等国际国内顶级会议及期刊发表 60 余篇论文。课题组曾在 TREC-COVID 文档级检索比赛中获第一名；联合研发的 MiniCPM 检索增强生成组件在 MTEB 榜单中文检索效果排名第一；开源的 UltraRAG 工具获超 5k 个星标。We have one paper accepted by KDD 20262025-11-24T00:00:00+00:002026-02-06T10:46:48+00:00https://neuir.github.io/2025/11/24/postWe have one paper accepted by KDD 2026: The 32nd SIGKDD Conference on Knowledge Discovery and Data Mining

International Convention Center Jeju (ICC Jeju), August 9-13, 2026, Jeju, Korea

LISRec: Modeling User Preferences with Learned Item Shortcuts for Sequential Recommendation

LISRec: Modeling User Preferences with Learned Item Shortcuts for Sequential Recommendation

Haidong Xin, Zhenghao Liu, Sen Mei, Yukun Yan, Shi Yu, Shuo Wang, Zulong Chen, Yu Gu, Ge Yu, Chenyan Xiong

Proceedings of KDD · 2026CCF-A

]]>

We have two papers accepted by NeurIPS 20252025-09-18T00:00:00+00:002026-02-06T10:46:48+00:00https://neuir.github.io/2025/09/18/postWe have two papers accepted by NeurIPS 2025: The Thirty-Ninth Annual Conference on Neural Information Processing Systems

San Diego Convention Center, Dec. 2-7, US & Mexico City, Nov. 30-Dec. 5, Mexico

A*-Thought: Efficient Reasoning via Bidirectional Compression for Low-Resource Settings

A*-Thought: Efficient Reasoning via Bidirectional Compression for Low-Resource Settings

Xiaoang Xu, Shuo Wang, Xu Han, Zhenghao Liu, Huijia Wu, Peipei Li, Zhiyuan Liu, Maosong Sun, Zhaofeng He

Proceedings of NeurIPS · 2025CCF-A

ParamMute: Suppressing Knowledge-Critical FFNs for Faithful Retrieval-Augmented Generation

ParamMute: Suppressing Knowledge-Critical FFNs for Faithful Retrieval-Augmented Generation

Pengcheng Huang, Zhenghao Liu, , Yukun Yan, Haiyan Zhao, Xiaoyuan Yi, Hao Chen, Zhiyuan Liu, Maosong Sun, Tong Xiao, Ge Yu, Chenyan Xiong

Proceedings of NeurIPS · 2025CCF-A

]]>

We have six papers accepted by EMNLP 20252025-08-20T00:00:00+00:002026-02-06T10:46:48+00:00https://neuir.github.io/2025/08/20/postWe have six papers accepted by EMNLP 2025: The 2025 Conference on Empirical Methods in Natural Language Processing

Suzhou, China

November 5-9, 2025

ExpandR: Teaching Dense Retrievers Beyond Queries with LLM Guidance

ExpandR: Teaching Dense Retrievers Beyond Queries with LLM Guidance

Sijia Yao, Pengcheng Huang, Zhenghao Liu, Yu Gu, Yukun Yan, Shi Yu, Ge Yu

Proceedings of EMNLP · 2025CCF-B

DeepNote: Note-Centric Deep Retrieval-Augmented Generation

DeepNote: Note-Centric Deep Retrieval-Augmented Generation

Ruobing Wang, Qingfei Zhao, Yukun Yan, Daren Zha, Yuxuan Chen, Shi Yu, Zhenghao Liu, Yixuan Wang, Shuo Wang, Xu Han, Zhiyuan Liu, Maosong Sun

Proceedings of EMNLP (Findings) · 2025CCF-B

KBAlign: Efficient Self Adaptation on Specific Knowledge Bases

KBAlign: Efficient Self Adaptation on Specific Knowledge Bases

Zheni Zeng, Yuxuan Chen, Shi Yu, Ruobing Wang, Yukun Yan, Zhenghao Liu, Shuo Wang, Xu Han, Zhiyuan Liu, Maosong Sun

Proceedings of EMNLP (Findings) · 2025CCF-B

PersLLM: A Personified Training Approach for Large Language Models

PersLLM: A Personified Training Approach for Large Language Models

Zheni Zeng, Jiayi Chen, Huimin Chen, Yukun Yan, Yuxuan Chen, Zhenghao Liu, Zhiyuan Liu, Maosong Sun

Proceedings of EMNLP (Findings) · 2025CCF-B

ClueAnchor: Clue-Anchored Knowledge Reasoning Exploration and Optimization for Retrieval-Augmented Generation

ClueAnchor: Clue-Anchored Knowledge Reasoning Exploration and Optimization for Retrieval-Augmented Generation

Hao Chen, Yukun Yan, Sen Mei, Wanxiang Che, Zhenghao Liu, Qi Shi, Xinze Li, Yuchun Fan, Pengcheng Huang, Qiushi Xiong, Zhiyuan Liu, Maosong Sun

Proceedings of EMNLP (Findings) · 2025CCF-B

ReCUT: Balancing Reasoning Length and Accuracy in LLMs via Stepwise Trails and Preference Optimization

ReCUT: Balancing Reasoning Length and Accuracy in LLMs via Stepwise Trails and Preference Optimization

Zhensheng Jin, Xinze Li, Yifan Ji, Chunyi Peng, Zhenghao Liu, Qi Shi, Yukun Yan, Shuo Wang, Furong Peng, Ge Yu

Proceedings of EMNLP (Findings) · 2025CCF-B

]]>

热烈祝贺东北大学信息检索实验室2025届本科、硕士研究生顺利毕业2025-06-19T00:00:00+00:002026-02-06T10:46:48+00:00https://neuir.github.io/2025/06/19/post热烈祝贺东北大学信息检索实验室2025届本科、硕士研究生顺利毕业！

祝各位同学前程似锦，在未来的学术道路或职业征程中乘风破浪，以实验室所学的专业知识为帆，在信息检索与科技发展的浪潮中勇立潮头。

毕业不是终点，而是新篇的起点，祝各位同学此去经年，所遇皆坦途，所行皆璀璨！

左起：导师刘正皓（副教授）、李欣泽（硕士）

左起：张馨艺（本科）、导师刘正皓（副教授）、戴鑫（本科）

左起：周天硕（硕士）、导师刘正皓（副教授）、姚思佳（硕士）

左起：黄鹏程（硕士）、导师刘正皓（副教授）、姚思佳（硕士）

]]>

We have three papers accepted by ACL 20252025-05-15T00:00:00+00:002026-02-06T10:46:48+00:00https://neuir.github.io/2025/05/15/postWe have three papers accepted by ACL 2025: The 63rd Annual Meeting of the Association for Computational Linguistics

Vienna, Austria

July 27–August 1st, 2025

RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework

RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework

Kunlun Zhu, Yifan Luo, Dingling Xu, Yukun Yan, Zhenghao Liu, Shi Yu, Ruobing Wang, , Shuo Wang, Yishan Li, Nan Zhang, Xu Han, Zhiyuan Liu, Maosong Sun

Proceedings of ACL · 2025CCF-A

Rankcot: Refining knowledge for retrieval-augmented generation through ranking chain-of-thoughts

Rankcot: Refining knowledge for retrieval-augmented generation through ranking chain-of-thoughts

Mingyan Wu, Zhenghao Liu, Yukun Yan, Xinze Li, Shi Yu, Zheni Zeng, Yu Gu, Ge Yu

Proceedings of ACL · 2025CCF-A

Judge as A Judge: Improving the Evaluation of Retrieval-Augmented Generation through the Judge-Consistency of Large Language Models

Judge as A Judge: Improving the Evaluation of Retrieval-Augmented Generation through the Judge-Consistency of Large Language Models

Shuliang Liu, Xinze Li, Zhenghao Liu, Yukun Yan, Cheng Yang, Zheni Zeng, Zhiyuan Liu, Maosong Sun, Ge Yu

Proceedings of ACL (Findings) · 2025CCF-A

]]>

We have one paper accepted by SIGIR 20252025-04-04T00:00:00+00:002026-02-06T10:46:48+00:00https://neuir.github.io/2025/04/04/postWe have one paper accepted by SIGIR 2025: The 48th International ACM SIGIR Conference on Research and Development in Information Retrieval

Padova, Italy

July 13–17, 2025

Enhancing the Patent Matching Capability of Large Language Models via the Memory Graph

Qiushi Xiong, Zhipeng Xu, Zhenghao Liu, Mengjia Wang, Zulong Chen, Yue Sun, Yu Gu, Xiaohua Li, Ge Yu

Proceedings of SIGIR · 2025CCF-A

]]>

We have three papers accepted by ICLR 20252025-01-22T00:00:00+00:002026-02-06T10:46:48+00:00https://neuir.github.io/2025/01/22/postWe have three papers accepted by ICLR 2025: The Thirteenth International Conference on Learning Representations

Singapore EXPO-1 Expo Drive, Singapore.

Apr 24–28, 2025

Advancing llm reasoning generalists with preference trees

Lifan Yuan, Ganqu Cui, Hanbin Wang, Ning Ding, Xingyao Wang, Jia Deng, Boji Shan, Huimin Chen, Ruobing Xie, Yankai Lin, Zhenghao Liu, Bowen Zhou, Hao Peng, Zhiyuan Liu, Maosong Sun

Proceedings of ICLR · 2025CCF-Expanded

VisRAG: Vision-based retrieval-augmented generation on multi-modality documents

Shi Yu, Chaoyue Tang, Bokai Xu, Junbo Cui, Junhao Ran, Yukun Yan, Zhenghao Liu, Shuo Wang, Xu Han, Zhiyuan Liu, Maosong Sun

Proceedings of ICLR · 2025CCF-Expanded

RAG-DDR: Optimizing Retrieval-Augmented Generation Using Differentiable Data Rewards

Xinze Li, Sen Mei, Zhenghao Liu, Yukun Yan, Shuo Wang, Shi Yu, Zheni Zeng, Hao Chen, Ge Yu, Zhiyuan Liu, Maosong Sun, Chenyan Xiong

Proceedings of ICLR · 2025CCF-Expanded

]]>

We have five papers accepted by ACL 20242024-05-15T00:00:00+00:002026-02-06T10:46:48+00:00https://neuir.github.io/2024/05/15/postWe have five papers accepted by ACL 2024: The 62nd Annual Meeting of the Association for Computational Linguistics

Bangkok, Thailand

August 11–16, 2024

MARVEL: Unlocking the Multi-Modal Capability of Dense Retrieval via Visual Module Plugin

MARVEL: Unlocking the Multi-Modal Capability of Dense Retrieval via Visual Module Plugin

Tianshuo Zhou, Sen Mei, Xinze Li, Zhenghao Liu, Chenyan Xiong, Zhiyuan Liu, Yu Gu, Ge Yu

Proceedings of ACL · 2024CCF-A

UltraLink: An Open-Source Knowledge-Enhanced Multilingual Supervised Fine-tuning Dataset

UltraLink: An Open-Source Knowledge-Enhanced Multilingual Supervised Fine-tuning Dataset

Haoyu Wang, Shuo Wang, Yukun Yan, Xujia Wang, Zhiyu Yang, Yuzhuang Xu, Zhenghao Liu, Ning Ding, Xu Han, Zhiyuan Liu, Maosong Sun

Proceedings of ACL · 2024CCF-A

Cleaner Pretraining Corpus Curation with Neural Web Scraping

Cleaner Pretraining Corpus Curation with Neural Web Scraping

Zhipeng Xu, Zhenghao Liu, Yukun Yan, Zhiyuan Liu, Chenyan Xiong, Ge Yu

Proceedings of ACL · 2024CCF-A

MatPlotAgent: Method and Evaluation for LLM-Based Agentic Scientific Data Visualization

MatPlotAgent: Method and Evaluation for LLM-Based Agentic Scientific Data Visualization

Zhiyu Yang, Zihan Zhou, Shuo Wang, Xin Cong, Xu Han, Yukun Yan, Zhenghao Liu, Zhixing Tan, Pengyuan Liu, Dong Yu, Zhiyuan Liu, Xiaodong Shi, Maosong Sun

Proceedings of ACL (Findings) · 2024CCF-A

INTERVENOR: Prompting the Coding Ability of Large Language Models with the Interactive Chain of Repair

INTERVENOR: Prompting the Coding Ability of Large Language Models with the Interactive Chain of Repair

Hanbin Wang, Zhenghao Liu, Shuo Wang, Ganqu Cui, Ning Ding, Zhiyuan Liu, Ge Yu

Proceedings of ACL (Findings) · 2024CCF-A

]]>