您所在的位置:首页 - 科研项目 - 荣誉奖项

荣誉奖项

CIKM2023 Best Resource Paper Honorable Mention

清华大学法学院计算法学课题组与清华大学计算机系研究成果 MUSER: A Multi-View Similar Case Retrieval Dataset 于北京时间2023年10月25日获得信息检索与知识挖掘领域顶级会议CIKM2023颁发的Best Resource Paper Honorable Mention. CIKM2023全称为信息与知识管理国际会议(Conference on Information and Knowledge Management) ,该会议共颁出3篇Best Resource Paper 奖项,我们的工作为其中之一(about 3%)。

文章共同第一作者胡伊然在颁奖现场

从右至左:李庆泉、胡伊然、姚峰

文章详情

标题:MUSER: A Multi-View Similar Case Retrieval Dataset

作者:李庆泉* 胡伊然* 姚峰 肖朝军 刘知远 孙茂松 申卫星

(*共同一作 作者顺序随机排列)

其中,李庆泉、姚峰为清华大学计算法学课题组2020级硕士研究生,胡伊然为清华大学计算法学课题组2021级硕士研究生

该论文为科技部重点研发“热点案件与民生案件审判智能辅助技术研究”项目产出。

摘要:

类案检索(SCR)是具有代表性的法律人工智能应用,在促进司法公正方面发挥着关键作用。然而,现有的SCR数据集在判断法律案件之间的相似性时仅关注事实描述部分,而忽略了其他有价值的部分(例如争议焦点部分)。此外,案件相似度通常仅通过事实描述的文本语义来衡量,这可能无法从法律知识的角度捕捉法律案件的全部复杂性。在这项工作中,我们提出了 MUSER,一个基于多维度相似度测量和综合法律要素知识的相似案件检索数据集。具体来说,我们选择三个视角(法律事实、争议焦点和法律法规),并为每个视角构建全面、结构化的法律要素标签体系,以实现对案件相似性的准确且涵盖知识性的评估。该数据集全部案件源自中国民事案件,包含 100 个查询案例和 4,024 个可指定案例。我们实现了多种用于法律要素预测的文本分类算法以及用于在 MUSER 上检索类似案例的各种检索方法。实验结果表明,纳入法律元素标签可以有利于 SCR 模型的性能,但仍需要进一步努力来解决 MUSER 提出的剩余挑战。源代码和数据集发布于 https://github.com/THUlawtech/MUSER。

文章作者胡伊然在CIKM现场进行文章汇报