Research Explorer

Automotive Document Labeling Using Large Language Models

Dang Van Thin, Cuong Xuan Chu, Christian Graf et al.

2025 EMNLP

AutoPenBench: A Vulnerability Testing Benchmark for Generative Agents

Luca Gioacchini, Alexander Delsanto, Idilio Drago et al.

2025 EMNLP

Auto prompting without training labels: An LLM cascade for product quality assessment in e-commerce catalogs

Soham Satyadharma, Fatemeh Sheikholeslami, Swati Kaul et al.

2025 EMNLP

AutoQual: An LLM Agent for Automated Discovery of Interpretable Features for Review Quality Assessment

Xiaochong Lan, Jie Feng, Yinxing Liu et al.

2025 EMNLP

AutoSDT: Scaling Data-Driven Discovery Tasks Toward Open Co-Scientists

Yifei Li, Hanane Nour Moussa, Ziru Chen et al.

2025 EMNLP

Auto-SLURP: A Benchmark Dataset for Evaluating Multi-Agent Frameworks in Smart Personal Assistant

Lei Shen, Xiaoyu Shen

2025 EMNLP

AutoSpec: An Agentic Framework for Automatically Drafting Patent Specification

Ryan Shea, Zhou Yu

2025 EMNLP

Auto-Weighted Group Relative Preference Optimization for Multi-Objective Text Generation Tasks

Yuki Ichihara, Yuu Jinnai

2025 EMNLP

Avoidance Decoding for Diverse Multi-Branch Story Generation

Kyeongman Park, Nakyeong Yang, Kyomin Jung

2025 EMNLP

Avoiding Knowledge Edit Skipping in Multi-hop Question Answering with Guided Decomposition

Yi Liu, Xiangrong Zhu, Xiangyu Liu et al.

2025 EMNLP

A Zero-Shot Neuro-Symbolic Approach for Complex Knowledge Graph Question Answering

Prerna Agarwal, Srikanta Bedathur

2025 EMNLP

Babies Learn to Look Ahead: Multi-Token Prediction in Small LMs

Ansar Aynetdinov, Alan Akbik

2025 EMNLP

BabyLM’s First Constructions: Causal interventions provide a signal of learning

Joshua Rozner, Leonie Weissweiler, Cory Shain

2025 EMNLP

Back Attention: Understanding and Enhancing Multi-Hop Reasoning in Large Language Models

Zeping Yu, Yonatan Belinkov, Sophia Ananiadou

2025 EMNLP

Backdoor-Powered Prompt Injection Attacks Nullify Defense Methods

Yulin Chen, Haoran Li, Yuan Sui et al.

2025 EMNLP

BacktrackAgent: Enhancing GUI Agent with Error Detection and Backtracking Mechanism

Qinzhuo Wu, Pengzhi Gao, Wei Liu et al.

2025 EMNLP

BAGELS: Benchmarking the Automated Generation and Extraction of Limitations from Scholarly Text

Ibrahim Al Azher, Miftahul Jannat Mokarrama, Zhishuai Guo et al.

2025 EMNLP

Bag of Tricks for Sparse Mixture-of-Experts: A Benchmark Across Reasoning, Efficiency, and Safety

Mufan Qiu, Zheyu Shen, Pingzhi Li et al.

2025 EMNLP

Balanced Multi-Factor In-Context Learning for Multilingual Large Language Models

Masahiro Kaneko, Alham Fikri Aji, Timothy Baldwin

2025 EMNLP

Balancing Quality and Variation: Spam Filtering Distorts Data Label Distributions

Eve Fleisig, Matthias Orlikowski, Philipp Cimiano et al.

2025 EMNLP

Balcony: A Lightweight Approach to Dynamic Inference of Generative Language Models

Benyamin Jamialahmadi, Parsa Kavehzadeh, Mehdi Rezagholizadeh et al.

2025 EMNLP

BALSAM: A Platform for Benchmarking Arabic Large Language Models

Rawan Nasser Almatham, Kareem Mohamed Darwish, Raghad Al-Rasheed et al.

2025 EMNLP

BanglaByT5: Byte-Level Modelling for Bangla

Pramit Bhattacharyya, Arnab Bhattacharya

2025 EMNLP

BanglaMATH : A Bangla benchmark dataset for testing LLM mathematical reasoning at grades 6, 7, and 8

Tabia Tanzin Prama, Christopher M. Danforth, Peter Dodds

2025 EMNLP

Banking Done Right: Redefining Retail Banking with Language-Centric AI

Xin Jie Chua, Jeraelyn Ming Li Tan, Jia Xuan Tan et al.

2025 EMNLP

Papers