代表性论文与预印本(按时间排序)
(* 表示共同一作,^ 表示共同通讯作者)
|
Oblivionis: Intrinsic Entropy of Context Length Scaling in LLMs
史景喆 (Jingzhe Shi)*,
Qinwei Ma*,
Hongyi Liu*,
Hang Zhao^,
Jeng-Neng Hwang,
Lei Li^
ICLR 2026 Oral
代码
/
arXiv
我们从内蕴空间(Intrinsic Space)的视角解释大语言模型的上下文长度Scaling,相关理论假设与推导通过自然语言数据集和合成数据集上的实验得到了验证。
我们发现Intrinsic Entropy——一个从大语言模型中间状态测得的指标——与下一个token的预测损失呈线性关系。这可能是一个值得深入探索的有趣现象,并潜在地暗示了稀疏表示的有效性。
|
|
PRISM-Physics: Causal DAG-Based Process Evaluation for Physics Reasoning
Wanjia Zhao*,
Qinwei Ma*,
史景喆 (Jingzhe Shi)*,
Shirley Wu,
Jiaqi Han,
Yijia Xiao,
Si-Yuan Chen,
Xiao Luo,
Ludwig Schmidt,
James Zou
ICLR 2026
项目主页
/
arXiv
我们提出了PRISM-Physics——一个物理奥林匹克问题数据集,配套基于DAG的评分策略和基于规则的方程等价比较方法,可以对大语言模型的物理推理能力进行细粒度、过程导向的评估。
该评分框架与方法被设计为可推广至其他涉及数学推理过程的数据集。
|
|
Physics Supernova: AI Agent Matches Elite Gold Medalists at IPhO 2025
Jiahao Qiu*,
史景喆 (Jingzhe Shi)*,
Xinzhe Juan,
Zelin Zhao,
Jiayi Geng,
Shilong Liu,
Hongru Wang,
Sanfeng Wu,
Mengdi Wang
NeurIPS 2025 LLM Eval Workshop (Oral), NeurIPS 2025 LAW Workshop
代码
/
arXiv
我们提出了一个用于求解国际物理奥林匹克问题的智能体框架。
我们在IPhO 2025理论题上进行了实验,验证了智能体方法的有效性。
|
|
Scaling Law for Time Series Forecasting
史景喆 (Jingzhe Shi)*,
Qinwei Ma*,
Huan Ma,
Lei Li
NeurIPS 2024
代码
/
arXiv
/
OpenReview
我们针对时间序列预测提出了一个考虑回看窗口(look back horizon)、数据集规模和模型规模的Scaling Law理论框架。
我们通过实验验证了所提理论和假设。
核心结论是:存在最优的回看窗口,且其随数据集规模增大而增大。这呼吁在评测新的时间序列预测模型时采用更公平的比较方式。
|
|
CHOPS: CHat with custOmer Profile Systems for Customer Service with LLMs
史景喆 (Jingzhe Shi),
Jialuo Li,
Qinwei Ma,
Zaiwen Yang,
Huan Ma,
Lei Li
COLM 2024
代码
/
arXiv
/
OpenReview
我们提出了CHOPS——一个大语言模型智能体,能够高效地访问用户信息、与现有系统交互,并通过结合小型与大型LLM提供准确、安全的回答。CHOPS展示了其增强甚至替代人工客服的潜力。
|
|
Large Trajectory Models are Scalable Motion Predictors and Planners
Qiao Sun,
Shiduo Zhang,
Danjiao Ma,
史景喆 (Jingzhe Shi),
Derun Li,
Simian Luo,
Yu Wang,
Ningyi Xu,
Guangzhi Cao,
Hang Zhao
arXiv 2023
代码
/
arXiv
我们将NLP中成功的骨干网络应用于轨迹预测,在多种数据集上展示了良好的可扩展性,并在Nuplan数据集上取得了当时的SOTA性能。
我负责解码器部分,使用DDPM在关键点空间(Key Point Space)中生成轨迹,以建模未来轨迹的多模态分布。
|
工作经历
 |
Optiver
2024.07 - 2024.08
Quant Trading Intern, Optiver 上海办公室
Optiver是一家总部位于荷兰的全球领先做市商公司,在全球主要金融中心设有办公室。
|
荣誉与奖项
|
2021年:第51届国际物理奥林匹克竞赛(IPhO 2021)金牌,在来自约70个国家和地区的360余名选手中全球排名第10。
|
语言与技能
|
语言:中文(母语)、英语(TOEFL 113;R30,L28,S26,W29;2024年11月)。
编程语言:Python、C/C++ 等。
工具:Git、LaTeX、SQL 等。
|
|