史景喆

你好!我是史景喆(Jingzhe Shi),就读于清华大学交叉信息研究院(即姚班,由图灵奖得主Andrew Chi-Chih Yao院士创办),主修计算机科学与技术。我即将前往普林斯顿大学攻读博士学位。

近期,我有幸得到许多优秀学者的指导与合作。目前我在普林斯顿大学有幸接受Mengdi Wang教授和Sanfeng Wu教授的指导,与斯坦福大学James Zou教授以及清华大学Hang Zhao教授合作,研究方向涉及大语言模型智能体(LLM Agent)、大语言模型推理、LLM4Science、Scaling Laws及其解释等。

我很幸运能与高中及大学同班同学Qinwei Ma长期合作。此前,我曾有幸与Xiaolong Wang教授以及现于华盛顿大学从事博士后研究的Lei Li博士合作。

我热爱物理,并曾参与物理奥林匹克竞赛。我在第51届国际物理奥林匹克竞赛(IPhO 2021)中获得金牌,全球排名第10;并于2022年受邀担任IPhO的线上阅卷员。

📬 邮箱  |  🎓 Google Scholar  |  💻 Github  |  [Aa] English Homepage

profile photo

代表性论文与预印本(按时间排序)

(* 表示共同一作,^ 表示共同通讯作者)
PontTuset Oblivionis: Intrinsic Entropy of Context Length Scaling in LLMs
史景喆 (Jingzhe Shi)*, Qinwei Ma*, Hongyi Liu*, Hang Zhao^, Jeng-Neng Hwang, Lei Li^

ICLR 2026 Oral
代码 / arXiv

  • 我们从内蕴空间(Intrinsic Space)的视角解释大语言模型的上下文长度Scaling,相关理论假设与推导通过自然语言数据集和合成数据集上的实验得到了验证。
  • 我们发现Intrinsic Entropy——一个从大语言模型中间状态测得的指标——与下一个token的预测损失呈线性关系。这可能是一个值得深入探索的有趣现象,并潜在地暗示了稀疏表示的有效性。
  • PontTuset PRISM-Physics: Causal DAG-Based Process Evaluation for Physics Reasoning
    Wanjia Zhao*, Qinwei Ma*, 史景喆 (Jingzhe Shi)*, Shirley Wu, Jiaqi Han, Yijia Xiao, Si-Yuan Chen, Xiao Luo, Ludwig Schmidt, James Zou

    ICLR 2026
    项目主页 / arXiv

  • 我们提出了PRISM-Physics——一个物理奥林匹克问题数据集,配套基于DAG的评分策略和基于规则的方程等价比较方法,可以对大语言模型的物理推理能力进行细粒度、过程导向的评估。
  • 该评分框架与方法被设计为可推广至其他涉及数学推理过程的数据集。
  • PontTuset Physics Supernova: AI Agent Matches Elite Gold Medalists at IPhO 2025
    Jiahao Qiu*, 史景喆 (Jingzhe Shi)*, Xinzhe Juan, Zelin Zhao, Jiayi Geng, Shilong Liu, Hongru Wang, Sanfeng Wu, Mengdi Wang

    NeurIPS 2025 LLM Eval Workshop (Oral), NeurIPS 2025 LAW Workshop
    代码 / arXiv

  • 我们提出了一个用于求解国际物理奥林匹克问题的智能体框架。
  • 我们在IPhO 2025理论题上进行了实验,验证了智能体方法的有效性。
  • PontTuset Scaling Law for Time Series Forecasting
    史景喆 (Jingzhe Shi)*, Qinwei Ma*, Huan Ma, Lei Li

    NeurIPS 2024
    代码 / arXiv / OpenReview

  • 我们针对时间序列预测提出了一个考虑回看窗口(look back horizon)、数据集规模和模型规模的Scaling Law理论框架。
  • 我们通过实验验证了所提理论和假设。
  • 核心结论是:存在最优的回看窗口,且其随数据集规模增大而增大。这呼吁在评测新的时间序列预测模型时采用更公平的比较方式。
  • PontTuset CHOPS: CHat with custOmer Profile Systems for Customer Service with LLMs
    史景喆 (Jingzhe Shi), Jialuo Li, Qinwei Ma, Zaiwen Yang, Huan Ma, Lei Li

    COLM 2024
    代码 / arXiv / OpenReview

  • 我们提出了CHOPS——一个大语言模型智能体,能够高效地访问用户信息、与现有系统交互,并通过结合小型与大型LLM提供准确、安全的回答。CHOPS展示了其增强甚至替代人工客服的潜力。
  • PontTuset Large Trajectory Models are Scalable Motion Predictors and Planners
    Qiao Sun, Shiduo Zhang, Danjiao Ma, 史景喆 (Jingzhe Shi), Derun Li, Simian Luo, Yu Wang, Ningyi Xu, Guangzhi Cao, Hang Zhao

    arXiv 2023
    代码 / arXiv

  • 我们将NLP中成功的骨干网络应用于轨迹预测,在多种数据集上展示了良好的可扩展性,并在Nuplan数据集上取得了当时的SOTA性能。
  • 我负责解码器部分,使用DDPM在关键点空间(Key Point Space)中生成轨迹,以建模未来轨迹的多模态分布。

  • 工作经历


    Optiver
    2024.07 - 2024.08
    Quant Trading Intern, Optiver 上海办公室
  • Optiver是一家总部位于荷兰的全球领先做市商公司,在全球主要金融中心设有办公室。

  • 荣誉与奖项

  • 2021年:第51届国际物理奥林匹克竞赛(IPhO 2021)金牌,在来自约70个国家和地区的360余名选手中全球排名第10。
  • 语言与技能

  • 语言:中文(母语)、英语(TOEFL 113;R30,L28,S26,W29;2024年11月)。
  • 编程语言:Python、C/C++ 等。
  • 工具:Git、LaTeX、SQL 等。

  • 本主页基于 Jon Barron 的主页模板设计,部署于 GitHub Pages。最后更新:2026年5月。
    © 2026 史景喆